Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Podobne dokumenty
Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Centralne twierdzenie graniczne

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych.

Rozkłady dwóch zmiennych losowych

Wykład 3 Jednowymiarowe zmienne losowe

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Ważne rozkłady i twierdzenia c.d.

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

1 Zmienne losowe wielowymiarowe.

PDF created with FinePrint pdffactory Pro trial version

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

Testowanie hipotez statystycznych.

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Rozkłady łaczne wielu zmiennych losowych

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Statystyczna analiza danych

Prawdopodobieństwo i statystyka

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Stosowana Analiza Regresji

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

STATYSTYKA MATEMATYCZNA

Wykład 12 Testowanie hipotez dla współczynnika korelacji

STATYSTYKA MATEMATYCZNA

Szkice do zajęć z Przedmiotu Wyrównawczego

Rachunek prawdopodobieństwa Rozdział 4. Zmienne losowe

12DRAP - parametry rozkładów wielowymiarowych

Rozkłady prawdopodobieństwa zmiennych losowych

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Rozkłady statystyk z próby

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Testowanie hipotez statystycznych.

1.1 Wstęp Literatura... 1

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka, Ekonometria

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe.

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

STATYSTYKA MATEMATYCZNA

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wartość oczekiwana Mediana i dominanta Wariancja Nierówności związane z momentami. Momenty zmiennych losowych Momenty wektorów losowych

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Estymacja parametrów rozkładu cechy

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

Ćwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu.

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Metody probabilistyczne

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA MATEMATYCZNA

Estymacja parametrów w modelu normalnym

Wykłady 14 i 15. Zmienne losowe typu ciągłego

Metody systemowe i decyzyjne w informatyce

KORELACJE I REGRESJA LINIOWA

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009

STATYSTYKA MATEMATYCZNA

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Prawdopodobieństwo i statystyka

Metody systemowe i decyzyjne w informatyce

1 Podstawy rachunku prawdopodobieństwa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Wprowadzenie do analizy korelacji i regresji

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

Metody systemowe i decyzyjne w informatyce

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Statystyka matematyczna

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Metody Rozmyte i Algorytmy Ewolucyjne

Dyskretne zmienne losowe

Statystyka w analizie i planowaniu eksperymentu

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Wykład 7 Testowanie zgodności z rozkładem normalnym

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

Transkrypt:

Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009

Spis treści Spis treści 1

Wstęp Bardzo często interesujący jest łączny probabilistyczny rozkład kilku zmiennych losowych. Tu ograniczymy się do przypadku tylko dwóch zmiennych losowych, ale łatwo zauważyć, że wszystkie ogólne rozważania na temat pary zmiennych losowych mają swoje naturalne i proste uogólnienia na przypadek ich większej liczby.

Prawdopodobieństwo łączne X, Y dwie dyskretne zmienne losowe określone na tej samej przestrzeni zdarzeń elementarnych. Ich łączny rozkład jest dany funkcją prawdopodobieństwa łącznego f (x, y) = P(X = x, Y = y) określającą prawdopodobieństwo jednoczesnego przyjęcia przez zmienną losową X wartości x i przez zmienną losową Y wartości y. Funkcja prawdopodobieństwa ma następujące własności: 1 f (x, y) 0 dla wszystkich (x, y) 2 f (x, y) = 1 x y 3 P((X, Y ) A) = (x,y) A f (x, y)

Prawdopodobieństwo łączne Przykład Funkcja prawdopodobieństwa łącznego dana jest wzorem 1 (x + y) dla x = 0, 1, 2 oraz y = 0, 1, 2, 3 P(X = x, Y = y) = f (x, y) = 30 0 w innym przypadku Tablica kondyngencji Y X 0 1 2 3 0 0 1/30 1/15 1/10 1 1/30 1/15 1/10 2/15 2 1/15 1/10 2/15 1/6 czyli np. P(X = 2, Y = 0) = f (2, 0) = 1 30 (2 + 0) = 1 15

Prawdopodobieństwo łączne Dystrybuantą łączną dyskretnych zmiennych losowych X i Y nazywamy funkcję F (x, y) = P(X x, Y y) = f (s, t) s x t y Dystrybuantą łączną ciągłych zmiennych losowych X i Y nazywamy funkcję F (x, y) = P(X x, Y y) = x y f (s, t)ds dt

Rozkład brzegowy Rozkład brzegowy interesuje nas tylko rozkład jednej zmiennej Zmienna dyskretna g(x) = y f (x, y) h(y) = x f (x, y) Zmienna ciągła g(x) = f (x, y)dy h(y) = f (x, y)dx

Rozkład brzegowy Przykład c.d. Rozkład brzegowy zmiennej losowej X jest dany funkcją prawdopodobieństwa g(x) = P(X = x) = 3 f (x, y) = 1 30 y=0 3 (x + y) = 1 (2x + 3) 0 15 y=0 Rozkład brzegowy zmiennej losowej Y jest dany funkcją prawdopodobieństwa h(y) = P(Y = y) = 2 x=0 f (x, y) = 1 (y + 1) 0 10

Rozkład brzegowy Przykład c.d. Tablica kondyngencji Y X 0 1 2 3 0 0 1/30 1/15 1/10 1/5 1 1/30 1/15 1/10 2/15 1/3 2 1/15 1/10 2/15 1/6 7/15

Rozkład warunkowy Rozkład warunkowy zmiennej losowej X pod warunkiem, że zmienna losowa Y przyjęła wartość y, czyli że Y = yg, jest dany funkcją f (x, y) f (x y) = h(y)

Rozkład warunkowy Przykład c.d. 1 30 (x + y) x + y = dla x = 0, 1, 2 1 f (x y) = 10 (y + 1) 3(y + 1) 0 w innym przypadku Dla Y = 2 f (x 2) = P(X = x Y = 2) = x + 2 9, dla x = 0, 1, 2 0 P(X = 0 Y = 2) = 2 9, P(X = 1 Y = 2) = 1 3, P(X = 2 Y = 2) = 4 9

Zmienne niezależne Dwie zmienne losowe X i Y o łącznym rozkładzie f (, ) nazywamy niezależnymi wtedy i tylko wtedy, gdy dla wszystkich par uporządkowanych (x, y) z zakresu wartości zmiennej losowej X oraz zmiennej losowej Y f (x, y) = g(x) h(y) Przykład zależnych zmiennych losowych { 8xy dla 0 < x < y < 1 f (x, y) = 0 w innym przypadku

Wartość oczekiwana p(x, Y ) ustalona (rzeczywista) funkcję zmiennych losowych X i Y o łącznym rozkładzie f (x, y). Wartością oczekiwaną zmiennej losowej p(x, Y ) nazywamy wielkość x y p(x, y)f (x, y), gdy X, Y dyskretne µ p(x,y ) E[p(X, Y )] = p(x, y)f (x, y)dx dy, gdy X, Y ciągłe

Wartość oczekiwana Zastosowanie Każdy z momentów pojedynczej zmiennej losowej, powiedzmy zmiennej X, może być przedstawiony jako wartość oczekiwana odpowiedniej funkcji p(x, Y ). Chcąc na przykład otrzymać wartość oczekiwaną zmiennej losowej X wystarczy za funkcję p(x, Y ) przyjąć funkcję p(x, Y ) = X : µ X E(X ) = x y xf (x, y) = x xg(x), gdy X, Y dyskretne xf (x, y)dx dy = xg(x)dx, gdy X, Y ciągłe

Wskaźniki rozproszenia Wariancja w próbie przypomnienie s 2 = 1 n (x i x) 2 (1) n 1 x średnia w próbie. Odchylenie standardowe i=1 s = s 2 (2)

Kowariancja X i Y zmienne losowe o łącznym rozkładzie f (, ), Kowariancją zmiennych X i Y nazywamy wielkość: x y (x µ X )(y µ Y )f (x, y), X, Y dyskretne σ XY = E[(X µ X )(Y µ Y )] = (x µ X )(y µ Y )f (x, y)dx dy, X, Y ciągłe µ X, µ Y odpowiednio średnia wartość (oczekiwana) zmiennej X i zmiennej Y. Inne oznaczenie σ XY to Conv(X, Y ). Zauważmy, że σ XX = σ 2 X.

Kowariancja Kowariancja zmiennych X i Y jest dodatnia jeżeli dużym wartościom zmiennej X (czyli większym od wartości średniej µ X ) towarzyszą zwykle duże wartości zmiennej Y (większe od µ Y ) i... jeżeli małym wartościom zmiennej X towarzyszą zwykle małe wartości zmiennej Y (mniejsze od wartości średniej µ X i µ Y odpowiednio) Kowariancja zmiennych X i Y jest ujemna jeżeli wartościom zmiennej X większym od µ X towarzyszą zwykle wartości zmiennej Y mniejsze od µ Y jeżeli wartościom zmiennej X mniejszym od µ X towarzyszą zwykle wartości zmiennej Y większe od µ Y

Kowariancja Kowariancja umożliwia zatem skonstruowanie wskaźnika mówiącego o istnieniu (lub nieistnieniu) zależności dodatniej lub ujemnej między zmiennymi losowymi. Przydatne zależności Cov(X, Y ) = E(XY ) µ X µ Y Jeśli zmienne losowe X, Y są niezależne, to Cov(X, Y ) = 0 Var(aX + by ) = a 2 Var(X ) + b 2 Var(Y ) + 2abCov(X, Y ) gdzie a, b stałe Wniosek: jeśli zmienne losowe X i Y są niezależne, to Var(aX + by ) = a 2 Var(X ) + b 2 Var(Y )

Współczynnik korelacji ρ Właściwości: 1 ρ 1 ρ = Cov(X, Y ) Var(X ) Var(Y ) ρ = 1 jeżeli Y = a + bx, b > 0, a, b stałe ρ = 1 jeżeli Y = a + bx, < 0, a, b stałe ρ = 0 jeżeli zmienne losowe X i Y są niezależne

Współczynnik korelacji ρ Rys. 1: Gęstość dwuwymiarowego rozkładu normalnego N(0, 0, 1, 1, 0) oraz warstwice i przykładowa próba losowa

Współczynnik korelacji ρ Rys. 2: Gęstości dwuwymiarowego rozkładu normalnego oraz warstwice i przykładowe próby losowe dla różnych wartości współczynnika korelacji r

Współczynnik korelacji ρ Przykład: dwuwymiarowy rozkład normalny N(µ X, µ Y, σ X, σ Y, ρ), dany łączną gęstością f (x, y) = e q/2 2πσ X σ Y 1 ρ 2 < x, y <, σ X, σ Y > 0, 1 < ρ < 1 q = 1 1 ρ 2 [ ( x m X ) 2 2ρ( x m X )( y m Y ) + ( y m Y ) 2 σ X σ X σ Y σ Y ]

Dwuwymiarowy rozkład normalny 1. X i Y ma dwuwymiarowy rozkład normalny wtedy i tylko wtedy, gdy każda kombinacja liniowa tych zmiennych, ax + by, gdzie a i b dowolne stałe, ma rozkład normalny. 2. Zmienne losowe X i Y są niezależne wtedy i tylko wtedy, gdy ich współczynnik korelacjirhi jest równy 0. 3. Jeśli X i Y są niezależne i mają rozkłady normalne odpowiednio N(µ 1, σ 1 ) i N(µ 2, σ 2 ), to dla dowolnych liczb a i b, nie będących równocześnie równe 0, ax + by ma rozkład normalny N(µ, σ), gdzie µ = aµ 1 + bµ 2 i σ = a 2 σ1 2 + b2 σ2 2.

Współczynnik korelacji próbkowej Wprowadzimy obecnie pojęcie współczynnika korelacji próbkowej będącego estymatorem współczynnika korelacji. Jego wartość obliczona dla konkretnych wartości próby ułatwia w wielu przypadkach określenie siły zależności. Współczynnik korelacji zmiennych losowych X i Y został zdefiniowany jako wartość średnia standaryzowanych zmiennych (X µ X )/σ X i (Y µ Y )/σ Y. Współczynnik korelacji próbkowej jest odpowiednikiem tej definicji dla próby (X 1, Y 1 ),..., (X n, Y n ). r = 1 n 1 n ( ) ( ) Xi X Yi Ȳ i=1 X i S X średnia i odchylenie próby X 1, X 2,..., X n ; Ȳ i S Y S X średnia i odchylenie próby Y 1, Y 2,..., Y n S Y

Współczynnik korelacji próbkowej (1) Próbkowy współczynnik korelacji jest ograniczoną 1 r 1. Wartości r bliskie 1lub 1 wskazują, że wykres rozproszenia jest skupiony wokół prostej. (2) W przypadku liniowego charakteru wykresu rozproszenia próbkowy współczynnik korelacji mierzy siłę zależności między zmiennymi.

Współczynnik korelacji próbkowej Rys. 3: Przykładowy wykres rozproszenia wyników za kolokwium i egzamin (w punktach)

Regresja liniowa Nowe nazwy: X zmienna objaśniająca (zmienna niezależna) Y zmienna objaśniana (zmienna zależna) Poszukujemy przybliżonej zależności funkcyjnej między tymi zmiennymi. Założymy zależność liniową w postaci y = b 0 + b 1 x b 0 wyraz wolny, b 1 współczynnik kierunkowy Mówimy, że ŷ i = b 0 + b 1 x i to wartość y przewidywana na podstawie rozpatrywanej prostej dla wartości zmiennej objaśniającej x równej x i. Błąd oszacowania, czyli tzw. wartość resztowa lub residuum wynosi y i ŷ i.

Regresja liniowa Pytanie: jak przeprowadzić prostą przez chmurę wyników, by residua były jak najmniejsze? Prostą regresji opartą na metodzie najmniejszych kwadratów nazywamy prostą b 0 + b 1 x, dla której wartość sumy S(b 0, b 1 ) = n (y i ŷ i ) 2 = i=1 n (y i (b 0 + b 1 x)) 2 i=1 traktowanej jako funkcja wszystkich możliwych wartości współczynnika kierunkowego i wyrazu wolnego, jest minimalna.

Regresja liniowa Prosta analiza daje nstp. wyniki: b 0 = 1 n n ( y i b 1 i=1 b 1 = n x i ) = ȳ b 1 x i=1 n (x i x)y i i=1 n (x i x) 2 i=1 Wartość y = b 0 + b 1 x nazywamy wartością przewidywaną zmiennej objaśnianej na podstawie prostej najmniejszych kwadratów (NMK) dla wartości zmiennej objaśniającej równej x.

Literatura [1] J. Koronacki, J. Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT, 2001

Koniec? Koniec wykładu 4