Matematyka z elementami statystyki

Podobne dokumenty
Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

In»ynierskie zastosowania statystyki wiczenia

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Analiza współzależności zjawisk

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Statystyka matematyczna - ZSTA LMO

Ekonometria - wykªad 8

Analiza Współzależności

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka opisowa. Wykªad II. Elementy statystyki opisowej. Edward Kozªowski.

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

STA T T A YSTYKA Korelacja

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Spis treści 3 SPIS TREŚCI

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Statystyka matematyczna

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Analiza współzależności dwóch cech I

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Modele wielorównaniowe. Estymacja parametrów

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

Metody probablistyczne i statystyka stosowana

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Biostatystyka, # 5 /Weterynaria I/

Biostatystyka, # 4 /Weterynaria I/

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Analiza współzależności dwóch cech II

Modele wielorównaniowe. Problem identykacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Badanie zależności pomiędzy zmiennymi

Podstawy statystycznego modelowania danych - Wykªad 7

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

(x j x)(y j ȳ) r xy =

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

KORELACJE I REGRESJA LINIOWA

Ekonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

Wykªad 6: Model logitowy

Ekonometria Bayesowska

Współczynniki korelacji czastkowej i wielorakiej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

Testowanie hipotez statystycznych.

STATYSTYKA MATEMATYCZNA

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Metody statystyczne w biologii - Wykªad 8. Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t

STATYSTYKA MATEMATYCZNA, LISTA 3

Badania eksperymentalne

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Statystyczna analiza danych

5. (8 punktów) EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Wykład 7. Opis współzaleŝności zjawisk. 1. Wprowadzenie.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Rozwini cia asymptotyczne dla mocy testów przybli»onych

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Ekonometria. wiczenia 7 Modele nieliniowe. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Pakiety statystyczne - Wykªad 8

Matematyka wykªad 1. Macierze (1) Andrzej Torój. 17 wrze±nia Wy»sza Szkoªa Zarz dzania i Prawa im. H. Chodkowskiej

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

Wydział Matematyki. Testy zgodności. Wykład 03

Wektory w przestrzeni

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6

Wykład 3 Hipotezy statystyczne

ROZWIĄZANIA PRZYKŁADOWYCH ZADAŃ. KORELACJA zmiennych jakościowych (niemierzalnych)

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

POLITECHNIKA OPOLSKA

Funkcje, wielomiany. Informacje pomocnicze

PDF created with FinePrint pdffactory Pro trial version

Badanie zależności skala nominalna

Analiza korelacji

Analiza autokorelacji

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

4.2. Statystyczne opracowanie zebranego materiału

Test t-studenta dla jednej średniej

2 Liczby rzeczywiste - cz. 2

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Transkrypt:

Matematyka z elementami statystyki Šukasz Dawidowski Instytut Matematyki, Uniwersytet l ski

Korelacja Zale»no± funkcyjna wraz ze wzrostem jednej zmiennej nast puje ±ci±le okre±lona zmiana druiej zmiennej. X zmienne niezale»na (obja±niaj ca) Y zmienne zale»na (obja±niana)

Korelacja Zale»no± stochastyczna wraz ze zmian jednej zmiennej nast puje zmiana rozkªadu drugiej zmiennej. Zale»no± statystyczna (korelacyjna) okre±lonym warto±ciom jednej zmiennej odpowiadaj ±ci±le okre±lone ±renie warto±ci drugiej zmiennej.

Korelacja Wspóªczynnik korelacji miernik siªy zale»no±ci mi dzy badanymi zmiennymi zmiany jednokierunkowe warto±ci obu zmiennych na ogóª rosn lub malej korelacja dodatnia zmiany ró»nokierunkowe wzrostowi jednego szeregu odpowiada spadek warto±ci drugiego korelacja ujenma

Tablica korelacyjna y 1 y 2... y j... y r suma x 1 n 11 n 12... n 1j... n 1r n 1 x 2 n 21 n 22... n 2j... n 2r n 2...... x i n i1 n i2... n ij... n ir n i...... x k n k1 n k2... n kj... n kr n k suma n 1 n 2... n j... n r n

Tablica korelacyjna gdzie: n i = r n ij j=1 n j = k n ij i=1 n = k r n ij i=1 j=1 Zamiast cz sto±ci absolutnych (bezwzgl dnych) n ij mo»na w tablicy korelacyjnej podawa cz sto±ci wzgl dne n ij n.

Korelacja Rozkªad brzegowy prezentuje struktur warto±ci jednej zmiennej bez wzgl du na ksztaªtowanie si warto±ci drugiej zmiennej. np. x 1 x 2 x i x k n 1 n 2 n i n k

Korelacja Rozkªad warunkowy prezentuje struktur warto±ci jednej zmiennej pod warunkiem,»e druga osi gn ªa okre±lon warto±.

Korelacja rednie arytmetyczne rozkªadów brzegowych: x = 1 n y = 1 n k i=1 x i n i r y j n j j=1

Korelacja rednie arytmetyczne rozkªadów warunkowych: x j = 1 n j y i = 1 n i k i=1 r j=1 x i n ij y j n ij

Korelacja Wariancje rozkªadów brzegowych: k s 2 (x) = 1 i x) n i=1(x 2 n i = 1 n r s 2 (y) = 1 j y) n j=1(y 2 n j = 1 n k i=1 r j=1 x 2 i n i x 2 y 2 j n j y 2

Korelacja Wariancje rozkªadów warunkowych: s 2 j (x) = 1 n j k i=1 (x i x j ) 2 n ij = 1 n j k i=1 x 2 i n ij x 2 j s 2 i (y) = 1 n i r j=1 (y j y i ) 2 n ij = 1 n i r j=1 y 2 j n ij y 2 i

Korelacja Cecha X jest stochastycznie niezale»na od cechy Y, je»eli: x 1 = x 2 =... = x r oraz s 2 1(x) = s 2 2(x) =... = s 2 r (x)

Korelacja Cecha Y jest stochastycznie niezale»na od cechy X, je»eli: y 1 = y 2 =... = y k oraz s 2 1(y) = s 2 2(y) =... = s 2 k(y)

Korelacja Niezale»no± korelacyjna tylko pierwsze warunki. Uwaga: Je»eli zmienne s niezale»ne stochastycznie, to s równie» niezale»ne korelacyjnie. Ale nie jest na odwrót!

Test niezale»no±ci chikwadrat Mo»na go stosowa zarówno do cech mierzalnych, jak i niemierzalnych. Zakªadamy,»e przedmiotem badania jest populacja generalna scharakteryzowana za pomoc dwóch cech jako±ciowych. Z populacji tej bierzemy n elementów, a wynik tej próby zapisujemy w tablicy korelacyjnej (zwanej te» tablic niezale»no±ci)

Test niezale»no±ci chikwadrat Werykujemy nast puj c hipotez zerow : H 0 : cechy X i Y s niezale»ne wobec hipotezy alternatywnej: H 2 : cechy X i Y nie s niezale»ne

Test niezale»no±ci chikwadrat Liczebno±ci teoretyczne: ˆn ij = suma licz. itego wiesza s. licz. jtej kolumny liczebno± próby ˆn ij = n i n j n

Test niezale»no±ci chikwadrat Do werykacji hipotezy H 0 o niezale»noci stochastycznej zmiennych wykorzystujemy statystyk : χ 2 = k r i=1 j=1 (n ij ˆn ij ) 2 ˆn ij = k r i=1 j=1 n 2 ij ˆn ij n Statystyka ta ma, przy zaªo»eniu prawdziwo±ci hipotezy H 0, dla du»ych prób asymptotyczny rozkªad χ 2 z (k 1)(r 1) stopniami swobody.

Test niezale»no±ci chikwadrat Obszar krytyczny (prawostronny) w rozwa»anym te±cie stanowi nierówno± : χ 2 χ 2 α gdzie χ 2 α jest warto±ci krytyczn odczytywan z tablicy rozkªadu χ 2 dla ustalonego z góry poziomu istotno±ci α i dla (k 1)(r 1) stopni swobody tak, aby zachodziªa relacja P(χ 2 χ 2 α) = α

Test niezale»no±ci chikwadrat gdy χ 2 χ 2 α, to hipotez o niezale»no±ci cech X i Y odrzucamy gdy χ 2 < χ 2 α, to nie mamy podstaw do odrzucenia hipotezy H 0

Test niezale»no±ci chikwadrat Gdy liczba stopni swobody przekracza 30, to w celu werykacji hipotezy H 0 o stochastycznej niezale»no±ci zmiennych X i Y wykorzystujemy test: Z = 2χ 2 2(k 1)(r 1) 1 który ma rozkªad normalny N(0, 1).

Test niezale»no±ci chikwadrat Tablica 2 2 (tablica czteropolowa) χ 2 = 1 2 n i 1 a b a + b 2 c d c + d n j a + c b + d n n(ad bc) 2 (a + b)(a + c)(b + d)(c + d)

Test niezale»no±ci chikwadrat Je»eli w tablicy czteropolowej przynajmniej jedna liczebno± jest mniejsza od 10 wprowadzamy poprawk Yatesa na nieci gªo± : χ 2 = n( ad bc 0, 5n) 2 (a + b)(a + c)(b + d)(c + d)

Opisowe miary korelacji dwóch zmiennych wspóªczynnik zbie»no±ci Czuprowa, wska¹niki (stosunki) korelacyjne Pearsona, wspóªczynnik korelacji liniowej Pearsona, wspóªczynnik korelacji rangowej Spearmana.

Wspóªczynnik zbie»no±ci Czuprowa T XY = χ 2 n (r 1)(k 1) T XY = T YX, T XY 0, 1. Gdy T XY = 0, to zmienne s stochastycznie niezale»ne. Gdy T XY = 1, to obserwujemy zale»no± funkcyjn zmiennych. Im bli»ej zera, tym zale»no± mi dzy zmiennymi jest sªabsza. Nie wskazuje kierunku korelacji.

Wspóªczynniki korelacyjne Pearsona x = 1 n y = 1 n x j = 1 n j y i = 1 n i k x i n i i=1 r y j n j j=1 k i=1 r j=1 x i n ij y j n ij

Wspóªczynniki korelacyjne Pearsona s 2 (x) = 1 n s 2 (y) = 1 n s 2 (x j ) = 1 n s 2 (y i ) = 1 n k i=1 r j=1 r j=1 k i=1 (x i x) 2 n i (y j y) 2 n j (x j x) 2 n j (y i y) 2 n i

Wspóªczynniki korelacyjne Pearsona e XY = s 2 (x j ) s 2 (x) = s(x j) s(x) e YX = s 2 (y i ) s 2 (y) = s(y i) s(y) e XY e YX (niesymetryczny), e XY, e YX 0, 1.

Wspóªczynniki korelacyjne Pearsona S równe zero, gdy cechy s nieskorelowane, za± równe jeden, kiedy mi dzy cechami wyst puje zale»no± funkcyjne. Im warto± jest bli»sza jeden, to zale»no± korelacyjna mi dzy cechami jest silniejsza. Nie wskazuj kierunku korelacji. Wa»ne jest, aby ustali, która cecha jest niezale»na, a która zale»na.

Wspóªczynnik korelacji liniowej Pearsona cov(x, Y ) = 1 n k r i=1 j=1 (x i x)(y j y)n ij = xy xy cov(x, Y ) kowariancja cov(x, Y ) s(x)s(y), s(x)s(y) cov(x, Y ) = 0 brak zale»no±ci korelacyjnej cov(x, Y ) > 0 dodatnia zale»no± korelacyjna cov(x, Y ) < 0 ujemna zale»no± jkorelacyjna

Wspóªczynnik korelacji liniowej Pearsona r XY = r YX = cov(x, Y ) s(x)s(y) r XY 1, 1 r XY = 0 brak zale»no±ci korelacyjnej r XY > 0 dodatnia zale»no± korelacyjna r XY < 0 ujemna zale»no± jkorelacyjna

Wspóªczynnik korelacji liniowej Pearsona Wspóªczynnik determinacji (okre±lono±ci) r 2 XY informuje o tym jaka cz ± zmian zmiennej obja±nianej (skutek) jest wyja±niana przez zmiany warto±ci zmiennej obja±niaj cej (przyczyna).

Wspóªczynnik korelacji rang Spearmana sªu»y do opisu siªy korelacji cech maj cych charakter jako±ciowy i istnieje mo»liwo± uporz dkowania obserwacji empirycznych w okre±lonej kolejno±ci mo»e by u»yty do badania cech ilo±ciowych w przypadku niewielkiej liczby obserwacji Rangowanie uporz dkowanym rosn co lub malej co warto±ciom zmiennych nadajemy numery kolejnych liczb naturalnych. W przypadku, gdy wyst puj jednakowe warto±ci zmiennych, przyporz dkowujemy im ±redni arytmetyczn obliczon z ich kolejnych numerów.

Wspóªczynnik korelacji rang Spearmana r s = 1 6 n di 2 i=1 n(n 2 1) gdzie d i oznaczaj ró»nice mi dzy rangami odpowiadaj cych sobie warto±ci cechy x i cechy y. r s 1, 1 Interpretacja jak dla wspóªczynnika korelacji liniowej Pearsona.

Cechy niemierzalne Tablica asocjacji + suma + a b a + b c d c + d suma a + c b + d n + oznacza,»e dana cecha wyst puje oznacza,»e danej cechy nie zaobserwowano (nie wyst puje) Tablica asocjacji mo»e mie wi cej wierszy i kolumn (decyzja nale»y do badaj cego)

Wspóªczynnik ϕ Yule'a sªu»y do badania siªy zwi zku dwóch cech jako±ciowych, z których ka»da ma dwa warianty ϕ = χ 2 n gdzie χ 2 jest warto±ci statystyki dla testu chikwadrat

Wspóªczynnik ϕ Yule'a ϕ = ad bc (a + b)(a + c)(b + d)(c + d) ϕ 1, 1 ϕ = 0 zmienne s niezale»ne Im bli»ej 1 lub -1 tym zale»no± jest wi ksza ϕ nie informuje o kierunku zale»no±ci

Wspóªczynnik Cole'a ϕ kor = ad bc n min(b,c)+(ad bc), ϕ 0 ad bc n min(a,d) (ad bc), ϕ < 0.

Wspóªczynnik kontyngencji C Pearsona Mo»e by stosowany do tablic wielodzielnych dowolnej wielko±ci (co najmniej cztery pola) i dowolnej formy (kwadratowe i prostok tne). C = χ2 χ 2 + n = C 0, 1 C = 0 cechy s niezale»ne C = 1 cechy s zale»ne ϕ2 ϕ 2 + n

Funkcja regresji liniowej MNK Funkcja regresji liniowej zmiennej Y wzgl dem zmiennej X w populacji generalnej jest dana za pomoc wzoru ŷ i = a 1 x i + a 0, gdzie oraz a 1 = cov(x, Y ) S X a 0 = ȳ a 1 x.