STUDIA METODOLOGICZNE
|
|
- Sabina Tomaszewska
- 6 lat temu
- Przeglądów:
Transkrypt
1 NR 3 (646) MARZEC 015 CZASOPISMO GŁÓWNEGO URZĘDU STATYSTYCZNEGO I POLSKIEGO TOWARZYSTWA STATYSTYCZNEGO STUDIA METODOLOGICZNE Piotr SULEWSKI Wyzaczaie obszaru krytyczego przy testowaiu iezależości w tablicach wielodzielczych Tablice wielodzielcze są podstawowym i często stosowaym arzędziem do badaia związku między cechami. Tablicę, która powstaje w wyiku podziału daych według dwóch cech azywamy dwudzielczą, trzech cech trójdzielczą,..., cech -dzielczą. Przy testowaiu iezależości cech ajbardziej popularą statystyką testową dla tablic dwudzielczych jest statystyka χ Pearsoa, która ma także swoje rozszerzeia dla tablic trójdzielczych i wyższych. W przypadku tablic i tablic w k w, k istieją jedak ograiczeia co do stosowaia statystyki Pearsoa, która ma asymptotyczy rozkład chi-kwadrat z w 1k 1 stopiami swobody. Także w przypadku tablic trójdzielczych w k p, jeżeli liczba realizacji w komórkach jest mała, rozkład statystyki testowej zacząco odbiega od rozkładu chi-kwadrat z wkp w k p stopiami swobody. W celu ziesieia tych ograiczeń w artykule propouję wyzaczaie wartości krytyczych za pomocą symulacji komputerowych metodą Mote Carlo. Także Lilliefors w teście Kołmogorowa dla rozkładu ormalego wyzaczył wartości krytycze drogą symulacyją, gdy parametry rozkładu były oszacowae z próby. Celem artykułu jest dostarczeie czytelikowi gotowej implemetacji komputerowej apisaej w edytorze VBA (Visual Basic for Applicatios) arkusza kalkulacyjego Excel, do badaia iezależości dwóch i trzech cech w formie pliku zamieszczoego w Iterecie. 1
2 STATYSTYKA PEARSONA DLA TABLICY DWUDZIELCZEJ Tablica dwudzielcza Najprostszą postacią tablicy dwudzielczej jest tablica, która składa się z 4 liczebości rozkładu łączego cech X i Y ozaczoych literami a, b, c, d (tabl. 1). Wówczas ogóla liczba obserwacji a b c d. TABL. 1. TABLICA DWUDZIELCZA Cecha X Y1 Cecha Y Y X 1... a b a b X... c d c d... a c b d Ź r ó d ł o: opracowaie włase. Przyjmując ozaczeia zawarte w tej tablicy statystyka χ Pearsoa ma postać: ( ad bc) X ( a b)( c d )( a c)( b d (1) ) Liczebość oczekiwaa dla tej tablicy wyosi odpowiedio: e 1 ( a b)( a c) e e 4 ( a b)( b d ) ( b d )( c d ) e 3 ( a c)( c d ) () Wzór (1) moża stosować, gdy 40 oraz e 1 5 dla każdego i 1,..., 4 (Cochra, 195). Jeżeli atomiast e 1 < 5 dla pewego i 1,..., 4, to sugeruje się stosowaie poprawki Yatesa daej wzorem (Cochra, 195): X Y ( ad bc 0, 5) ( a b)( c d )( a c)( b d ) (3) Poprawka Yatesa a ciągłość ma a celu zapewieie możliwości przyjmowaia przez statystykę testową wszystkich wartości rzeczywistych zgodie z istotą rozkładu chi-kwadrat. Należy jedak wspomieć, że poprawka Yatesa ie jest jedyym arzędziem stosowaym przez statystyków. Ie typy rozwiązań w tym zakresie podali m.i. Yates i Campbell i są oe astępujące, jeżeli: Wiadomości Statystycze r 3/015
3 1) e 1 < 5 dla pewego i 1,..., 4, to ależy stosować test Fishera-Yatesa (Yates, 1934). Cochra jedak zauważył, że waruek e 1 < 5 może w przyszłości wymagać modyfikacji; ) 5 > e i 1 dla pewego i 1,..., 4, to zdaiem Campbella (Campbell, 007) dla tablic ależy stosować test ' 1' chi-kwadrat w postaci (Pearso, 1947): X X 1 ( 1)( ad bc) ( a b)( c d )( a c)( b 1 d ) (4) 3) e 1 < 1 dla pewego i 1,..., 4, to ależy stosować test Fishera-Yatesa (Campbell, 007). Gdy hipoteza zerowa H 0 o iezależości cech X i Y jest słusza, statystyka X ma asymptotyczy rozkład chi-kwadrat z jedym stopiem swobody i jest miarą rozbieżości między rozkładem zaobserwowaym i hipotetyczym. Wykr. 1 przedstawia rozkład chi-kwadrat z jedym stopiem swobody oraz empiryczą fukcję gęstości rozkładu statystyki uzyskaą za pomocą metody Parzea dla tablicy i liczebości próby, gdy H 0 jest słusza. Dokłady opis tej metody zajduje się w iym opracowaiu pióra autora tegoż artykułu (Sulewski, 013). Liczebość próby dobrao w taki sposób, aby pokazać: brak zgodości rozkładu statystyki z rozkładem chi-kwadrat dla tablicy ( 50); zgodość rozkładu statystyki z rozkładem chi-kwadrat dla tablicy ( 500). Tablica dwudzielcza większa iż Tablica przedstawia tablicę dwudzielczą w k, która składa się z w k ij i 1,..., w; j 1,..., k rozkładu łączego cech X i Y. liczebości TABL.. TABLICA DWUDZIELCZA w k Cecha X Cecha Y Y1 Y Yk X k 1 X... 1 k X w... w1 w wk w... 1 k 3 Wiadomości Statystycze r 3/015
4 Wykr. 1. ZGODNOŚĆ ROZKŁADU STATYSTYKI χ PEARSONA Z ROZKŁADEM CHI-KWADRAT DLA TABLICY x 1, x, =50 1,0 fukcja gęstości estymatora 0,8 0,6 0,4 χ chi-kwadrat 0, 0,0 0,0 0,5 1,0 1,5,0,5 3,0 3,5 4,0 4,5 5,0 estymator statystyki χ 1, x, =500 1,0 fukcja gęstości estymatora 0,8 0,6 0,4 χ chi-kwadrat 0, 0,0 0,0 0,5 1,0 1,5,0,5 3,0 3,5 4,0 4,5 5,0 estymator statystyki χ Ź r ó d ł o: opracowaie włase. 4 Wiadomości Statystycze r 3/015
5 Wartość jest sumą wszystkich liczebości tablicy dwudzielczej: w i1 i k j1 j w k i1 j1 ij (5) Statystyka Pearsoa do badaia iezależości cech X, Y w tablicy dwudzielczej w k ma postać (Pearso, 1900): gdzie: w k ij eij XY (6) e i1 j1 ij liczebość zaobserwowaa w i-tym wierszu i j-tej kolumie, e liczebość oczekiwaa i-tego wiersza i j-tej kolumy daa wzorem: ij ij e ij i j ( i 1,,..., w; j 1,,..., k) (7) W przedstawioym teście iezależości liczebość próby musi być duża, aby w każdej komórce tablicy zalazła się możliwie duża liczba obserwacji. Zdaiem m.i. Yatesa, Moore'a, McCabe'a (Yates i i., 1999) oraz Shiera (Shier, 004) wzór (6) ależy stosować, gdy e ij 1 dla każdego i 1,..., w; j 1,..., k oraz gdy ie więcej iż 0% liczebości oczekiwaej e ij jest miejsze iż 5. Zdaiem Cochraa (Cochra, 195) statystykę XY dla tablic większych iż moża stosować, gdy liczebość oczekiwaa e > 5 dla pewego i 1,..., w; j 1,..., k. ij XY Gdy hipoteza zerowa H 0 o iezależości cech X, Y jest słusza, statystyka ma asymptotyczy rozkład chi-kwadrat z df ( w 1)( k 1) stopiami swobody 1 i jest miarą rozbieżości między rozkładem zaobserwowaym i hipotetyczym. Wykr. przedstawia rozkład chi-kwadrat z df 1 stopiami swobody oraz empiryczą fukcję gęstości rozkładu statystyki uzyskaą za pomocą metody Parzea dla tablicy 4 4 i liczebości próby, gdy H 0 jest słusza. Dokłady opis tej metody zajduje się w opracowaiu Sulewskiego (013). Liczebość próby w tym przypadku jest większa iż dla tablicy, gdyż tym razem dyspoujemy większą liczbą komórek. Liczebość próby dobrao w taki sposób, aby pokazać: brak zgodości rozkładu statystyki z rozkładem chi-kwadrat dla tablicy 4 4 ( 160); zgodość rozkładu statystyki z rozkładem chi-kwadrat dla tablicy 4 4 ( 1000). Wiadomości Statystycze r 3/015 5
6 Wykr.. ZGODNOŚĆ ROZKŁADU STATYSTYKI χ PEARSONA Z ROZKŁADEM CHI-KWADRAT DLA TABLICY 4x4 0,14 4x4, =160 0,1 fukcja gęstości estymatora 0,10 0,08 0,06 0,04 χ chi-kwadrat 0,0 0, estymator statystyki χ 4x4, =1000 0,1 0,10 fukcja gęstości estymatora 0,08 0,06 0,04 χ chi-kwadrat 0,0 0, estymator statystyki χ Ź r ó d ł o: jak w wykr Wiadomości Statystycze r 3/015
7 GENEROWANIE ZAWARTOŚCI TABLIC DWUDZIELCZYCH METODĄ SŁUPKOWĄ W celu geerowaia zawartości tablicy dwudzielczej w k, gdy między cechami X, Y ie ma związku, przedział ( 0;1 podzieloo a w k podprzedziałów o szerokościach rówych wartości prawdopodobieństwa 1/( w k)( i 1,,..., w; j 1,,..., k), które spełiają waruek ormalizacji: p ij w k p ij i1 j1 1 (8) Każda z wygeerowaych liczb losowych o rozkładzie rówomierym w przedziale 0 ; 1 wpada do jedego z w k podprzedziałów i tym samym liczba obiektów w odpowiadającej temu podprzedziałowi komórce tablicy zostaje zwiększoa o jedą. Wielkości ij spełiające rówość: w k i1 j1 ij (9) są liczebością obiektów w poszczególych komórkach tablicy. Na schemacie (1) przedstawioo wypełiaie komórek tablicy dla liczebości próby 00, a tabl. 3 przedstawia odpowiadającą temu schematowi tablicę. SCHEMAT (1) WYPEŁNIANIA KOMÓREK TABLICY x =00 liczb losowych rówomierych p 11 p 1 p 1 p 0,00 0,5 0,50 0,75 1,00 Ź r ó d ł o: jak przy wykr =56 1 =57 1 =47 =40 7 Wiadomości Statystycze r 3/015
8 TABL. 3. TABLICA DWUDZIELCZA WYGENEROWANA ZA POMOCĄ METODY SŁUPKOWEJ Cecha X Y1 Cecha Y Y X X WYZNACZANIE WARTOŚCI KRYTYCZNYCH DLA TABLIC DWUDZIELCZYCH Wcześiej przedstawioo waruki, jakie muszą być spełioe, aby moża było w testach iezależości dla tablic dwudzielczych stosować statystykę opisaą wzorami (1), (3), (4) i (6). W dobie coraz to szybszych komputerów moża za pomocą stosowego oprogramowaia zieść te ograiczeia i za pomocą symulacji wyzaczyć wartości krytycze. Wyzaczoo je tu odwołując się do oszacowań kwatyli, którymi są wartości stosowej statystyki pozycyjej (David, 1970). W celu ustaleia wartości krytyczych metodą Mote Carlo dla 5 daej tablicy dwudzielczej oraz liczebości próby, wyzaczoo R 10 wartości statystyki testowej (6) i za wartość krytyczą przyjęto 1 R statystykę pozycyją, gdzie jest poziomem istotości oraz ozacza część całkowitą liczby rzeczywistej. Tak duża liczba powtórzeń w obliczeiach statystyki testowej zapewia uzyskaie dokładego wyiku. Przy wyzaczaiu wartości krytyczych, gdy między cechami ie ma związku, zawartość tablic dwudzielczych geerowao za pomocą metody słupkowej. Geerowaie zawartości tych tablic iymi metodami, przy założeiu że między cechami ie ma związku, ie miało wpływu a uzyskae wielkości wartości krytyczych. Przykład 1 Na podstawie daych przedstawioych w tablicach dwudzielczych (tabl. 4) i 3 3 (tabl. 5), zbadao a poziomie istotości 0,05 istieie związku między cechami X i Y korzystając ze statystyki Pearsoa. TABL. 4. TABLICA DWUDZIELCZA Z ROZKŁADEM ŁĄCZNYM CECH X i Y Waga Dieta iestosowaa stosowaa Bez zmia Utrata wagi Wiadomości Statystycze r 3/015
9 TABL. 5. TABLICA DWUDZIELCZA 3 3 Z ROZKŁADEM ŁĄCZNYM CECH X i Y Pochodzeie społecze uiwersytet Uczelie wyższe politechika akademia medycza Chłopskie Roboticze Iteligeckie ZESTAWIENIE (1) PROCEDUR I FUNKCJI WYKORZYSTANYCH DO PRZEPROWADZENIA TESTU NIEZALEŻNOŚCI DLA TABLICY DWUDZIELCZEJ Wyszczególieie Typ Realizowae zadaia TestD... procedura realizacja testu iezależości dla tablicy dwudzielczej Rozmiar... fukcja ustalaie liczby kategorii cech X, Y GNij... fukcja pobraie liczebości tablicy dwudzielczej ExpNij... fukcja wyzaczaie liczebości oczekiwaej SX... fukcja obliczaie sum brzegowych w wierszach SY... fukcja obliczaie sum brzegowych w kolumach GeTab... fukcja geerowaie zawartości tablicy dwudzielczej Kwatyle... fukcja wyzaczaie wartości krytyczej Sortu... fukcja sortowaie ChiKw... fukcja obliczaie wartości statystyki χ Implemetację komputerową testu iezależości Pearsoa dla tablicy dwudzielczej utworzoą w edytorze VBA arkusza kalkulacyjego Excel przedstawioo w pliku TestyChi, który umieszczoo w Iterecie pod adresem Składają się a ią procedury i fukcje przedstawioe w zestawieiu 1. Po utworzeiu tablicy dwudzielczej w arkuszu tablicad (tabl. 4) (począwszy od komórki B) wprowadzoo wartość poziomu istotości testu 0, 05 w arkuszu wyiki oraz uruchomioo procedurę TestD. Efektem końcowym działaia procedury jest tablica umieszczoa w arkuszu wyiki ukazująca wyiki działaia testu iezależości cech X i Y (tabl. 6). TABL. 6. WYNIKI DZIAŁANIA TESTU NIEZALEŻNOŚCI CECH X i Y NA PODSTAWIE DANYCH Z TABL. 4 Hipoteza zerowa Nie ma związku między cechami Poziom istotości... 0,05 Wartość krytycza... 3,848 Wartość statystyki... 3,668 U w a g a. Nie ma podstaw do odrzuceia hipotezy zerowej. Czas działaia algorytmu 1 sekud. 9 Wiadomości Statystycze r 3/015
10 W uwadze (tabl. 6) poday jest czas działaia algorytmu, a który główy wpływ ma sortowaie 10 5 wartości statystyki testowej (6). Powtarzając te czyości dla tablicy dwudzielczej 3 3 (tabl. 5) otrzymao tablicę pokazującą wyiki działaia testu iezależości cech X i Y (tabl. 7). TABL. 7. WYNIKI DZIAŁANIA TESTU NIEZALEŻNOŚCI CECH X i Y NA PODSTAWIE DANYCH Z TABL. 5 Hipoteza zerowa Nie ma związku między cechami Poziom istotości... 0,05 Wartość krytycza... 9,43 Wartość statystyki... 0,951 U w a g a. Są podstawy do odrzuceia hipotezy zerowej. Czas działaia algorytmu 5 sekud. STATYSTYKA PEARSONA DLA TABLICY TRÓJDZIELCZEJ Tablicę, która gromadzi wyik podziału próby według trzech cech X, Y, Z azywamy tablicą trójdzielczą. Moża sobie ją wyobrazić jako kostkę z w wierszami, k kolumami i p płaszczyzami. Tablicę trójdzielczą moża także zilustrować rozkładając płaszczyzy p obok siebie (tabl. 8 i 9). Tablica trójdzielcza ułatwia odczytywaie zależości między cechami ilościowymi i jakościowymi. Najprostszą jej postacią jest tablica (tabl. 8), która składa się z 8 liczebości ijt ( i, j, t 1, ) rozkładu łączego cech X, Y, Z. TABL. 8. TABLICA TRÓJDZIELCZA Cecha Z Cecha X Z1 cecha Y Z Y1 Y Y1 Y X X Tabl. 9 przedstawia tablicę trójdzielczą w k p, która składa się z w k p liczebości ( i 1,..., w; j 1,..., k; t 1,..., p) rozkładu łączego cech X, Y, Z. 10 ijt Wiadomości Statystycze r 3/015
11 Cecha X TABL. 9. TABLICA TRÓJDZIELCZA w k p Cecha Z Z1... Zp cecha Y Y1 Y... Yk... Y1 Y... Yk X k p 1p 1kp 1 X k1... 1p p kp X w... w11 w1 wk1... w1p wp wkp w k1... 1p p... kp Wartość jest sumą wszystkich liczebości tablicy trójdzielczej, czyli: w k p w k i j t ij it jt i1 j1 t1 i1 j1 i1 t1 j1t 1 i1 j1t 1 w p k p w k p ijt (10) W aalizie iezależości trzech cech moża badać m.i. iezależość pełą, czyli czy cechy są parami iezależe. Statystyka Pearsoa do badaia pełej iezależości cech X, Y, Z w tablicy trójdzielczej w k p ma postać: w k p ( ijte ) ijt T 3 (11) e i1 j1 t 1 ijt gdzie: ijt liczebość zaobserwowaa w i-tym wierszu, j-tej kolumie, t-tej płaszczyźie; e ijt liczebość oczekiwaa i-tego wiersza, j-tej kolumy, t-tej płaszczyzy daa wzorem: e ijt i j t (1) 11 Wiadomości Statystycze r 3/015
12 3 T Gdy hipoteza zerowa H 0 o iezależości cech X, Y, Z jest słusza, statystyka ma asymptotyczy rozkład chi-kwadrat z df wkp w k p stopiami swobody i jest miarą rozbieżości między rozkładem zaobserwowaym i hipotetyczym. Wykr. przedstawia rozkład chi-kwadrat z df stopiami swobody oraz empiryczą fukcję gęstości rozkładu statystyki uzyskaą za pomocą metody Parzea dla tablicy i liczebości próby. Dokłady opis tej metody zajduje się w (Sulewski, 013). Liczebość próby zależy oczywiście od liczby komórek tablicy i dobrao ją w taki sposób, aby pokazać: brak zgodości rozkładu statystyki z rozkładem chi-kwadrat dla tablicy ( 80); zgodość rozkładu statystyki z rozkładem chi-kwadrat dla tablicy ( 1000). GENEROWANIE ZAWARTOŚCI TABLIC TRÓJDZIELCZYCH METODĄ SŁUPKOWĄ W celu geerowaia zawartości tablicy w k p, gdy między cechami X, Y, Z ie ma związku, przedział 0 ; 1 podzieloo a w k p podprzedziałów o szerokościach rówych wartości prawdopodobieństwa p ij 1/ w k pi 1,,..., w; j 1,,..., k; t 1,,..., p, które spełiają waruek ormalizacji: w k p p ijt i1 j1t 1 1 (13) Każda z wygeerowaych liczb losowych o rozkładzie rówomierym w przedziale 0 ; 1 wpada do jedego z w k p podprzedziałów i tym samym liczba obiektów w odpowiadającej temu podprzedziałowi komórce tablicy zostaje zwiększoa o jedą. Wielkości ijt spełiające rówość: w k p i1 j1t 1 ijt (14) są liczebością obiektów w poszczególych komórkach tablicy. 1 Wiadomości Statystycze r 3/015
13 SCHEMAT () WYPEŁNIANIA KOMÓREK TABLICY xx =00 liczb losowych rówomierych p 111 p 11 p 11 p 1 p 11 p 1 p 1 p 0,000 0,15 0,50 0,375 0,500 0,65 0,750 0,875 1, =3 11 =9 11 =8 1 =5 11 =16 1 =6 1 =9 =4 Ź r ó d ł o: jak przy wykr. 1. Schemat () przedstawia wypełiaie komórek tablicy dla liczebości próby 00, a tabl. 10 przedstawia odpowiadającą temu schematowi tablicę. TABL. 10. TABLICA TRÓJDZIELCZA WYGENEROWANA ZA POMOCĄ METODY SŁUPKOWEJ Cecha Z Cecha X Z1 cecha Y Z Y1 Y Y1 Y X X WYZNACZANIE WARTOŚCI KRYTYCZNYCH DLA TABLIC TRÓJDZIELCZYCH Z wykr. 3 wyika, że jeżeli próba ie jest dostateczie duża, statystyka (11) ie ma rozkładu chi-kwadrat z df stopiami swobody. Podobie jak to miało miejsce w tablicach dwudzielczych moża zrezygować z rozkładu asymptotyczego i za pomocą symulacji wyzaczyć wartości krytycze. Wiadomości Statystycze r 3/015 13
14 Wykr. 3. ZGODNOŚĆ ROZKŁADU STATYSTYKI χ PEARSONA Z ROZKŁADEM CHI-KWADRAT DLA TABLICY xx 0,5 xx, =80 0,0 fukcja gęstości estymatora 0,15 0,10 0,05 χ chi-kwadrat 0, estymator statystyki χ 0,0 0,18 0,16 xx, =1000 fukcja gęstości estymatora 0,14 0,1 0,10 0,08 0,06 0,04 χ chi-kwadrat 0,0 0, estymator statystyki χ Ź r ó d ł o: jak przy wykr Wiadomości Statystycze r 3/015
15 Wartości te wyzaczoo odwołując się do oszacowań kwatyli, którymi są wartości stosowej statystyki pozycyjej (David, 1970). W celu ustaleia wartości krytyczych metodą Mote Carlo dla daej tablicy trójdzielczej oraz liczebości próby wyzaczoo R 10 wartości statystyki testowej (11) i za wartość 5 krytyczą przyjęto 1 R statystykę pozycyją, gdzie jest poziomem istotości oraz. jest częścią całkowitą liczby. Przy wyzaczaiu wartości krytyczych, gdy między cechami ie ma związku, tablice trójdzielcze geerowao za pomocą metody słupkowej. Przykład Na podstawie daych przedstawioych w tablicach trójdzielczych (tabl. 11) i 4 3 (tabl. 1) zbadao a poziomie istotości 0,01 iezależość cech X, Y, Z korzystając ze statystyki Pearsoa. TABL. 11. TABLICA TRÓJDZIELCZA Z ROZKŁADEM ŁĄCZNYM CECH X, Y, Z Płeć Miasta Wieś grupy wiekowe mieszkańców Mężczyźi Kobiety TABL. 1. TABLICA TRÓJDZIELCZA 4 3 Z ROZKŁADEM ŁĄCZNYM CECH X, Y, Z Grupy krwi Mężczyźi Kobiety wzrost w cm A B AB Wiadomości Statystycze r 3/015 15
16 ZESTAWIENIE () PROCEDUR I FUNKCJI WYKORZYSTANYCH DO PRZEPROWADZENIA TESTU NIEZALEŻNOŚCI DLA TABLICY TRÓJDZIELCZEJ Wyszczególieie Typ Realizowae zadaie Test3D... procedura realizacja testu iezależości dla tablicy trójdzielczej Rozmiar3... fukcja ustalaie liczby kategorii cech X, Y, Z GNijt... fukcja pobraie liczebości tablicy trójdzielczej ExpNijt... fukcja wyzaczaie liczebości oczekiwaej SX3... fukcja obliczaie sum brzegowych w wierszach SY3... fukcja obliczaie sum brzegowych w kolumach SZ3... fukcja obliczaie sum brzegowych w płaszczyzach GeTab3... fukcja geerowaie zawartości tablicy trójdzielczej Kwatyle3... fukcja wyzaczaie wartości krytyczej Sortu... fukcja sortowaie ChiKw3... fukcja obliczaie wartości statystyki χ Implemetację komputerową testu iezależości Pearsoa dla tablicy trójdzielczej utworzoą w edytorze VBA arkusza kalkulacyjego Excel przedstawioo w pliku TestyChi, który moża zaleźć w Iterecie pod adresem Składają się a ią procedury i fukcje przedstawioe w zestawieiu. Po utworzeiu tablicy trójdzielczej w arkuszu tablica3d (Tabl. 9) (począwszy od komórki B) wprowadzoo wartość poziomu istotości testu 0, 01 w arkuszu wyiki oraz uruchomioo procedurę Test3D. Efektem końcowym działaia procedury jest tablica umieszczoa w arkuszu wyiki ukazująca wyiki działaia testu iezależości cech X, Y, Z (tabl. 13). TABL. 13. WYNIKI DZIAŁANIA TESTU NIEZALEŻNOŚCI CECH X, Y, Z NA PODSTAWIE DANYCH Z TABL. 11 Hipoteza zerowa Nie ma związku między cechami Poziom istotości... 0,01 Wartość krytycza... 13,17 Wartość statystyki... 18,971 U w a g a. Są podstawy do odrzuceia hipotezy zerowej. Czas działaia algorytmu 0 sekud. W uwadze (tabl. 13) poday jest czas działaia algorytmu, a który główy wpływ ma sortowaie 10 5 wartości statystyki testowej (11). 16 Wiadomości Statystycze r 3/015
17 Powtarzając czyości dla tablicy trójdzielczej 4 3 (tabl. 1) otrzymao tablicę ukazującą wyiki działaia testu iezależości cech X, Y, Z (tabl. 14). TABL. 14. WYNIKI DZIAŁANIA TESTU NIEZALEŻNOŚCI CECH X, Y, Z NA PODSTAWIE DANYCH Z TABL. 1 Hipoteza zerowa Nie ma związku między cechami Poziom istotości... 0,05 Wartość krytycza... 3,984 Wartość statystyki...,959 U w a g a. Nie ma podstaw do odrzuceia hipotezy zerowej. Czas działaia algorytmu 36 sekud. Podsumowaie Wraz z rozwojem auki pojawiają się w statystyce coraz to owsze możliwości badaia iezależości cech. Mimo to ajważiejszą w tym kotekście jest adal zapropoowaa przez Pearsoa w 1900 r. statystyka, tym bardziej że ma oa swoje rozszerzeia także dla tablic trójdzielczych i wyższych. W przypadku tablic dwudzielczych w k istieją jedak ograiczeia co do stosowalości statystyki, która ma asymptotyczy rozkład chi-kwadrat w 1k 1 stopiami swobody. Także dla tablic trójdzielczych w k p, jeżeli liczba reali- zacji w komórkach jest mała, rozkład statystyki testowej zacząco odbiega od rozkładu chi-kwadrat z wkp w k p stopiami swobody. W obecej dobie szybkiego rozwoju moża zieść te ograiczeia wyzaczając wartości krytycze dzięki symulacjom komputerowym geerującym zawartość tablic wielodzielczych. Lektura przedstawioej teorii dotyczącej tablic wielodzielczych oraz aaliza zamieszczoych przykładów pozwoli wikliwemu czytelikowi przeprowadzić testy iezależości z wykorzystaiem statystyki Pearsoa przy dowolej liczebości obiektów w poszczególych komórkach tablicy wielodzielczej. dr Piotr Sulewski Akademia Pomorska w Słupsku LITERATURA Campbell I. (007), Chi-squared ad Fisher-Irwi tests of two-by-two tables with small sample recommedatios, Statistics i Medicie, Vol. 6 Cochra W. G. (195), The χ test of goodess of fit, Aals of Mathematical Statistics, Vol. 3, No. 3 Wiadomości Statystycze r 3/015 17
18 David H. A. (1970), Order statistics, Wiley, New York Pearso E. S. (1947), The choice of statistical tests illustrated o the iterpretatio of data classed i a table, Biometrika, Vol. 34 Pearso K. (1900), O the criterio that a give system of deviatios from the probable i the case of a correlated system of variables is such that it ca be reasobly supposed to have arise from radom samplig, Philosophy Magazie Series, Series 5, Vol. 50 Shier R. (004), The Chi-squared test for two-way tables, Mathematics Learig Support Cetre Sulewski P. (013), Modyfikacja testu iezależości, Wiadomości Statystycze, r 10, GUS Yates F. (1934), Cotigecy table ivolvig small umbers ad the χ test, Joural of the Royal Statistical Society (Supplemet), No. 1 Yates D., Moore D., McCabe G. (1999), The Practice of Statistics (1st Ed.), New York, W. H. Freema SUMMARY I the study of the idepedece of characteristics i the multi-feature tables Pearso s statistics are the most popular. For multi-feature arrays, there are certai limitatios as to the applicability of the Pearso s statistics, but i a era of rapidly developig computer settig ca be abolished with the critical value of computer simulatio to geerate the cotets of multi-feature tables. The aim of the study is to provide the reader with a ready computer implemetatio, writte i VBA editor (Visual Basic for Applicatios). Readig the preseted theory for multi-feature tables ad aalysis of the examples allow the reader to carry out idepedet tests usig Pearso's statistics at ay umber of objects i each multi-feature table cells. 18 РЕЗЮМЕ В обследовании независимости признаков в многоразделительных таблицах самым популярным является статистика χ Пирсона. Для многоразделительных таблиц существуют определенные ограничения в области возможностей использования статистики χ Пирсона, но во время быстро развивающегося компьютерного оборудования можно их отменить определяя критические значения с помощью компьютерного моделирования генерируя содержание многоразделительных таблиц. Целью статьи является предоставление готовой компьютерной имплементации написанной в программе VBA (Visual Basic for Applicatios). Представленная теория касающаяся многоразделительных таблиц и анализ примеров позволят провести тесты независимости с использованием статистики χ Пирсона для любого числа объектов в отдельных местах многоразделительной таблицы. Wiadomości Statystycze r 3/015
Indeks 381306. Prenumerata realizowana przez RUCH S.A.:
KOLEGIUM REDAKCYJNE: dr Stanisław Paradysz (redaktor naczelny, tel. 22 842-07-80), prof. dr hab. Józef Zegar (zastępca red. nacz., tel. 22 826-14-28), inż. Alina Świderska (sekretarz redakcji, tel. 22
POJĘCIE MIARY ODEJŚCIA OD RÓWNOMIERNOŚCI ORAZ JEJ WPŁYW NA TESTOWANIE NIEZALEŻNOŚCI W TABLICACH DWUDZIELCZYCH ŚREDNICH ROZMIARÓW
METODY ILOŚCIOWE W BDNICH EKONOMICZNYCH Tom XVII/, 016, s. 111 1 POJĘCIE MIRY ODEJŚCI OD RÓWNOMIERNOŚCI ORZ JEJ WPŁYW N TESTOWNIE NIEZLEŻNOŚCI W TBLICCH DWUDZIELCZYCH ŚREDNICH ROZMIRÓW Piotr Sulewski Istytut
TESTY LOSOWOŚCI. Badanie losowości próby - test serii.
TESTY LOSOWOŚCI Badaie losowości próby - test serii. W wielu zagadieiach wioskowaia statystyczego istotym założeiem jest losowość próby. Prostym testem do weryfikacji tej własości jest test serii. 1 Dla
Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.
Z adaie Niech,,, będą iezależymi zmieymi losowymi o idetyczym rozkładzie ormalym z wartością oczekiwaą 0 i wariacją. Wyzaczyć wariację zmieej losowej. Wskazówka: pokazać, że ma rozkład Γ, ODP: Zadaie Niech,,,
ANALIZA DANYCH DYSKRETNYCH
ZJAZD ESTYMACJA Jest to metoda wioskowaia statystyczego. Umożliwia oa oszacowaie wartości iteresującego as parametru a podstawie badaia próbki. Estymacja puktowa polega a określeiu fukcji zwaej estymatorem,
STUDIA METODOLOGICZNE
NR 5 (648) MAJ 015 CZASOPISMO GŁÓWNEGO URZĘDU STATYSTYCZNEGO I POLSKIEGO TOWARZYSTWA STATYSTYCZNEGO STUDIA METODOLOGICZNE Piotr SULEWSKI Ocena zdolności tablic dwudzielczych do wykrywania związku między
Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12
Wykład Korelacja i regresja Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej Wykład 8. Badaie statystycze ze względu
X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.
Zagadieia estymacji Puktem wyjścia badaia statystyczego jest wylosowaie z całej populacji pewej skończoej liczby elemetów i zbadaie ich ze względu a zmieą losową cechę X Uzyskae w te sposób wartości x,
Wielowymiarowe uogólnienie testu niezależności
Piotr SULEWSKI Wielowymiarowe uogólnienie testu niezależności W literaturze statystycznej znajdujemy głównie metody wnioskowania dotyczące jednej zmiennej. Jednak w badaniach statystycznych obiekty opisywane
Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja
Podstawowe ozaczeia i wzory stosowae a wykładzie i laboratorium Część I: estymacja 1 Ozaczeia Zmiee losowe (cechy) ozaczamy a wykładzie dużymi literami z końca alfabetu. Próby proste odpowiadającymi im
Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).
Cetrale miary położeia Średia; Moda (domiata) Mediaa Kwatyle (kwartyle, decyle, cetyle) Moda (Mo, D) wartość cechy występującej ajczęściej (ajlicziej). Mediaa (Me, M) dzieli uporządkoway szereg liczbowy
Parametryczne Testy Istotności
Parametrycze Testy Istotości Wzory Parametrycze testy istotości schemat postępowaia pukt po pukcie Formułujemy hipotezę główą H odośie jakiegoś parametru w populacji geeralej Hipoteza H ma ajczęściej postać
STATYSTYKA I ANALIZA DANYCH
TATYTYKA I ANALIZA DANYCH Zad. Z pewej partii włókie weły wylosowao dwie próbki włókie, a w każdej z ich zmierzoo średicę włókie różymi metodami. Otrzymao astępujące wyiki: I próbka: 50; średia średica
PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).
TATYTYKA MATEMATYCZNA WYKŁAD 3 RZEDZIAŁY UFNOŚCI Niech θ - iezay parametr rozkład cechy. Niech będzie liczbą z przedział 0,. Jeśli istieją statystyki, U i U ; U U ; których rozkład zależy od θ oraz U θ
Estymacja przedziałowa
Metody probabilistycze i statystyka Estymacja przedziałowa Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej Metody probabilistycze
obie z mocy ustawy. owego.
Kwartalik Prawo- o-ekoomia 3/015 Aa Turczak Separacja po faktycza lub prawa obie z mocy ustawy cza, ie ozacza defiitywego owego 1 75 1 61 3 Art 75 88 Kwartalik Prawo- o-ekoomia 3/015 zaspokajaia usp iedostatku
1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o
1. Wioskowaie statystycze. W statystyce idetyfikujemy: Cecha-Zmiea losowa Rozkład cechy-rozkład populacji Poadto miaem statystyki określa się także fukcje zmieych losowych o tym samym rozkładzie. Rozkłady
MINIMALIZACJA PUSTYCH PRZEBIEGÓW PRZEZ ŚRODKI TRANSPORTU
Przedmiot: Iformatyka w logistyce Forma: Laboratorium Temat: Zadaie 2. Automatyzacja obsługi usług logistyczych z wykorzystaiem zaawasowaych fukcji oprogramowaia Excel. Miimalizacja pustych przebiegów
PODSTAWY BIOSTATYSTYKI ĆWICZENIA
PODSTAWY BIOSTATYSTYKI ĆWICZENIA FILIP RACIBORSKI FILIP.RACIBORSKI@WUM.EDU.PL ZAKŁAD PROFILAKTYKI ZAGROŻEŃ ŚRODOWISKOWYCH I ALERGOLOGII WUM ZADANIE 1 Z populacji wyborców pobrao próbkę 1000 osób i okazało
ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA
ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA Mamy populację geeralą i iteresujemy się pewą cechą X jedostek statystyczych, a dokładiej pewą charakterystyką liczbową θ tej cechy (p. średią wartością
KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1
KURS STATYSTYKA Lekcja 3 Parametrycze testy istotości ZADANIE DOMOWE www.etrapez.pl Stroa Część : TEST Zazacz poprawą odpowiedź (tylko jeda jest prawdziwa). Pytaie Statystykę moża rozumieć jako: a) próbkę
Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2
Wykład 5 Przedziały ufości Zwykle ie zamy parametrów populacji, p. Chcemy określić a ile dokładie y estymuje Kostruujemy przedział o środku y, i taki, że mamy 95% pewości, że zawiera o Nazywamy go 95%
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Prawdopodobieństwo i statystyka r.
Zadaie 1 Rzucamy 4 kości do gry (uczciwe). Prawdopodobieństwo zdarzeia iż ajmiejsza uzyskaa a pojedyczej kości liczba oczek wyiesie trzy (trzy oczka mogą wystąpić a więcej iż jedej kości) rówe jest: (A)
Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15
Testowaie hipotez ZałoŜeia będące przedmiotem weryfikacji azywamy hipotezami statystyczymi. KaŜde przypuszczeie ma swoją alteratywę. Jeśli postawimy hipotezę, Ŝe średica pia jedoroczych drzew owej odmiay
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Rozkład χ 2 = + 2π 2. Niech zmienna losowa x ma rozkład normalnyn(x; µ,σ). Znajdziemy rozkład zmiennej:
Rozkład χ Niech ziea losowa a rozkład oralyn(; µ,). Zajdziey rozkład zieej: µ Stadaryzjąc zieą losową µ otrzyjey stadaryzoway rozkład Gassa: ( ;, ) ep N 0 π Rozkład zieej a więc postać: d ( X + ) N N ep
Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych
Wokół testu Studeta Wprowadzeie Rozkłady prawdopodobieństwa występujące w testowaiu hipotez dotyczących rozkładów ormalych Rozkład ormaly N(µ, σ, µ R, σ > 0 gęstość: f(x σ (x µ π e σ Niech a R \ {0}, b
Lista 6. Estymacja punktowa
Estymacja puktowa Lista 6 Model metoda mometów, rozkład ciągły. Zadaie. Metodą mometów zaleźć estymator iezaego parametru a w populacji jedostajej a odciku [a, a +. Czy jest to estymator ieobciążoy i zgody?
Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.
Rachuek prawdopodobieństwa i statystyka W12: Statystycza aaliza daych jakościowych Dr Aa ADRIAN Paw B5, pok 407 ada@agh.edu.pl Wprowadzeie Rozróżia się dwa typy daych jakościowych: Nomiale jeśli opisują
Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w
Zad Dae są astępujące macierze: A =, B, C, D, E 0. 0 = = = = 0 Wykoaj astępujące działaia: a) AB, BA, C+E, DE b) tr(a), tr(ed), tr(b) c) det(a), det(c), det(e) d) A -, C Jeśli działaia są iewykoale, to
STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś
1 STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr iż Krzysztof Bryś Pojȩcia wstȩpe populacja - ca ly zbiór badaych przedmiotów lub wartości. próba - skończoy podzbiór populacji podlegaj acy badaiu.
16 Przedziały ufności
16 Przedziały ufości zapis wyiku pomiaru: sugeruje, że rozkład błędów jest symetryczy; θ ± u(θ) iterpretacja statystycza przedziału [θ u(θ), θ + u(θ)] zależy od rozkładu błędów: P (Θ [θ u(θ), θ + u(θ)])
Ćwiczenie 2 ESTYMACJA STATYSTYCZNA
Ćwiczeie ETYMACJA TATYTYCZNA Jest to metoda wioskowaia statystyczego. Umożliwia oszacowaie wartości iteresującego as parametru a podstawie badaia próbki. Estymacja puktowa polega a określeiu fukcji zwaej
Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie
Metrologia: miary dokładości dr iż. Paweł Zalewski Akademia Morska w Szczeciie Miary dokładości: Najczęściej rozkład pomiarów w serii wokół wartości średiej X jest rozkładem Gaussa: Prawdopodobieństwem,
Statystyka. Katarzyna Chudy Laskowska
Statystyka Katarzya Chudy Laskowska http://kc.sd.prz.edu.pl/ WNIOSKOWANIE STATYSTYCZNE Celem aalizy statystyczej ie jest zwykle tylko opisaie (prezetacja) posiadaych daych, czyli tzw. próby statystyczej.
Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407
Statystyka i Opracowaie Daych W7. Estymacja i estymatory Dr Aa ADRIAN Paw B5, pok407 ada@agh.edu.pl Estymacja parametrycza Podstawowym arzędziem szacowaia iezaego parametru jest estymator obliczoy a podstawie
MOC TESTÓW NIEZALEŻNOŚCI W TABLICY TRÓJDZIELCZEJ 2 2 2
PRZEGLĄD STATYSTYCZNY R. LXIII ZESZYT 4 2016 PIOTR SULEWSKI 1 MOC TESTÓW NIEZALEŻNOŚCI W TABLICY TRÓJDZIELCZEJ 2 2 2 1. WPROWADZENIE Moc testów to prawdopodobieństwo odrzucenia hipotezy zerowej, gdy nie
Statystyka Wzory I. Analiza struktury
Uiwersytet Ekooiczy w Katowicach Wzory I. Aaliza struktury 1. Miary tedecji cetralej (średie, przecięte Średia arytetycza Dla sz. ważoego Dla sz. ważoego dla z. ciągłej Dla szeregu wyliczającego: dla zieej
χ 2 = + 2π 2 Niech zmienna losowa x ma rozkład normalnyn(x; µ,σ). Znajdziemy rozkład zmiennej: σ
χ Niech ziea losowa a rozkład oralyn(; µ,). Zajdziey rozkład zieej: µ Stadaryzjąc zieą losową µ otrzyjey stadaryzoway rozkład Gassa: ( ;, ) ep N 0 π Rozkład zieej a więc postać: d ( X + ) N N ep d π Rozważy
PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH
PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH POMIAR FIZYCZNY Pomiar bezpośredi to doświadczeie, w którym przy pomocy odpowiedich przyrządów mierzymy (tj. porówujemy
STATYSTYKA MATEMATYCZNA
TATYTYKA MATEMATYCZNA ROZKŁADY PODTAWOWYCH TATYTYK zmiea losowa odpowiedik badaej cechy, (,,..., ) próba losowa (zmiea losowa wymiarowa, i iezależe zmiee losowe o takim samym rozkładzie jak (taką próbę
Statystyka opisowa. () Statystyka opisowa 24 maja / 8
Część I Statystyka opisowa () Statystyka opisowa 24 maja 2010 1 / 8 Niech x 1, x 2,..., x będą wyikami pomiarów, p. temperatury, ciśieia, poziomu rzeki, wielkości ploów itp. Przykład 1: wyiki pomiarów
L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3
L.Kowalski zadaia ze statystyki matematyczej-zestaw 3 ZADANIA - ZESTAW 3 Zadaie 3. Cecha X populacji ma rozkład N m,. Z populacji tej pobrao próbę 7 elemetową i otrzymao wyiki x7 = 9, 3, s7 =, 5 a Na poziomie
1 Testy statystyczne. 2 Rodzaje testów
1 Testy statystycze Podczas sprawdzaia hipotez statystyczych moga¾ wystapić ¾ dwa rodzaje b ¾edów. Prawdopodobieństwo b ¾edu polegajacego ¾ a odrzuceiu hipotezy zerowej (H 0 ), gdy jest oa prawdziwa, czyli
Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2
Wykład 7 Dwie iezależe próby Często porówujemy wartości pewej zmieej w dwóch populacjach. Przykłady: Grupa zabiegowa i kotrola Lekarstwo a placebo Pacjeci biorący dwa podobe lekarstwa Mężczyźi a kobiety
Statystyka matematyczna dla leśników
Statystyka matematycza dla leśików Wydział Leśy Kieruek leśictwo Studia Stacjoare I Stopia Rok akademicki 0/0 Wykład 5 Testy statystycze Ogóle zasady testowaia hipotez statystyczych, rodzaje hipotez, rodzaje
O liczbach naturalnych, których suma równa się iloczynowi
O liczbach aturalych, których suma rówa się iloczyowi Lew Kurladczyk i Adrzej Nowicki Toruń UMK, 10 listopada 1998 r. Liczby aturale 1, 2, 3 posiadają szczególą własość. Ich suma rówa się iloczyowi: Podobą
NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR
NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR M Zalewska Zakład Profilaktyki ZagrożeńŚrodowiskowych i Alergologii Analiza niezależności zmiennych jakościowych (test niezależności Chi-kwadrat)
µ = Test jest następujący: jeŝeli X > 0.01 to odrzucamy H. 0
7. Testowaie hipotez statystyczych 7. Populacja ma rozkład ciągły opisay fukcją gęstości f ( x) ( + ) x dla x [,]. Testowaa jest hipoteza, Ŝe wobec hipotezy alteratywej, Ŝe. Wioskujemy a podstawie jedoelemetowej
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy
będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,
Zadaie iech X, X,, X 6 będą iezależymi zmieymi losowymi z rozkładu jedostajego a przedziale ( 0, ), a Y, Y,, Y6 iezależymi zmieymi losowymi z rozkładu jedostajego a przedziale ( 0, ), gdzie, są iezaymi
MACIERZE STOCHASTYCZNE
MACIERZE STOCHASTYCZNE p ij - prawdopodobieństwo przejścia od stau i do stau j w jedym (dowolym) kroku, [p ij ]- macierz prawdopodobieństw przejść (w jedym kroku), Własości macierzy prawdopodobieństw przejść:
H brak zgodności rozkładu z zakładanym
WSPÓŁZALEŻNOŚĆ PROCESÓW MASOWYCH Test zgodości H : rozład jest zgody z załadaym 0 : H bra zgodości rozładu z załadaym statystya: p emp i p obszar rytyczy: K ;, i gdzie liczba ategorii p Przyład: Wyoujemy
Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste
Statystyka opisowa Miary statystycze: 1. miary położeia a) średia z próby x = 1 x = 1 x = 1 x i - szereg wyliczający x i i - szereg rozdzielczy puktowy x i i - szereg rozdzielczy przedziałowy, gdzie x
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!
Pracownia statystyczno-filogenetyczna Liczba punktów (wypełnia KGOB) / 30 PESEL Imię i nazwisko Grupa Nr Czas: 90 min. Łączna liczba punktów do zdobycia: 30 Czerwona Niebieska Zielona Żółta Zaznacz znakiem
Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona
Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności
dr hab. Dariusz Piwczyński, prof. nadzw. UTP
dr hab. Dariusz Piwczyński, prof. nadzw. UTP Cechy jakościowe są to cechy, których jednoznaczne i oczywiste scharakteryzowanie za pomocą liczb jest niemożliwe lub bardzo utrudnione. nominalna porządek
ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y
Zadaie. Łącza wartość szkód z pewego ubezpieczeia W = Y + Y +... + YN ma rozkład złożoy Poissoa z oczekiwaą liczbą szkód rówą λ i rozkładem wartości pojedyczej szkody takim, że ( Y { 0,,,3,... }) =. Niech:
Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA
Aaliza iepewości pomiarowych w esperymetach fizyczych Ćwiczeia rachuowe TEST ZGODNOŚCI χ PEARSONA ROZKŁAD GAUSSA UWAGA: Na stroie, z tórej pobrałaś/pobrałeś istrucję zajduje się gotowy do załadowaia arusz
Chemia Teoretyczna I (6).
Chemia Teoretycza I (6). NajwaŜiejsze rówaia róŝiczkowe drugiego rzędu o stałych współczyikach w chemii i fizyce cząstka w jedowymiarowej studi potecjału Cząstka w jedowymiarowej studi potecjału Przez
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
1 Układy równań liniowych
Katarzya Borkowska, Wykłady dla EIT, UTP Układy rówań liiowych Defiicja.. Układem U m rówań liiowych o iewiadomych azywamy układ postaci: U: a x + a 2 x 2 +... + a x =b, a 2 x + a 22 x 2 +... + a 2 x =b
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
x 1 2 3 t 1 (x) 2 3 1 o 1 : x 1 2 3 s 3 (x) 2 1 3. Tym samym S(3) = {id 3,o 1,o 2,s 1,s 2,s 3 }. W zbiorze S(n) definiujemy działanie wzorem
9.1. Izomorfizmy algebr.. Wykład Przykłady: 13) Działaia w grupach często wygodie jest zapisywać w tabelkach Cayleya. Na przykład tabelka działań w grupie Z 5, 5) wygląda astępująco: 5 1 3 1 1 3 1 3 3
O TESTOWANIU ISTOTNOŚCI WSPÓŁCZYNNIKÓW KORELACJI CZĄSTKOWEJ I WIELORAKIEJ DLA WIELOWYMIAROWYCH TABLIC WIELODZIELCZYCH
Grzegorz Kończak Uiwersytet Ekoomiczy w Katowicach O TESTOWANIU ISTOTNOŚCI WSPÓŁCZYNNIKÓW KORELACJI CZĄSTKOWEJ I WIELORAKIEJ DLA WIELOWYMIAROWYCH TABLIC WIELODZIELCZYCH Wprowadzeie Do ajważiejszych zagadień
ZADANIA NA ĆWICZENIA 3 I 4
Agata Boratyńska Statystyka aktuariala... 1 ZADANIA NA ĆWICZENIA 3 I 4 1. Wygeeruj szkody dla polis z kolejych lat wg rozkładu P (N = 1) = 0, 1 P (N = 0) = 0, 9, gdzie N jest liczbą szkód z jedej polisy.
Statystyka matematyczna. Wykład V. Parametryczne testy istotności
Statystyka matematyczna. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Weryfikacja hipotezy o równości wartości średnich w dwóch populacjach 2 3 Weryfikacja hipotezy o równości wartości średnich
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
(X i X) 2. n 1. X m S
Wykład 8. Przedziały ufości i testowaie hipotez A gdy ie zamy wariacji σ 2? Załóżmy, że X ma rozkład ormaly, ale ie zamy wartości ai m ai σ 2. Jak wtedy szacować wartość średią m? Przypomijmy, że Wtedy
UKŁADY RÓWNAŃ LINOWYCH
Ekoeergetyka Matematyka. Wykład 4. UKŁADY RÓWNAŃ LINOWYCH Defiicja (Układ rówań liiowych, rozwiązaie układu rówań) Układem m rówań liiowych z iewiadomymi,,,, gdzie m, azywamy układ rówań postaci: a a a
Analiza wariancji. dr Janusz Górczyński
Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik
Wykład 8 Dane kategoryczne
Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych
3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elemety kombiatoryki 2. Zmiee losowe i ich rozkłady 3. Populacje i próby daych, estymacja parametrów 4. Testowaie hipotez 5. Testy parametrycze 6. Testy
d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem
d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistycza Defiicja Odwzorowaie X: Ω R d azywamy d-wymiarowym wektorem losowym jeśli dla każdego (x 1, x 2,,x d ) є R d zbiór Uwaga {ω є Ω: X(ω)
θx θ 1, dla 0 < x < 1, 0, poza tym,
Zadaie 1. Niech X 1,..., X 8 będzie próbą z rozkładu ormalego z wartością oczekiwaą θ i wariacją 1. Niezay parametr θ jest z kolei zmieą losową o rozkładzie ormalym z wartością oczekiwaą 0 i wariacją 1.
STATYSTYKA OPISOWA PODSTAWOWE WZORY
MIARY POŁOŻENIA Średia Dla daych idywidualych: STATYSTYKA OPISOWA PODSTAWOWE WZORY Q i = x lmi + i mi 1 4 j h m i mi x = 1 x i x = 1 i ẋ i gdzie ẋ i środek i-tego przedziału i liczość i- tego przedziału
Ćwiczenie: Test chi 2 i miary na nim oparte.
Ćwiczeie: Test chi 2 i miary a im oparte. Zadaie (MS EXCEL) Czy istieje zależość między płcią a paleiem papierosów? 1. W arkuszu Excel utworzyć dwie tabele 2. Uzupełić wartości w tabeli z daymi obserwowaymi
Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa
Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Test serii (test Walda-Wolfowitza) Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane
Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny
TEMATYKA: Regresja liiowa dla prostej i płaszczyzy Ćwiczeia r 5 DEFINICJE: Regresja: metoda statystycza pozwalająca a badaie związku pomiędzy wielkościami daych i przewidywaie a tej podstawie iezaych wartości
ZSTA LMO Zadania na ćwiczenia
ZSTA LMO Zadaia a ćwiczeia Efektywość estymatorów ieobciążoych Zadaie 1. Zakładamy, że badaa cecha X populacji ma rozkład Poissoa πλ, gdzie λ > 0 jest parametrem. Poadto, iech X = X 1, X,..., X będzie
Elementy modelowania matematycznego
Elemety modelowaia matematyczego Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Modelowaie daych (ilościowe): Metody statystycze: estymacja parametrów modelu,
Zadania z algebry liniowej - sem. I Liczby zespolone
Zadaia z algebry liiowej - sem. I Liczby zespoloe Defiicja 1. Parę uporządkowaą liczb rzeczywistych x, y azywamy liczbą zespoloą i ozaczamy z = x, y. Zbiór wszystkich liczb zespoloych ozaczamy przez C
Geometrycznie o liczbach
Geometryczie o liczbach Geometryczie o liczbach Łukasz Bożyk Dodatią liczbę całkowitą moża iterpretować jako pole pewej figury składającej się z kwadratów jedostkowych Te prosty pomysł pozwala w aturaly
Wykład 11 ( ). Przedziały ufności dla średniej
Wykład 11 (14.05.07). Przedziały ufości dla średiej Przykład Cea metra kwadratowego (w tys. zł) z dla 14 losowo wybraych mieszkań w mieście A: 3,75; 3,89; 5,09; 3,77; 3,53; 2,82; 3,16; 2,79; 4,34; 3,61;
SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY
SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY Weryfikacja hipotez statystyczych WNIOSKOWANIE STATYSTYCZNE Wioskowaie statystycze, to proces uogóliaia wyików uzyskaych a podstawie próby a całą
Jarosław Wróblewski Analiza Matematyczna 1A, zima 2012/13. Ciągi.
Jarosław Wróblewski Aaliza Matematycza 1A, zima 2012/13 Ciągi. Ćwiczeia 5.11.2012: zad. 140-173 Kolokwium r 5, 6.11.2012: materiał z zad. 1-173 Ćwiczeia 12.11.2012: zad. 174-190 13.11.2012: zajęcia czwartkowe
... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X
Matematyka ubezpieczeń majątkowych.0.0 r. Zadaie. Mamy day ciąg liczb q, q,..., q z przedziału 0,. Rozważmy trzy zmiee losowe: o X X X... X, gdzie X i ma rozkład dwumiaowy o parametrach,q i, i wszystkie
Prawdopodobieństwo i statystyka r.
Zadaie. Wykoujemy rzuty symetryczą kością do gry do chwili uzyskaia drugiej szóstki. Niech Y ozacza zmieą losową rówą liczbie rzutów w których uzyskaliśmy ie wyiki iż szóstka a zmieą losową rówą liczbie
Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/17
Egzami, 18.02.2017, godz. 9:00-11:30 Zadaie 1. (22 pukty) W każdym z zadań 1.1-1.10 podaj w postaci uproszczoej kresy zbioru oraz apisz, czy kresy ależą do zbioru (apisz TAK albo NIE, ewetualie T albo
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
ZASTOSOWANIE METOD SYMULACYJNYCH W ANALIZIE WIELOWYMIAROWYCH TABLIC WIELODZIELCZYCH
Grzegorz Kończak Magdalena Chmielińska Uniwersytet Ekonomiczny w Katowicach ZASTOSOWANIE METOD SYMULACYJNYCH W ANALIZIE WIELOWYMIAROWYCH TABLIC WIELODZIELCZYCH Wprowadzenie W ostatnich latach w badaniach
1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.
Przedziały ufości W tym rozdziale będziemy zajmować się przede wszystkim zadaiami związaymi z przedziałami ufości Będą as rówież iteresować statystki pozycyje oraz estymatory ajwiększej wiarygodości (Eg
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Egzaminy. na wyższe uczelnie 2003. zadania
zadaia Egzamiy wstępe a wyższe uczelie 003 I. Akademia Ekoomicza we Wrocławiu. Rozwiąż układ rówań Æ_ -9 y - 5 _ y = 5 _ -9 _. Dla jakiej wartości parametru a suma kwadratów rozwiązań rzeczywistych rówaia