VIII WYKŁAD STATYSTYKA. 7/05/2014 B8 sala 0.10B Godz. 15:15

Wielkość: px
Rozpocząć pokaz od strony:

Download "VIII WYKŁAD STATYSTYKA. 7/05/2014 B8 sala 0.10B Godz. 15:15"

Transkrypt

1 VIII WYKŁAD STATYSTYKA 7/05/2014 B8 sala 0.10B Godz. 15:15

2 WYKŁAD 8 WERFIKACJA HIPOTEZ STATYSTYCZNYCH NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

3 TEST ZGODNOŚCI χ 2 Problem: Populacja generalna ma dowolny rozkład o dystrybuancie należącej do pewnego zbioru Ω rozkładów o określonym typie postaci funkcyjnej dystrybuanty. Z populacji tej wylosowano niezależnie dużą próbę n-elementową, którą podzielono na r rozłącznych klas o liczebnościach n i w każdej klasie ( n=σ n i ). Otrzymano w ten sposób rozkład empiryczny. Na podstawie wyników tej próby sprawdzić hipotezę, że populacja generalna ma rozkład typu Ω, tzn: H o : F(x) є Ω, gdzie F(x) jest dystrybuantą populacji generalnej. Rozwiązanie: Z hipotetycznego rozkładu typu Ω obliczamy dla każdej z r klas wartości badanej cechy X prawdopodobieństwa p i, że zmienna losowa X o rozkładzie Ω przyjmuje wartości należące do klasy o numerze i. Z kolei mnożąc p i przez liczebność całej próby (n) otrzymuje się liczebności teoretyczne, które powinny były wystąpić w klasie i, gdyby populacja miała rozkład Ω, tzn gdyby H o była prawdziwa. Ze wszystkich liczebności praktycznych n i oraz hipotetycznych np i wyznacza się wartość statystyki: która ma rozkład χ 2 o k=r-j-1 stopniach swobody, gdzie j jest ilością parametrów szacowanych z próby Obszar krytyczny buduje się prawostronnie, wyznaczając. Jeśli: to H o należy odrzucić.

4 TEST ZGODNOŚCI χ 2 Cwiczenie 3. Losowa próba n=200 niezależnych wyników miesięcznych wydatków na żywność rodzin 3-osobowych dała następujące wyniki ( w tys.zł). Wydatki [kzł] 1,0-1,4 1,4-1,8 1,8-2, ,6 2,6 3,0 Liczba rodzin Zweryfikować na poziomie istotności α=0,05, że rozkład wydatków na żywność jest normalny. H o : F(x) є Ω gdzie Ω jest zbiorem wszystkich dystrybuant normalnych. Z tabeli uzyskujemy: s=0,43 kzł. Dalsze postępowanie znajduje się w poniższej tabeli, gdzie przedziału klasowego, a F(z i ) oznacza wartość dystrybuanty N(0,1) w punkcie z i.. dla prawego końca x i n i z i F(z i ) p i np i (n i -np i ) 2 1,4 15-1,39 0,082 0,082 16,4 1,96 0,12 1,8 45-0,46 0,323 0,241 48,2 10,24 0,21 2,2 70 0,46 0,677 0,354 70,8 0,64 0,01 2,6 50 1,39 0,918 0,241 48,2 3,24 0,07 3, ,082 16,4 12,96 0, , ,0 1,20 k=5-2-1=2 z tablicy rozkładu χ 2 : EXCEL, ROZKŁAD.CHI.ODW dla k=2 stopni swobody i α=0,05 mamy Ponieważ więc nie ma podstaw do odrzucenia H o

5 TEST NIEZALEŻNOŚCI χ 2 Badamy populację generalną ze względu na dwie cechy. Interesuje nas czy te cechy są ze sobą związane. Obie cechy są mierzalne: ANALIZA KORELACJI ( i REGRESJI) Przynajmniej jedna z nich jest niemierzalna ( np. zero-jedynkowa) TEST NIEZALEŻNOŚCI χ 2 TEST NIEZALEŻNOŚCI χ 2 : Wylosowano dużą próbę o liczebności n. Konstruujemy tablicę niezależności (o r wierszach i s kolumnach). W tabeli są elementy n ij gdzie i=1, 2,...r; j=1, 2,, s przy czym powinno być n ij 8. H o : cechy X i Y są niezależne czyli: P(X=x i, Y=y j )=P(X=x i )*P(Y=y j ) Wyznaczony z tablicy niezależności parametr 2 ma rozkład 2 o liczbie stopni swobody k= (r-1)(s-1). Prawostronny obszar krytyczny wyznaczamy z : ROZKŁAD.CHI.ODWR : 2 (α, k). Jeśli: 2 > 2 (α, k) to H o odrzucić (obie badane cechy są zależne)

6 TEST NIEZALEŻNOŚCI χ 2 (c.d) k= (r-1)(s-1) ROZKŁAD.CHI.ODW Jeśli: H o ODRZUCIĆ

7 TEST NIEZALEŻNOŚCI χ 2 (c.d) Przykład. W celu sprawdzenia czy nowy lek jest skuteczny na pewną chorobę wylosowano dwie grupy pacjentów chorych na tą chorobę. Pierwszej grupie o liczebności 120 podawano nowy lek, a drugiej o liczebności 80 dawano tradycyjne leki. Wyniki leczenia są w tabelce: Leczeni Bez poprawy Stan zdrowia po leczeniu Wyraźna Całkowite poprawa wyzdrowienie Badanym lekiem Tradycyjnie Na poziomie istotności α=0,001 zweryfikować hipotezę, że nowy lek poprawia istotnie stan zdrowia pacjentów. Rozwiązanie: Wysunięta hipotezę badawczą zamieniamy na hipotezę statystyczną, H o o niezależności obu badanych cech jakościowych (rodzaj leczenia i stan zdrowia po leczeniu). Jeżeli w oparciu o test niezależności 2 hipotezę H o należy odrzucić, to będzie oznaczać, że stan zdrowia po leczeniu zależy istotnie o zastosowania badanego leku => jego przydatność

8 TEST NIEZALEŻNOŚCI χ 2 (c.d) Leczeni Stan zdrowia po leczeniu Bez poprawy Wyraźna poprawa Całkowite wyzdrowienie n i. p i. Badanym lekiem ,60 Tradycyjnie ,40 n. j p. j 0,325 0,300 0,375 1, = = /200 = 0,60 65/200 = 0,325

9 TEST NIEZALEŻNOŚCI χ 2 (c.d) Leczeni Badanym lekiem Stan zdrowia po leczeniu Bez poprawy Wyraźna poprawa Całkowite wyzdrowienie n i. p i. 0,195 0,180 0, , ,130 0,120 0,150 Tradycyjnie , n. j p. j 0,325 0,300 0,375 1,00 0,325 *0,60 = 0,195 (p ij ) 0,325 *0,60 *200 = 0,195*200= 39 (np ij )

10 TEST NIEZALEŻNOŚCI χ 2 (c.d) n ij np ij (n ij - np ij ) 2 (n ij - np ij ) 2 / np ij ,26 0,44 5,00 13,88 0,67 7, ,75 2 =36,75 r=2; s=3 => k=(r-1)(s-1)=2 ROZKŁAD.CHI.ODWR => 2 (0,001, 2) =13,815 2 =36,75 > 2 (0,001, 2) =13,815 => H o odrzucić (podawanie pacjentom nowego leku w sposób istotny poprawia ich stan zdrowia)

11 TESTY SERII Definicja: Serią nazywamy każdy podciąg złożony z kolejnych elementów jednego rodzaju utworzony w ciągu uporządkowanych w dowolny sposób elementów dwóch rodzajów. Test losowości próby Dana jest populacja generalna o dowolnym rozkładzie. Z populacji tej pobrano próbę n-elementów. Sprawdzić hipotezę, że jest to próba losowa. Rozwiązanie: Z uporządkowanego wg. kolejności pobierania elementów do próby ciągu obliczamy medianę, me. Każdemu elementowi próby x i w tym ciągu przypisujemy symbol a jeśli x i <me, bądź symbol b jeżeli x i > me. Wyniki x i =me należy odrzucić. Otrzymujemy w ten sposób ciąg złożony z symboli a i b np. a bb aaaa bbbb a b aa b. W ciągu tym otrzymujemy pewną liczbę serii (tutaj 8). Statystyką k jest liczba serii. Przy założeniu prawdziwości hipotezy o losowości próby, liczba serii k ma znany i stablicowany rozkład zależny tylko od n 1 i n 2 liczebności elementów a i b.tablice rozkładu liczby serii podają taką wartość k α, że p(k k α )=α. Budujemy dwustronny obszar krytyczny dla przyjętego poziomu istotności, odczytując z tablic dwie wartości krytyczne k 1 i k 2, aby zachodziły relacje: Jeżeli zajdzie k 1 < k < k 2 to nie podstaw do odrzucenia hipotezy o losowości próby, w każdym innym przypadku, hipotezę tą odrzucamy.

12 ROZKŁAD SERII α=0,05 α=0,95 n 2 \ n n 1 \ n

13 Test losowości próby Ćwiczenie 3. W doświadczeniu farmakologicznym potrzebne są szczury o określonej wadze ciała. Po otwarciu klatki do próby wzięto pierwszych 15 zwierząt, które wyszły z klatki. Ich waga w [g] wynosiła kolejno: 530, 620, 560, 320, 480, 550, 490, 500, 460, 430, 380, 390, 360, 400, 370, Na poziomie istotności α=0,10 zweryfikować hipotezę, że taki dobór zwierząt do próby jest losowy. Rozwiązanie: Wyznaczamy medianę, która wynosi: me= 460 i wg. opisanego testu tworzymy ciąg: bbb a bbbb aaaaaa, stąd liczba serii k=4, liczba elementów a wynosi n 1 =7; liczba elementów b wynosi n 2 =7. Z tablicy rozkładu serii odczytujemy dla α=0,10 wartości krytyczne k 1 =4 oraz k 2 =11, wynika stąd, że hipotezę należy odrzucić ( otrzymaliśmy zbyt małą liczbę serii, k, by uznać próbę za losową. Prawdopodobnie dlatego, że najpierw z klatki wychodziły zwierzęta silniejsze, o większej wadze, potem mniejsze.

14 TEST SPRAWDZAJĄCY ŻE DWIE PRÓBY POCHODZĄ Z JEDNEJ POPULACJI Dane są 2 populacje generalne o dowolnych rozkładach badanej cechy. Wylosowano z nich próby o liczebnościach n 1 i n 2. Zweryfikować hipotezę że rozkłady nie różnią się, czyli hipotezę: H o : dwie próby pochodzą z jednej populacji. Rozwiązanie: Wyniki obu prób ustawiamy w jeden ciąg wg. rosnących wartości, oznaczając elementy próby z jednej populacji przez a, a z drugiej przez b. Odczytujemy liczbę serii k. Obszar krytyczny budujemy lewostronnie, odczytując z rozkładu serii dla odpowiednich α, n 1 i n 2 wartość krytyczną k α. Jeśli k k α to H o odrzucamy. Jeśli natomiast otrzymana liczb serii k spełnia nierówność k > k α to nie ma podstaw do odrzucenia hipotezy, że rozkłady populacji są takie same, czyli obie próby nie różnią się istotnie.

15 TEST SPRAWDZAJĄCY ŻE DWIE PRÓBY POCHODZĄ Z JEDNEJ POPULACJI (PRZYKŁAD) Przykład: Wykonano pomiary rezystancji elektrycznej dla 6-ciu wylosowanych próbek z dwu serii A i B preparatów i otrzymano następujące wyniki w kω: Próba A: 110, 112, 115, 98, 130, 123 Próba B: 88, 135, 140, 138, 95, 125. Za pomocą testu serii na poziomie istotności α=0,05 zweryfikować hipotezę, że obie próby pochodzą z jednej populacji o określonym rozkładzie. Rozwiązanie: Łączymy elementy obu prób ustawiając je w kolejności rosnącej: 88, 95, 98, 110, 112, 115, 123, 125, 130, 135, 138, 140 stąd: bb aaaaa b a bbb k=5; dla: α=0,05 ; n 1 =6 i n 2 =6 k α =3. Ponieważ: k=5 > 3= k α więc nie ma podstaw do odrzucenia H o => obie próby pochodzą z jednej populacji

16 TEST O LINIOWEJ POSTACI FUNKCJI REGRESJI Daną populację generalną badamy ze względu na dwie cechy: X i Y. Wylosowano z niej n elementów próby, otrzymując wyniki (x i, y i ). Na ich podstawie zweryfikować hipotezę, że funkcja regresji cechy Y względem X w populacji jest liniowa, tzn: y=ax+b Rozwiązanie: Z wyników próby metodą najmniejszych kwadratów wyznaczamy oszacowanie funkcji: oraz jej wartości dla wszystkich x i w próbie. Wartości y i z próby odpowiadające uporządkowanym wg. kolejności rosnącej x i oznaczamy symbolem a jeśli y i > (tj punkt empiryczny leży ponad prostą regresji), oraz symbolem b gdy y i < (tj. punkt empiryczny leży poniżej prostej). W uporządkowanym wg rosnących wartości x i ciągu wyników odczytujemy liczbę serii k. Z tablicy rozkładu liczby serii odczytujemy dla n 1 i n 2 oraz poziomu istotności α taką wartość krytyczną k α by p( k k α )=α. Jeśli otrzymana liczb serii k spełnia nierówność k k α to hipotezę o tym że regresja Y względem X jest liniowa należy odrzucić. Gdy zaś k > k α to nie ma podstaw do odrzucenia hipotezy. Wnioskowanie to jest słuszne gdy najmniejsza liczba serii wynosi k=3.

17 TEST O LINIOWEJ POSTACI FUNKCJI REGRESJI PRZYKŁADY n 1 =7; n 2 =8; α=0,05=> k α =3 a k=3 H o odrzucić, tj. Funkcja regresji nieliniowa n 1 =7; n 2 =8; α=0,05=> k α =3 a k=4 Nie ma podstaw do odrzucenia H o tj. Funkcja regresji liniowa

18 TEST ZNAKÓW TEST, że DWIE PRÓBY POCHODZĄ Z TEJ SAMEJ POPULACJI Dane są dwie populacje generalne o ciągłych dystrybuantach F 1 (x) i F 2 (x). Z populacji tych wylosowano jednakową liczbę parami odpowiadających sobie n elementów. Na podstawie wyników tych prób sprawdzić hipotezę, że obie próby pochodzą z tej samej populacji tzn H o : F 1 (x) = F 2 (x). Rozwiązanie: Badamy znak różnicy wyników w obu próbach i znajdujemy liczbę tych znaków, których jest mniej, oznaczamy ją przez r. Dla ustalonego poziomu istotności α i dla liczby par wyników n z tablicy liczby znaków odczytujemy taką wartość r α, że p( r r α )=α. Jeśli zajdzie: r r α, to H o odrzucamy. Czyli dwie próby pochodzą z dwu różnych rozkładów. Gdyby jakaś para miała identyczne wyniki (ich różnica=0), to ją w teście odrzucamy.

19 n r n r n r n r r- ROZKŁAD (LICZBY ZNAKÓW) α=0, Dla n>90 r jest największa liczbą całkowitą mniejsza niż: gdzie k=0,

20 TEST, że DWIE PRÓBY POCHODZĄ Z TEJ SAMEJ POPULACJI TEST ZNAKÓW- PRZYKŁAD Przykład: Celem stwierdzenia czy zastosowane szkolenie zwiększa wydajność pracy robotników wylosowano próbę n=14 pracowników i zbadano ich średnia wydajność pracy przed i po przeszkoleniu. Otrzymano nastepujące wyniki (wydajność pracy mierzoną ilością sztuk wyprodukowanych na godzinę: WYDAJNOŚĆ [ sztuk/godz] Przed szkoleniem Po szkoleniu Wzrost (+), spadek (-) Za pomocą testu znaków, na poziomie istotności 0,05 zweryfikować hipotezę, że wydajność pracy przed szkoleniem i po szkoleniu jest taka sama. Liczba znaków minus : r= 4. Z tablicy znaków dla: α=0,05 ; n=14 odczytujemy wartość krytyczną: r α =2. Ponieważ r=4 >2= r α, więc nie ma podstaw do odrzucenia hipotezy zerowej o jednakowej wydajności przed i po szkoleniu.

21 TEST RANGOWANYCH ZNAKÓW TEST, że DWIE PRÓBY POCHODZĄ Z TEJ SAMEJ POPULACJI Dane są dwie populacje generalne o ciągłych dystrybuantach F 1 (x) i F 2 (x). Z populacji tych wylosowano jednakową liczbę parami odpowiadających sobie n elementów. Na podstawie wyników tych prób sprawdzić hipotezę, że obie próby pochodzą z tej samej populacji tzn H o : F 1 (x) = F 2 (x). Rozwiązanie: Obliczamy różnice wyników dla wszystkich par. Rangujemy wartości bezwzględne tych różnic (tzn nadajemy im kolejne numery poczynając od 1 dla najmniejszej co do wartości bewzględnej różnicy). Wyznaczone rangi piszemy w dwu grupach, oddzielnie dla różnic dodatnich i ujemnych. Sumując rangi w tych grupach uzyskujemy sumę rang T + dla różnic dodatnich i sumę rang T - dla różnic ujemnych. Statystyką T jest mniejsza z tych dwu sum rang, tzn T=min {T +, T - }, ma ona określony rozkład T Dla ustalonego α i n odczytujemy T α takie, że: p(t T α )=α. Gdy T T α wtedy H o odrzucamy. Gdy występują jednakowe wartości różnic, to każdej z nich nadajemy rangę będącą średnią arytmetyczną rang, jakie by miały, gdyby nie były jednakowe.

22 ROZKŁAD T n α=0,05 α=0,

23 TEST, że DWIE PRÓBY POCHODZĄ Z TEJ SAMEJ POPULACJI TEST RANGOWANYCH ZNAKÓW- PRZYKŁAD Przykład: (Te same dane co w przykładze na test znaków). Celem stwierdzenia czy zastosowane szkolenie zwiększa wydajność pracy robotników wylosowano próbę n=14 pracowników i zbadano ich średnia wydajność pracy przed i po przeszkoleniu. Otrzymano następujące wyniki (wydajność pracy mierzoną ilością sztuk wyprodukowanych na godzinę: WYDAJNOŚĆ [ sztuk/godz] Przed szkoleniem(x i ) Po szkoleniu (y i ) y i -x i R + i 7 9, ,5 13 R - i Za pomocą testu rangowanych znaków, na poziomie istotności 0,05 zweryfikować hipotezę, że wydajność pracy przed szkoleniem i po szkoleniu jest taka sama. Z Tabeli: T + = suma R + i = 82,0 oraz T - = suma R - i =23,0, stąd: T=min {T +, T - }=23. Dla α=0,05 i n=14 otrzymujemy z rozkładu T: T α =21. Ponieważ T=23 >21= T α, więc nie ma podstaw do odrzucenia hipotezy zerowej o jednakowej wydajności przed i po szkoleniu.

24 TEST MEDIANY Dane są dwie populacje generalne o rozkładach dowolnych z dowolnymi dystrybuantami F 1 (x) i F 2 (x). Z populacji tych wylosowano dwie próby o liczebnościach n 1 i n 2. Na podstawie wyników tych prób sprawdzić hipotezę, że obie próby pochodzą z tej samej populacji tzn H o : F 1 (x) = F 2 (x). Rozwiązanie: Z wyników obu prób tworzymy jeden ciąg niemalejący, ustawiając wyniki w kolejności rosnącej. Wyznaczamy jego medianę me. Grupujemy wszystkie obserwacje w tablicę: Wyniki Próba I Próba II Razem > me me Razem Obliczamy statystykę χ 2 wg poniższego równania, rozkładu odwrotnego χ 2 Dla k=1 odczytujemy wartość krytyczną, by p( χ 2 χ 2 α)=α Jeśli zachodzi χ 2 χ 2 α to H o odrzucamy.

25 TEST MEDIANY (PRZYKŁAD) W dwu przedsiębiorstwach budowlanych A i B sporządzono próbki betonu. Wyniki badania wytrzymałości na ściskanie w MPa wynosiły: A: 19,0; 20,6; 20,6; 21,0; 21,2; 18,9; 19,8; 20,5; 21,6; 19,0; 19,9; 20,0; 17,5; 22,4; 21,9; 20,5; 20,0; 21,3; 18,0; 17,6; 19,6; 20,4; 21,9; 19,6; 20,8; 21,2 B: 20,2; 20,9; 18,6; 19,5; 22,5; 24,0; 21,5; 17,4; 19,5; 20,1; 19,3; 21,7; 20,1; 18,8; 18,1; 20,3; 22,9; 23,3; 18,5; 19,5; 21,1; 23,1; 21,7; 22,9; 22,5; 22,9; 22,0; 21,7; 20,9; 19,4 Na poziomie istotności 0,05 za pomocą testu mediany zweryfikować hipotezę, że oba przedsiębiorstwa wykonały beton o tej samej wydajności. Tworzymy z obu zbiorów wyników ciąg niemalejący n 1 +n 2 =26+30=56 me=1/2 * (x 28 +x 29 ) = 20,5 Wyniki Przedsiębiorstwo A Przedsiębiorstwo B Razem > me=20, me=20, Razem Traktując tę tablicę, jako tablicę niezależności obliczamy z niej wartość statystyki: =0,65 Ma ona rozkład 2 z k=(2-1)*(2-1) = 1 stopniem swobody. Odczytujemy wartość krytyczną: 2 (0,05; 1)=3,841. Ponieważ: 2 =0.65 < 3.841= 2 (0,05; 1) więc nie ma podstaw do odrzucenia H o (oba przedsiębiorstwa produkują beton o jednakowej wytrzymałości.

26 TEST SUMY RANG Jednym z najwygodniejszych, a równocześnie dość precyzyjnych testów dla wielu prób, jest tzw test sumy rang. Wartości uzyskanych w próbach nie klasyfikuje się jedynie na dwie grupy, jak w teście mediany, ale ustawia się je wg kolejności rosnącej i nadaje im rangi (tj kolejne numery). Problem: Danych jest k populacji generalnych o dowolnych rozkładach z ciągłymi dystrybuantami F 1 (x), F 2 (x),, F k (x). Z każdej tej populacji wylosowano niezależnie n i elementów do próby( i=1,2,, k). Na podstawie wyników tych prób sprawdzić hipotezę, że wszystkie próby pochodzą z tej samej populacji tzn H o : F 1 (x) = F 2 (x)=...=f k (x) Rozwiązanie: Wszystkim wynikom prób w liczbie n=σn i nadajemy rangi(numery kolejne) od 1 do n każdej próby oddzielnie wyznaczamy sumy rang T i ( i=1,2,, k). Z tych (przy jednakowych elementach dajemy średnią z mających kolejno nastąpić rang). Dla sum wyznaczamy wartość statystyki: Statystyka ta ma rozkład χ 2 z k-1 stopniami swobody, odczytujemy wartość krytyczną, by p( χ 2 χ 2 α)=α. Jeśli zachodzi χ 2 χ 2 α to H o odrzucamy.

27 TEST SUMY RANG (PRZYKŁAD) Przykład. Z 3 zakładów produkujących telewizory wylosowano odpowiednio: n 1 =10, n 2 =8, n 3 =12 sztuk i otrzymano następujące wyniki ich czułości w [μv]: Na poziomie istotności α=0,05 za pomocą testu sumy rang zweryfikować hipotezę, że czułość telewizorów, produkowanych przez te zakłady jest jednakowa. Rozwiązanie: Ogólna liczba wyników próby wynosi; n=n 1 +n 2 +n 3 =30.Nadajemy tym wynikom od najmniejszego do największego, kolejno rangi od 1 do 30: Zakład A Zakład B Zakład C Wynik Wynik Wynik

28 TEST SUMY RANG (PRZYKŁAD) Zakład A Zakład B Zakład C Wynik ranga Wynik ranga Wynik ranga = 8,29, liczba stopni swobody wynosi: 3-1=2, dla α=0,05 mamy: 2 (0,05; 2)=5,991 Ponieważ: 2 =8,29 > 5,991= 2 (0,05;2) Więc hipotezę H o należy odrzucić (tzn. wyprodukowane telewizory w A, B, C mają różną czułość) ,5 8, ,5 4 22, , ,5 27 Suma T 1 =127 Suma T 2 =85 Suma T 3 =253

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI ANALIZA KORELACJI Korelacja 1. Współczynnik korelacji 2. Współczynnik korelacji liniowej definicja 3. Estymacja współczynnika korelacji 4. Testy istotności

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Test serii (test Walda-Wolfowitza) Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI Korelacja 1. Współczynnik korelacji 2. Współczynnik korelacji liniowej definicja 3. Estymacja współczynnika korelacji 4. Testy istotności współczynnika korelacji

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Wykład 9 Testy rangowe w problemie dwóch prób

Wykład 9 Testy rangowe w problemie dwóch prób Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Wykład 10 Testy jednorodności rozkładów

Wykład 10 Testy jednorodności rozkładów Wykład 10 Testy jednorodności rozkładów Wrocław, 16 maja 2018 Test Znaków test jednorodności rozkładów nieparametryczny odpowiednik testu t-studenta dla prób zależnych brak normalności rozkładów Test Znaków

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15 VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,

Bardziej szczegółowo

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1. Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej

Bardziej szczegółowo

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0 Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

Zawartość. Zawartość

Zawartość. Zawartość Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami

Bardziej szczegółowo

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY

Bardziej szczegółowo

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas: ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań

Bardziej szczegółowo

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407 Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na

Bardziej szczegółowo

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI 1. Test dla dwóch średnich P.G. 2. Testy dla wskaźnika struktury 3. Testy dla wariancji DECYZJE Obszar krytyczny od pozostałej

Bardziej szczegółowo

Elementarne metody statystyczne 9

Elementarne metody statystyczne 9 Elementarne metody statystyczne 9 Wybrane testy nieparametryczne - ciąg dalszy Test McNemary W teście takim dysponujemy próbami losowymi z dwóch populacji zależnych pewnej cechy X. Wyniki poszczególnych

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1 Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.

Bardziej szczegółowo

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11 Testy zgodności Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej 27. Nieparametryczne testy zgodności Weryfikacja

Bardziej szczegółowo

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1). PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę) PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów Wstęp do probabilistyki i statystyki Wykład 4. Statystyki i estymacja parametrów dr hab.inż. Katarzyna Zakrzewska, prof.agh, Katedra Elektroniki, WIET AGH Wstęp do probabilistyki i statystyki. Wykład 4

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Przykład 1. (A. Łomnicki)

Przykład 1. (A. Łomnicki) Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15 X WYKŁAD STATYSTYKA 14/05/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 10 ANALIZA KORELACJI Korelacja 1. Współczynnik korelacji 2. Kowariancja 3. Współczynnik korelacji liniowej definicja 4. Estymacja współczynnika

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.

Bardziej szczegółowo

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna Ćwiczenie 4 ANALIZA KORELACJI, BADANIE NIEZALEŻNOŚCI Analiza korelacji jest działem statystyki zajmującym się badaniem zależności pomiędzy rozkładami dwu lub więcej badanych cech w populacji generalnej.

Bardziej szczegółowo

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1 Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, Ŝe 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.

Bardziej szczegółowo

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

STATYSTYKA

STATYSTYKA Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym

Bardziej szczegółowo

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

WYKŁAD 8 ANALIZA REGRESJI

WYKŁAD 8 ANALIZA REGRESJI WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej

Bardziej szczegółowo

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde badanie naukowe rozpoczyna

Bardziej szczegółowo

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Korelacja krzywoliniowa i współzależność cech niemierzalnych Korelacja krzywoliniowa i współzależność cech niemierzalnych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej

Bardziej szczegółowo

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów

Bardziej szczegółowo

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007 Weryfikacja modelu Paweł Cibis pawel@cibis.pl 12 maja 2007 1 Badanie normalności rozkładu elementu losowego Test Hellwiga dla małej próby Test Kołmogorowa dla dużej próby 2 Testy Pakiet Analiza Danych

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Wykład 11 Testowanie jednorodności

Wykład 11 Testowanie jednorodności Wykład 11 Testowanie jednorodności Wrocław, 17 maja 2018 Test χ 2 jednorodności Niech X i, i = 1, 2,..., k będą niezależnymi zmiennymi losowymi typu dyskretnego przyjmującymi wartości z 1, z 2,..., z l,

Bardziej szczegółowo

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH Co to są hipotezy statystyczne? Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej. Dzielimy je

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Przypuśdmy, że mamy do czynienia z następującą sytuacją: nieznany jest rozkład F rządzący pewnym zjawiskiem losowym. Dysponujemy konkretną próbą losową ( x1, x2,..., xn

Bardziej szczegółowo

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym Badanie zgodności z określonym rozkładem H 0 : Cecha X ma rozkład F F jest dowolnym rozkładem prawdopodobieństwa Test chi kwadrat zgodności F jest rozkładem ciągłym Test Kołmogorowa F jest rozkładem normalnym

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność

Bardziej szczegółowo

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 Karl Popper... no matter how many instances of white swans we may have observed, this does not

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

POLITECHNIKA OPOLSKA

POLITECHNIKA OPOLSKA POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych

Bardziej szczegółowo

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1 Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zaleŝy

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych cd. Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:

Bardziej szczegółowo

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić). Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano

Bardziej szczegółowo

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N = HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki

Bardziej szczegółowo

Zadanie 1. Analiza Analiza rozkładu

Zadanie 1. Analiza Analiza rozkładu Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych Testowanie hipotez statystycznych Ewa Szczurek szczurek@mimuw.edu.pl Instytut Informatyki Uniwersytet Warszawski 1/23 Testowanie hipotez średniej w R Test istotności dla wartości

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Statystyka matematyczna. Wykład VI. Zesty zgodności

Statystyka matematyczna. Wykład VI. Zesty zgodności Statystyka matematyczna. Wykład VI. e-mail:e.kozlovski@pollub.pl Spis treści 1 Testy zgodności 2 Test Shapiro-Wilka Test Kołmogorowa - Smirnowa Test Lillieforsa Test Jarque-Bera Testy zgodności Niech x

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Test t-studenta dla jednej średniej

Test t-studenta dla jednej średniej Test t-studenta dla jednej średniej Hipoteza zerowa: Średnia wartość zmiennej w populacji jest równa określonej wartości a 0 (a = a 0 ). Hipoteza alternatywna 1.: Średnia wartość zmiennej w populacji jest

Bardziej szczegółowo