Podstawy wnioskowania statystycznego

Podobne dokumenty
Porównanie dwóch rozkładów normalnych

hipotez statystycznych

Weryfikacja hipotez statystycznych

Estymacja parametrów rozkładu cechy

1.1 Wstęp Literatura... 1

Porównanie wielu rozkładów normalnych

1 Weryfikacja hipotez statystycznych

Statystyka matematyczna. w zastosowaniach

Elementy Rachunek prawdopodobieństwa

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Elementy rachunku prawdopodobieństwa. Statystyka matematyczna. w zastosowaniach

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez statystycznych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Estymacja punktowa i przedziałowa

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Hipotezy statystyczne

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Hipotezy statystyczne

Testowanie hipotez statystycznych cd.

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Wnioskowanie statystyczne. Statystyka w 5

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Rozkłady statystyk z próby

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna i ekonometria

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Analiza wariancji. dr Janusz Górczyński

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

Statystyka matematyczna i ekonometria

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka opisowa. Robert Pietrzykowski.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

WYKŁAD 5 TEORIA ESTYMACJI II

Matematyka i statystyka matematyczna dla rolników w SGGW

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Weryfikacja hipotez statystycznych

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Statystyka w przykładach

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Metody probabilistyczne

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

STATYSTYKA

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA

1 Podstawy rachunku prawdopodobieństwa

166 Wstęp do statystyki matematycznej

Spis treści 3 SPIS TREŚCI

Estymacja parametro w 1

Testowanie hipotez statystycznych.

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

PDF created with FinePrint pdffactory Pro trial version

1 Estymacja przedziałowa

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka matematyczna

Transkrypt:

P S S : naukapoświęconametodombadania(analizowania) zjawisk masowych; polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w postaci zestawień tabelarycznych, wykresów, itp; posługuje się rachunkiem prawdopodobieństwa Podstawy wnioskowania statystycznego Wojciech Zieliński STATYSTYKA MATEMATYCZNA: dział matematyki stosowanej oparty na rachunku prawdopodobieństwa; zajmuje się badaniem zbiorów na podstawie znajomości własności ich części Encyklopedia Popularna PWN, Warszawa 1982 http:\\wojtekzielinskistatystykainfo http:\\biostatystykanzcwumedupl BIOSTATYSTYKA(biometria): nauka z pogranicza biologii i statystyki, adaptacja metod statystycznych na potrzeby prac badawczych w dziedzinie biologii, związanych przede wszystkim z medycyną, genetyką, fizjologią, antropologią, ekologią i rolnictwem WZ WUM Wnioskowanie 1 WZ WUM Wnioskowanie 2

Populacja Wnioski opopulacji FF F F F 5 2 4 1 5 27 29 12 8 33 M M M F F 8 8 6 6 8 40 52 33 38 22 M M F M M 9 10 7 11 9 35 73 30 50 67 M M F M M 14 12 8 14 11 68 75 40 64 69 F F M M M 9 8 11 10 15 54 40 51 55 66 Próba Wnioski zpróby Próba1: 5 2 4 1 5 Średniazpróby: 340 Próba2: 8 8 6 6 8 Średniazpróby: 720 Próba3: 910 711 9 Średniazpróby: 920 Próba4:1412 81411 Średniazpróby:1180 Próba5: 9 8111015 Średniazpróby:1060 Średnia populacji: 844 WZ WUM Wnioskowanie 3 WZ WUM Wnioskowanie 4

Zbiór obiektów z wyróżnioną cechą(cechami) Próba Wybrana część populacji podlegająca badaniu Cecha Wielkość losowa charakteryzująca obiekty danej populacji Pytania 844 Czy mając do dyspozycji tylko jedną próbę można ocenić na ile dobrze średnia z tej próby przybliża prawdziwą średnią? Co zrobić, by być pewniejszym wyniku? Cecha jakościowa Cecha przyjmująca wartości nie będące liczbami(np kolor, płeć, smakowitość) Cecha(ilościowa) skokowa Cecha przyjmująca pewne wartości liczbowe i nie przyjmująca wartości pośrednich(np ilość bakterii, ilość pracowników, ilość pasażerów) Cechy te nazywane są również dyskretnymi Cecha(ilościowa) ciągła Cecha przyjmująca wartości z pewnego przedziału liczbowego(np wzrost, waga, plon) WZ WUM Wnioskowanie 5 WZ WUM Wnioskowanie 6

J R!! " # $ # % & " ' wnioskowania statystycznego Oceniamy parametr θ cechy na podstawie próby X 1,X 2,,X n Niechˆθ(X 1,X 2,,X n )będzie jakąś oceną parametru θ Nieobciążoność Jeżeliśredniawartośćocenyˆθjestrównawartości parametruθ,toocenęˆθnazywamynieobciążoną Zmienna losowa X ma rozkład D(p), jeżeli P{X=1}=p=1 P{X=0} EX=p D 2 X=p(1 p) Minimalna wariancja Zdwóchróżnychnieobciążonychocenˆθorazˆθtego samego parametru θ za lepszą uznajemy tę, która średnio przyjmuje wartości bliższe parametrowi θ Minimalny błąd średniokwadratowy Jeżeliocenaˆθniejestnieobciążona,towówczasjako miernik jakości stosuje się błąd średniokwadratowy Jest to uśrednienie obciążenia oraz wariancji Doświadczenie Bernoulliego Wykonujemy dwuwynikowe doświadczenie Wyniki nazywane są umownie sukces oraz porażka Prawdopodobieństwo sukcesu wynosi p(porażki: 1 p) Niech zmienną losową X będzie uzyskanie sukcesu Zmienna losowa X ma rozkład D(p) Przykłady Płeć osoby Wadliwość produktu WZ WUM Wnioskowanie 7 WZ WUM Wnioskowanie 8

( ) * +, - / / 0 1 2 3-4 ) 0 5 6 7 8 9 : ; < = 7 >? ; @ = A Zmienna losowa X ma rozkład B(n, p), jeżeli P n,p {X=k}= ( ) n p k (1 p) n k,k=0,1,,n k EX=np D 2 X=np(1 p) Schemat Bernoulliego Zmienną losową o rozkładzie D(p) obserwujemy n krotnie w sposób niezależny Niech zmienną losową X będzie ilość sukcesów ZmiennalosowaXmarozkładB(n,p) Przykłady Ilość nasion, z których wzeszły rośliny Ilość wadliwych produktów Popularność danej osobistości publicznej ZmiennalosowaXmarozkładnormalnyN(µ,σ 2 ) owartościśredniejµiwariancjiσ 2,jeżelijejfunkcja gęstości wyraża się wzorem f µ,σ 2(x)= 1 σ 2( x µ 2π e 1 σ ) 2, <x< EX=µ D 2 X=σ 2 Przykłady Błędy pomiarowe Ciężar ciała Zawartość białka w mięsie Standardowy rozkład normalny: N(0, 1) Dystrybuanta F(x) standardowego rozkładu normalnego(n(0, 1)) jest stablicowana F(x)=1 F( x) WZ WUM Wnioskowanie 9 WZ WUM Wnioskowanie 10

B C D E G H I K C L M H N K O Q T Uwotrzechsigm P{ X µ <σ}=068268 068 P{ X µ <2σ}=095450 095 P{ X µ <3σ}=099730 0997 µ=0 µ= 1 µ=1 0997 095 068 σ=05 σ=10 σ=20 µ σ µ µ+σ µ 2σ µ+2σ µ 3σ µ+3σ WZ WUM Wnioskowanie 11 WZ WUM Wnioskowanie 12

V W X Y Z [ \ ] [ ^ [ _ [ Z ` X _ a b c d e f g h i j d k l h m j n rozkładu cechy Estymacja parametrów Estymujemy parametr θ rozkładu cechy X Próba:X 1,X 2,,X n Próba(prosta):X 1,X 2,,X n Estymator średniej µ średnia arytmetyczna Estymator(punktowy) jest funkcją próby ˆθ=ˆθ(X 1,X 2,,X n ) X= 1 n n i=1 X i = X 1++X n n przybliżającą wartość parametru θ Przedział ufności(estymator przedziałowy) jest przedziałem o końcach zależnych od próby, który z pewnym z góry zadanym prawdopodobieństwem pokrywa nieznaną wartość parametru θ P{θ (θ(x 1,,X n ),θ(x 1,,X n ))}=1 α Poziom ufności: prawdopodobieństwo 1 α Co wpływa na długość d przedziału ufności? 1Licznośćpróby(nր= dց) 2Poziomufności(1 αր= dր) 3Wariancjacechy(σ 2 ց= dց) Estymatorwariancjiσ 2 wariancjapróbkowa S 2 = 1 n 1 n (X i X) 2 i=1 Suma kwadratów odchyleń od średniej varx= n (X i X) 2 = i=1 n Xi n X 2 2 i=1 Estymator odchylenia standardowego σ S= S 2 WZ WUM Wnioskowanie 13 WZ WUM Wnioskowanie 14

o p q s t u rdziałufnościdlaśredniej Wariancjaσ 2 jestnieznana Poziomufności:1 α vkład Napodstawiepróby11,12,08,09,12,13,10, 07, 08, 10 oszacować wartość średnią rozkładu obserwowanej cechy ( X t(α;n 1) S ) S, X+t(α;n 1) n n t(α; n 1): wartość krytyczna rozkładu t(studenta) z ν stopniami swobody Długośćprzedziału:d=2t(α;n 1) S n Przedziały jednostronne (, X+t(2α;n 1) S n ) ( X t(2α;n 1) S n, ) x= 11+12++10 10 =10 varx=(11 10) 2 ++(10 10) 2 =036 s 2 = 036 10 1 =004, s= s 2 =02 Poziomufności1 α=095,czyliα=005 t(005; 9) = 22622 t(005;9) s n =22622 02 10 =014 (1 014,1+014)=(086,114) Wniosek Średnia wartość cechy jest jakąś liczbą z przedziału(086, 114) Zaufanie do tego wniosku wynosi95% WZ WUM Wnioskowanie 15 WZ WUM Wnioskowanie 16

w x y { } ~ ~ ƒ zkład Oszacować przeciętną ilość punktów uzyskiwanych na klasówce n=300 xi =176566 x 2 i =107845302 x= 1 n xi = 176566 300 ( xi ) 2 =0589 varx= x 2 i 1 n Populacja: Słuchacze podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce Założenie: cechaxmarozkładnormalnyn(µ,σ 2 ) Zadanie: oszacować parametr µ =107845302 1765662 300 =392679 s 2 = 392679 300 1 =001313, s= s 2 =011460 t(005; 299) 196 t(005;299) s n =196 011460 300 =001297 (0589 0013,0589+0013)=(0576,0602) Odpowiedź: µ (0576, 0602) Technika statystyczna: przedział ufności dla średniej poziomufności1 α=095 Wniosek Przeciętna liczba punktów zdobywana na klasówce jest liczbą z przedziału(0576, 0602) Zaufanie do tego wniosku wynosi 95% WZ WUM Wnioskowanie 17 WZ WUM Wnioskowanie 18

ˆ Š działufnościdlawariancji Średnia µ jest nieznana Poziomufności:1 α kład Napodstawiepróby11,12,08,09,12,13,10, 07, 08, 10 oszacować zróżnicowanie rozkładu obserwowanej cechy ( ) varx varx χ 2( α 2 ;n 1), χ 2( 1 α 2 ;n 1) χ 2 (α;n 1)jeststablicowanąwartościąkrytyczną rozkładu chi kwadrat z ν stopniami swobody Przedziały jednostronne ( ) varx 0, χ 2 (α;n 1) ( varx χ 2 (1 α;n 1), ) x= 11+12++10 10 =10 varx=(11 10) 2 ++(10 10) 2 =036 s 2 = 036 10 1 =004, s= s 2 =02 Poziomufności1 α=095,czyliα=005 χ 2( α ) 2 ;n 1 =χ 2 (0025;9)=190228 χ 2( 1 α )=χ 2 ;n 1 2 (0975;9)=27004 ( ) 036 190228, 036 =(0019, 0133) 27004 Wniosek Wariancja cechy jest jakąś liczbą z przedziału(0019, 0133) Zaufanie do tego wniosku wynosi95% WZ WUM Wnioskowanie 19 WZ WUM Wnioskowanie 20

Œ Ž działufnościdla odchylenia standardowego Średnia µ jest nieznana Poziomufności:1 α ( varx χ 2 ( α 2 ;n 1), Przedziały jednostronne ) varx χ 2 (1 α 2 ;n 1) ( ) varx 0, χ 2 (α;n 1) ( ) varx χ 2 (1 α;n 1), Przykład(cd) Przedział ufności dla odchylenia standardowego: ( 0019, 0133)=(0136,0365) kład Oszacować zróżnicowanie ilości punktów uzyskiwanych na klasówce n=300 xi =176566 x 2 i =107845302 Populacja: Słuchacze podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce Założenie: cechaxmarozkładnormalnyn(µ,σ 2 ) Zadanie: oszacować parametr σ Technika statystyczna: przedział ufności dla odchylenia standardowego poziom ufności 095 WZ WUM Wnioskowanie 21 WZ WUM Wnioskowanie 22

š œ ž Ÿ ž x=0589 varx=392679 χ 2( α 2 ;n 1 ) =χ 2 (0025;299)=34879420 χ 2( 1 α 2 ;n 1 )=χ 2 (0975;299)=25299251 ( ) 392679 392679 34879420, =(010610, 012458) 25299251 Estymacja parametru p frakcja, wskaźnik struktury Próba:X 1,,X n (X i =0lub =1) k= n i=1 X i ilośćjedynek(sukcesów) Estymator punktowy: ˆp= k n Odpowiedź: σ (010610, 012458) Przedział ufności na poziomie ufności 1 α (p 1 (1 α 2 ;k,n k ), 1 p 1 ( 1 α 2 ;n k,k )) Wniosek Odchylenie standardowe liczby punktów zdobywanych na klasówce jest liczbą z przedziału (0106, 0125) Zaufanie do tego wniosku wynosi 95% Jednostronne przedziały ufności (p 1 (1 α;k,n k),1) (0,1 p 1 (1 α;n k,k)) WZ WUM Wnioskowanie 23 WZ WUM Wnioskowanie 24

ª «kład Wśród 20 zbadanych detali znaleziono dwa braki Ocenić na tej podstawie wadliwość produkcji Cecha X jakość detalu(dobry, zły) Sukces detal wybrakowany Pytanie: p =? n=20,k=2= ˆp=2/20=01 Poziomufności1 α=09,czyliα=01 p 1 ( 1 α 2 ;k,n k )=p 1 (095;2,18)=00123 ( ±bliżonyprzedziałufności ) ˆp(1 ˆp) ˆp(1 ˆp) ˆp u 1 α/2, ˆp+u 1 α/2 n n u α jestkwantylemrzęduαrozkładun(0,1) Przykład(cd) n=200,k=20= ˆp=20/200=01 Poziomufności1 α=09,czyliα=01 u 1 α/2 =u 095 =16449 p 1 ( 1 α 2 ;n k,k )=p 1 (095;18,2)=06830 (00123, 1 06830) =(00123, 03170) 01(1 01) 01 16449 200 01(1 01) 01+16449 200 =00651 =01349 Wniosek Wadliwość produkcji wyraża się liczbą z przedziału(123%, 3170%) Zaufanie do wniosku wynosi90% Wniosek Wadliwość produkcji wyraża się liczbą z przedziału(651%, 1349%) Zaufanie do wniosku wynosi90% WZ WUM Wnioskowanie 25 WZ WUM Wnioskowanie 26

² ³ ¹ º» ¼ ½ ¹ ¾ µkład Oszacować odsetek ocen dostatecznych otrzymywanych na klasówce n=300 k=88 p= 88 300 =029 u 1 α/2 =u 0975 =196 029(1 029) 029 196 300 =02387 Populacja: Słuchacze podstawowego kursu statystyki 029+196 029(1 029) 300 =03413 Cecha X: ocena dostateczna z klasówki Założenie: cechaxmarozkładd(p) Odpowiedź: p (02387, 03413) Zadanie: oszacować parametr p Technika statystyczna: przybliżony przedział ufności dla prawdopodobieństwa poziom ufności 095 Wniosek Odsetek ocen dostatecznych zdobywanych na klasówce jest liczbą z przedziału(2387%, 3413%) Zaufanie do tego wniosku wynosi 95% WZ WUM Wnioskowanie 27 WZ WUM Wnioskowanie 28

À Á Â Ã Ä Å Ä Æ Ç È Ã Â É Ê Ë Ì Í Î Ï Ð Ñ Ò Î Ó Ì Ô Õ Ó Ö Ø Ô Ù Ð Í Î Ó Õ rozkładów normalnych Ocenapunktowa: X1 X 2 Óµ1 µ2 Założenia: 1X 1 N(µ 1,σ 2 1),X 2 N(µ 2,σ 2 2) 2X 1,X 2 sąniezależne Ocenaµ 1 µ 2 orazσ 2 1/σ 2 2 Przedział ufności(poziom ufności 1 α) 1Założenieσ 2 1=σ 2 2 ( X 1 X 2 t(α;n 1 +n 2 2)s r, X 1 X 2 +t(α;n 1 +n 2 2)s r ) s 2 e= varx ( 1+varX 2 1 n 1 +n 2 2, s2 r=s 2 e + 1 ) n 1 n 2 Próby:X 11,,X 1n1 ;X 21,,X 2n2 2Bezzałożeniaσ 2 1=σ 2 2 X 1, varx 1, s 2 1= varx 1 n 1 1 X 2, varx 2, s 2 2= varx 2 n 2 1 ( X 1 X 2 V(α;n 1 1,n 2 1,c)s r, X 1 X 2 +V(α;n 1 1,n 2 1,c)s r ) s 2 r= ( ) s 2 1 + s2 2 n 1 n 2 c= s 2 1/n 1 s 2 1 /n 1+s 2 2 /n 2 V(α;n 1 1,n 2 1,c) wartośćkrytycznatestu Behrensa Fishera WZ WUM Wnioskowanie 29 WZ WUM Wnioskowanie 30

Ú Û Ü Þ ß à á â ã ä å á æ ÝkładOcenićróżnicęmiędzyśrednimiwynikami klasówki pań i panów Panowie: n 1 =138, x1i =82833, varx 1 =165841 Panie: n 2 =162, x2i =93733, varx 2 =223348 x 1 =060024, x 2 =057860, s 2 r= 165841+223348 138+162 2 = 0000175255 ( 1 138 + 1 ) 162 t(005;298) 196; t(005;298)s r =002595 Populacja 1: Słuchacze podstawowego kursu statystyki Populacja 2: Słuchaczki podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce Założenie: cechaxmawpopulacji1rozkładn(µ 1,σ 2 1) cechaxmawpopulacji2rozkładn(µ 2,σ 2 2) σ 2 1=σ 2 2 (060024 057860 ± 000034) =( 000431, 004759) Odpowiedź:µ 1 µ 2 ( 000431,004759) Wniosek Różnica średnich ilości punktów zdobywanych na klasówce przez panie i panów jest liczbą z przedziału ( 000431, 004759) Zaufanie do tego wniosku wynosi95% Zadanie:oszacowaćróżnicęµ 1 µ 2 Technika statystyczna: przedział ufności t dla różnicy średnich poziom ufności 095 Sugestia Ponieważ przedział obejmuje zero, więc możnauznać,żeµ 1 =µ 2 WZ WUM Wnioskowanie 31 WZ WUM Wnioskowanie 32

ç è é ê ë ì í î ï ë ð ñ ò ë ï ì ë ê è ó ô õ ö Ocenapunktowa:S 2 1/S 2 2 ìσ2 1/σ22 kładporównaćzróżnicowanieocenwyników klasówek pań i panów Panowie: n 1 =138, x1i =82833, varx 1 =165841 Przedział ufności(poziom ufności 1 α) Panie: n 2 =162, x2i =93733, varx 2 =223348 ( S 2 1 F S 2 2 ( 1 α ) 2 ;n 1 1,n 2 1, S 2 1 S 2 2 ( α F 2 ;n 1 1,n 2 1) ) Populacja 1: Słuchacze podstawowego kursu statystyki Populacja 2: Słuchaczki podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce F(α; u, v) jest stablicowaną wartością krytyczną rozkładu F Snedecora(Fishera Snedecora) F(1 α;u,v)= 1 F(α;v,u) Założenie: cechaxmawpopulacji1rozkładn(µ 1,σ 2 1) cechaxmawpopulacji2rozkładn(µ 2,σ 2 2) Zadanie:oszacowaćilorazσ 2 1/σ 2 2 Technika statystyczna: przedział ufności dla ilorazu wariancji poziom ufności 090 WZ WUM Wnioskowanie 33 WZ WUM Wnioskowanie 34

ø ù ú û ü ý þ ÿ û O P s 2 1= 165841 138 1 =001211, s2 2= 223348 162 1 =001387, F(005;137,161)=130936 1 F(095;137,161)= F(005;161,137) 1 = 131386 =076111 ( ) 001211 001387076111,001211 130936 =(066415, 114255) rozkładów dwupunktowych Założenia: 1X 1 D(p 1 ),X 2 D(p 2 ) 2X 1,X 2 sąniezależne Ocenap 1 p 2 Próby:X 11,,X 1n1 ;X 21,,X 2n2 (X ij =0lub1) n 1 n 2 k 1 = X 1i k 2 = i=1 i=1 X 12 ˆp 1 =k 1 /n 1 ˆp 2 =k 2 /n 2 ˆp=(k 1 +k 2 )/(n 1 +n 2 ) Odpowiedź:σ 2 1/σ 2 2 (066415,114255) Wniosek Iloraz wariancji ilości punktów zdobywanych na klasówce jest liczbą z przedziału(066415, 114255) Zaufanie do tego wniosku wynosi 90% Sugestia Ponieważ przedział obejmuje jedynkę, więcmożnauznać,żeσ 2 1=σ 2 2 Przedział ufności(poziom ufności 1 α) ˆp 1 ˆp 2 u 1 α 2 ˆp 1 ˆp 2 +u 1 α 2 ( 1 ˆp(1 ˆp) + 1 ), n 1 n 2 ( 1 ˆp(1 ˆp) + 1 ) n 1 n 2 WZ WUM Wnioskowanie 35 WZ WUM Wnioskowanie 36

kład Oszacować różnicę między niezaliczalnością klasówkizestatystykiprzezpanieipanównapodstawie dotychczasowych danych wiadomo, że na 162 pańniezaliczyłoklasówki46pańorazna138panów 30 uzyskało ocenę negatywną Populacja 1: Słuchacze podstawowego kursu statystyki Populacja 2: Słuchaczki podstawowego kursu statystyki n 1 =162 k 1 =46 n 2 =138 k 2 =30 ˆp 1 = k 1 n 1 = 46 162 =02840 ˆp 2= k 2 n 2 = 30 138 =02174 ˆp= (k 1+k 2 ) (n 1 +n 2 ) = (46+30) (162+138) =02533 ( 02533(1 02533) 1 196 300 162 + 1 ) =00987 138 Cecha X: uzyskanie z klasówki oceny negatywnej Założenie: cechaxmawpopulacji1rozkładd(p 1 ) cechaxmawpopulacji2rozkładd(p 2 ) Zadanie:oszacowaćróżnicęp 1 p 2 Technika statystyczna: przybliżony przedział ufności dla różnicy prawdopodobieństw poziomufności095:u 0975 =196 (02840 02174 00987,02840 02174+00987) ( 00321, 01653) Wniosek Różnica prawdopodobieństw jest liczbą z przedziału( 00321, 01653) Sugestia Ponieważ przedział obejmuje zero, więc odsetki pań i panów niezaliczających klasówki można traktować jako porównywalne WZ WUM Wnioskowanie 37 WZ WUM Wnioskowanie 38

W B! " # $ % & ' " ( ) * hipotez statystycznych Hipotezą statystyczną nazywamy dowolne przypuszczenie dotyczące rozkładu prawdopodobieństwa cechy w populacji OznaczenieH 0 Testem hipotezy statystycznej nazywamy postępowanie mające na celu odrzucenie lub nie odrzucenie hipotezy statystycznej Statystyką testową nazywamy funkcję próby na podstawie której wnioskuje się o odrzuceniu lub nie hipotezy statystycznej +nazywamybłądwnioskowania polegający na odrzuceniu hipotezy, gdy w rzeczywistości jest ona prawdziwa Błędem II rodzaju nazywamy błąd wnioskowania polegający na nieodrzuceniu hipotezy, gdy w rzeczywistości jest ona fałszywa Poziomem istotności nazywamy dowolną liczbę z przedziału(0, 1) określającą prawdopodobieństwo popełnienia błędu I rodzaju Oznaczenie: α Rzeczywistość: WniosekohipotezieH 0 hipotezah 0 nieodrzucać odrzucić prawdziwa prawidłowy nieprawidłowy nieprawdziwa nieprawidłowy prawidłowy Mocą testu nazywamy prawdopodobieństwo odrzucenia testowanej hipotezy, gdy jest ona nieprawdziwa, czyli prawdopodobieństwo nie popełnienia błędu II rodzaju Oznaczenie:1 β WZ WUM Wnioskowanie 39 WZ WUM Wnioskowanie 40

R, - / 0 1 2, 3 4 0 5 2 6 7 8 9 Porównanie z normą H 0 :µ=µ 0 CechaXmarozkładnormalnyN(µ,σ 2 ) Średniaµorazwariancjaσ 2 sąnieznane Test Studenta (poziom istotności α) Próba:X 1,,X n Statystyka testowa t emp = X µ 0 n S Wartośćkrytycznat(α;n 1) Jeżeli t emp >t(α;n 1),tohipotezęH 0 :µ=µ 0 odrzucamy :kładprzypuszczenie:maszynapakującakostki masła nastawiona na jednostkową masę 250 g uległa po pewnym czasie rozregulowaniu W celu weryfikacji tego przypuszczenia z bieżącej produkcji pobrano próbę otrzymując wyniki 254, 269, 254, 248, 263,256,258,261,264,258Czymożnanatejpodstawie sądzić, że maszyna uległa rozregulowaniu? Populacja: paczkowane kostki masła Cecha X: masa kostki masła Założenie: cechaxmarozkładnormalnyn(µ,σ 2 ) Formalizacja: Rozregulowanie maszyny może być interpretowane jako odejście od nominalnej wagi Zatem należy zbadać, czy średnia µ wynosi 250, czyli weryfikujemy hipotezęh 0 :µ=250 WZ WUM Wnioskowanie 41 WZ WUM Wnioskowanie 42

T ; < = >? @ A C D A D E C D E < F > A G M H I J K L J N test Studenta(test t) poziom istotności α = 005 Moctestu=1 P{błądIIrodzaju} Moctestu=P{odrzucenienieprawdziwejH 0 } MoctestuStudentahipotezyH 0 :µ=µ 0 Obliczenia x=2585,s 2 =3605,t emp =447 M(µ)=P{ t emp >t(α;n 1) X N(µ,σ 2 )} M(µ 0 )=α Wartość krytyczna: t(005; 9) = 22622 Odpowiedź: hipotezę odrzucamy n=10 n=20 n=30 Wniosek: maszyna uległa rozregulowaniu WZ WUM Wnioskowanie 43 WZ WUM Wnioskowanie 44

Q S U VdziałufnościatesthipotezyH0:µ=µ0 CechaX N(µ,σ 2 ) H 0 :µ=µ 0 H 0 nieodrzucamynapoziomieistotnościα t emp <t(α;n 1) t(α;n 1)< X µ 0 n<t(α;n 1) S ( µ 0 X t(α;n 1) S, X+t(α;n 1) S ) n n µ 0 należydoprzedziałuufności napoziomieufności1 α X0 :σ2=σ20 CechaXmarozkładnormalnyN(µ,σ 2 ) Średniaµorazwariancjaσ 2 sąnieznane Test chi kwadrat (poziom istotności α) Próba:X 1,,X n Statystyka testowa χ 2 emp= varx σ 2 0 Wartości krytyczne χ 2( 1 α 2 ;n 1) orazχ 2( α 2 ;n 1) Jeżeli χ 2 emp<χ 2( 1 α 2 ;n 1) lub χ 2 emp>χ 2( α 2 ;n 1), tohipotezęh 0 :σ 2 =σ 2 0odrzucamy WZ WUM Wnioskowanie 45 WZ WUM Wnioskowanie 46

Y Z [ ] ^ _ ` a b c d a e f a g _ ^ h b i ` j \kładnapodstawieobserwacjiprowadzonych przez długi okres czasu stwierdzono, że dzienny udój uzyskiwany w pewnym stadzie krów jest wielkością losową, zaś przeciętny dzienny udój mleka wyraża sie liczbą z przedziału(900, 1200) Rachunek finansowy pokazał, że produkcja mleka jest opłacalna, jeżeli całkowity dzienny udój będzie wynosił nie mniej niżd=700lmlekaprzezconajmniej280dniwroku W jaki sposób można zbadać, czy produkcja mleka jest opłacalna? Populacja: P{X d} p= 280 350 ( ) ( ) d µ d µd P{X d}=1 F 1 F σ σ ( ) ( ) d µd d µd 1 F 1 p F 1 p σ σ Cecha: całkowity dzienny udój Założenia: CechaXmarozkładN(µ,σ 2 ) µ d =900 µ µ g =1200 d µ d σ d,µ d orazpsąustalone,więc F 1 (1 p)=u 1 p ( ) 2 σ 2 σ0= 2 d µd =56472 u 1 p Produkcjamlekajestopłacalna,jeżeliwariancjaσ 2 dziennychudojówjestwiększaniżσ 2 0=56472 H 0 :σ 2 56472 WZ WUM Wnioskowanie 47 WZ WUM Wnioskowanie 48

k l m n o p q q r s t s u n v l r w x y z Porównanie z normą H 0 :p=p 0 CechaXmarozkładD(p) Próba:X 1,,X n (X i =0lub=1) Test przybliżony (poziom istotności α) Przypadek: n duże Statystyka testowa u emp = Y np 0 np0 (1 p 0 ) {kładwswojejoferciesprzedażystawurybnegojegowłaścicielpodaje,iżwstawieżyjeconajmniej tysiąc karpi Potencjalny nabywca zainteresowany jest sprawdzeniem prawdziwości tego twierdzeniawtymceluwyłowionostokarpiipozaobrączkowaniu ich wpuszczono je z powrotem do stawu Po jakimś czasie ponownie odłowiono sto ryb i stwierdzono, że wśród nich jest piętnaście zaobrączkowanych Czy w świetle uzyskanych wyników można reklamę uznać za prawdziwą? Populacja: ryby w stawie Cecha: zaobrączkowanie ryby Wartośćkrytycznau 1 α/2 Jeżeli u emp >u 1 α/2,toh 0 :p=p 0 odrzucamy Założenia: CechaXmarozkładD(p) WZ WUM Wnioskowanie 49 WZ WUM Wnioskowanie 50

} ~ ƒ ~ } ˆ Š Œ Ž Ž JeżeliwstawieżyjeconajmniejNryb,toodsetek zaobrączkowanych jest co najwyżej 100/N Zgodnie z twierdzeniem właściciela, N 1000, czyli odsetek ryb zaobrączkowanych nie przekracza 01 Technika statystyczna PrzybliżonytesthipotezyH 0 :p 01 Poziom istotności: α = 005 Obliczenia u emp = Y=15 n=100 Y np 0 np0 (1 p 0 ) = 15 10 =16667 1000109 rozkładów normalnych Założenia: 1X 1 N(µ 1,σ 2 1),X 2 N(µ 2,σ 2 2) 2X 1,X 2 sąniezależne Czyµ 1 =µ 2? Czyσ 2 1=σ 2 2? Próby:X 11,,X 1n1 ;X 21,,X 2n2 Wartośćkrytyczna:u 1 005 =16449 Odpowiedź: hipotezę odrzucamy Wniosek: należy uznać, że ogólna liczb ryb w stawie jest mniejsza niż podana w ofercie X 1, varx 1, s 2 1= varx 1 n 1 1 X 2, varx 2, s 2 2= varx 2 n 2 1 WZ WUM Wnioskowanie 51 WZ WUM Wnioskowanie 52

0 :µ1=µ2 škładporównaćprzeciętneosiągnięciapunktowepańipanównaklasówcezestatystyki Panowie: n 1 =138, x1i =82833, varx 1 =165841 Założenieσ 2 1=σ 2 2 Test Studenta (poziom istotności α) Panie: n 2 =162, x2i =93733, varx 2 =223348 Statystyka testowa S r = S 2 e ( 1 t emp = X 1 X 2 S r n 1 + 1 n 2 Wartośćkrytycznat(α;n 1 +n 2 2) ), S 2 e= varx 1+varX 2 n 1 +n 2 2 Jeżeli t emp >t(α;n 1 +n 2 2), tohipotezęh 0 :µ 1 =µ 2 odrzucamy Populacja 1: Słuchacze podstawowego kursu statystyki Populacja 2: Słuchaczki podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce Założenia: cechaxmawpopulacji1rozkładn(µ 1,σ 2 1) cechaxmawpopulacji2rozkładn(µ 2,σ 2 2) σ 2 1=σ 2 2 Zadanie:zweryfikowaćhipotezęH 0 :µ 1 =µ 2 Technika statystyczna: testt poziom istotności 005 WZ WUM Wnioskowanie 53 WZ WUM Wnioskowanie 54

œ ž Ÿ ž działufnościatesthipotezyh0:µ1=µ2 x 1 =060024 x 2 =057860 s 2 r= 165841+223348 138+162 2 = 0000175255 ( 1 138 + 1 ) 162 t emp = 060024 057860 0000175255 =1634 Wartość krytyczna t(005; 298) 196 CechaX 1 N(µ 1,σ1),X 2 2 N(µ 2,σ2),σ 2 1=σ 2 2 2 H 0 :µ 1 =µ 2 H 0 nieodrzucamynapoziomieistotnościα t emp <t(α;n 1 +n 2 2) Odpowiedź: hipotezy nie odrzucamy Wniosek Średnie ilości punktów uzyskiwane przez panie i panów można traktować jako porównywalne t(α;n 1 +n 2 2)< X 1 X 2 S r <t(α;n 1 +n 2 2) 0 ( X1 X 2 ±t(α;n 1 +n 2 2)S r ) 0 należy do przedziału ufności napoziomieufności1 α WZ WUM Wnioskowanie 55 WZ WUM Wnioskowanie 56

ª ««0 :σ21=σ22 Test F (poziom istotności α) Statystyka testowa F emp = S2 1 S 2 2 Wartości ( krytyczne F 1 α ) 2 ;n 1 1,n 2 1 ( α F 2 ;n 1 1,n 2 1) Jeżeli ( F emp <F 1 α ) 2 ;n 1 1,n 2 1 lub ( α F emp >F 2 ;n 1 1,n 2 1) tohipotezęh 0 :σ 2 1=σ 2 2odrzucamy F(1 α;u,v)= 1 F(α;v,u) Reguła: większa wariancja do licznika JeżeliS 2 1>S 2 2,towyznaczanajeststatystyka F emp = S2 1 S 2 2 i hipoteza jest odrzucana, gdy ( α F emp >F 2 ;n 1 1,n 2 1) JeżelizaśS 2 1<S 2 2,towyznaczanajeststatystyka F emp = S2 2 S 2 1 i hipoteza jest odrzucana, gdy ( α F emp >F 2 ;n 2 1,n 1 1) WZ WUM Wnioskowanie 57 WZ WUM Wnioskowanie 58

± ² ³ µ µ ¹ º µ kładdlasprawdzeniastabilnościpracymaszyny pobrano dwie próbki: pierwszą w początkowym okresie eksploatacji oraz drugą po miesięcznym okresie pracy tej maszyny Wykonano pomiary wylosowanychproduktówiotrzymanowyniki:n 1 =25, x 1 =324,s 2 1=01447orazn 2 =19, x 2 =319, s 2 2=01521Zbadaćnatejpodstawieczymaszyna nie rozregulowała się w trakcie pracy Populacja 1 produkcja maszyny w początkowym okresie Populacja 2 produkcja maszyny po miesiącu eksploatacji Cecha X pomiar produktu Założenia cechaxmawpopulacji1rozkładn(µ 1,σ 2 1) cechaxmawpopulacji2rozkładn(µ 2,σ 2 2) Stabilność pracy maszyny może być mierzona podobieństwem wytwarzanych produktów: im własności produktów są do siebie bardziej zbliżone, tym bardziej stabilna jest praca maszyny Podobieństwo takie jest wyrażane wariancją cechy Zatem stabilność pracy można wyrazić liczbowo jako wariancję interesującej cechy produktu, a problem stabilności jako zagadnienieweryfikacjihipotezyh 0 :σ1=σ 2 2 2 Technika statystyczna TestF(poziomistotnościα=010) Obliczenia F emp = s2 2 s 2 1 =1051 WartośćkrytycznaF(005;19,24)=2114 Odpowiedź: hipotezy nie odrzucamy Wniosek: można uznać że maszyna nie rozregulowałasięwtrakciepracy WZ WUM Wnioskowanie 59 WZ WUM Wnioskowanie 60

» ¼ ½ ¾ À Á À Â Ã Ä ¾ Å Æ Ç È É rozkładów dwupunktowych Założenia: 1X 1 D(p 1 ),X 2 D(p 2 ) 2X 1,X 2 sąniezależne H 0 :p 1 =p 2 Test przybliżony (poziom istotności α) ˆp 1 = k 1 n 1, ˆp 2 = k 2 n 2, ˆp= (k 1+k 2 ) (n 1 +n 2 ) Statystyka testowa ÊkładCelembadaniabyłoporównanieprzygotowania z matematyki kandydatów na studia będących absolwentami liceów oraz techników W tym celu spośród kandydatów zdających matematykę wylosowano 400 absolwentów liceów oraz 600 absolwentów techników W wylosowanej grupie stwierdzono, że 385 absolwentów liceów oraz 501 absolwentów techników rozwiązało test wstępny Czy można na tej podstawie sądzić, że przygotowanie w obu grupach absolwentów jest jednakowe? Populacja 1: absolwenci liceów zdający egzamin wstępny Populacja 2: absolwenci techników zdający egzamin wstępny Cecha X: umiejętność rozwiązania testu(tak/nie) u emp = ˆp 1 ˆp 2 ˆp(1 ˆp)( 1 n 1 + 1 n 2 ) Założenia: cechaxmawpopulacji1rozkładd(p 1 ) cechaxmawpopulacji2rozkładd(p 2 ) u emp u 1 α/2 = H 0 :p 1 =p 2 odrzucamy Formalizacja WeryfikacjahipotezyH 0 :p 1 =p 2 WZ WUM Wnioskowanie 61 WZ WUM Wnioskowanie 62

Ë Ì Í Î Ï Ð Ñ Ò Ó Ô Ò Ô Õ Ó Ô Õ Í Ö Ï Ò Ø Ù Ú Û Ü Ý Ü Þ ß Û Þ ß à á Test przybliżony(poziom istotności α = 005) rozkładów normalnych Obliczenia n 1 =400 k 1 =385 ˆp 1 =385/400=09625 Założenia: 1X i N(µ i,σi 2 ), i=1,,k 2X 1,,X k sąniezależne n 2 =600 k 2 =501 ˆp 2 =501/600=08350 u emp = ˆp=(385+501)/(400+600)=0886 09625 08350 0886(1 0886) ( 1 400 + ) =6215 1 600 Wartośćkrytycznau 0975 =196 Czyµ 1 ==µ k? Czyσ 2 1==σ 2 k? Próby:X i1,,x ini, i=1,,k Odpowiedź:hipotezęH 0 :p 1 =p 2 odrzucamy Wniosek: przygotowanie absolwentów liceów i techników z matematyki nie jest takie same X i, varx i, s 2 i= varx i n i 1 ; i=1,,k WZ WUM Wnioskowanie 63 WZ WUM Wnioskowanie 64

ã ä å ä æ Założenieσ 2 1==σ 2 k â0 :µ1==µk Test F (poziom istotności α) Statystyka testowa S 2 a= 1 k 1 S 2 e= 1 N k X i = 1 n i n i j=1 F emp = S2 a S 2 e k n i ( X i X) 2 i=1 k n i (X ij X i ) 2 i=1j=1 X ij, X= 1 N N= k i=1 n i k n i i=1j=1 X ij çfemp>f(α;k 1,N k), tohipotezęh 0 :µ 1 ==µ k odrzucamy Wniosek praktyczny: przynajmniejjednaześrednichµ 1,,µ k jestinna od pozostałych Model analizy wariancji X ij =µ i +ε ij Błądlosowyε ij N(0,σ 2 ) Przykłady Plenność kilku odmian pewnej rośliny uprawnej Wydajność pracowników kilku zakładów pracy Zarobki kilku grup społecznych Czynnik: odmiana, zakład, grupa Poziomy czynnika: badane odmiany, badane zakłady, badane grupy WZ WUM Wnioskowanie 65 WZ WUM Wnioskowanie 66

è é ê ë ì í î í ì ï ð ñ ò í ó ï í î ô õ ï ö ø ù ú û ü ý þ ÿ ÿ ý þ X ij =µ+a i +ε ij a i efekti tegopoziomuczynnika: k i=1 a i=0 H 0 :a 1 ==a k =0, H 0 : Tabela analizy wariancji k a 2 i=0 i=1 Źródło Stopnie Sumy Średnie F emp zmienności swobody kwadratów kwadraty Czynnik k 1 vara S 2 a= vara k 1 S2 a/s 2 e Błądlosowy N k vare S 2 e= vare N k Ogółem N 1 vart vara= k n i ( X i X) 2,varE= i=1 vart= k n i (X ij X i ) 2, i=1j=1 k n i (X ij X) 2, i=1j=1 vara+vare=vart ü podzbioryśrednich,które można uznać za takie same Procedury porównań wielokrotnych postępowanie statystyczne zmierzające do podzielenia zbioru średnich na grupy jednorodne Procedury: Tukeya, Scheffégo, Bonfferroniego, Duncana, Newmana Kuelsa i inne Ogólna idea procedur porównań wielokrotnych (n 1 ==n k ) N IR najmniejsza istotna różnica Jeżeli X i X j <NIR,touznajemy,żeµ i =µ j Jeżeli X i X j <NIR X i X l <NIR X l X j <NIR, touznajemy,żeµ i =µ j =µ l Badając w ten sposób wszystkie pary średnich próbkowych otrzymujemy podział zbioru średnich na grupy jednorodne WZ WUM Wnioskowanie 67 WZ WUM Wnioskowanie 68

P ceduratukeya kładprzeprowadzićanalizęporównawcząwyników punktowych klasówki w grupach studenckich Założenie:n 1 ==n k =n Populacje Możemy wyodrębnić dziesięć populacji indeksowanych numerami grup studenckich NIR=t(α;k,N k)s e 1 n t(α;k,n k) wartośćkrytycznastudentyzowanego rozstępu Przypadek nierównolicznych prób Jedna z modyfikacji procedury Tukeya ( 1 1 NIR ij =t(α;k,n k)s e + 1 ) 2 n i n j Cecha X Ilość punktów uzyskanych na klasówce Założenia cechaxmawi tejpopulacjirozkładn(µ i,σ 2 i ) (i=1,,10) σ 2 1==σ 2 10 Formalizacja weryfikacjahipotezyh 0 :µ 1 ==µ 10 Techniki statystyczna Jednoczynnikowa analiza wariancji Porównania szczegółowe Poziom istotności 005 WZ WUM Wnioskowanie 69 WZ WUM Wnioskowanie 70

O T i n i xi x 2 i 1 30 18230 11375950 2 30 16672 9596790 3 30 14292 7087458 4 30 18879 12069655 5 30 18200 11355982 6 30 19568 13172884 7 30 16522 9420960 8 30 19134 12514874 9 30 18548 11945964 10 30 16521 9304785 300 176566 107845302 i n i x i n i ( x i x) 2 varx i 1 30 0607667 0010960 0298187 2 30 0555733 0032315 0331604 3 30 0476400 0377351 0278749 4 30 0629300 0049809 0189100 5 30 0606667 0009843 0314649 6 30 0652267 0121782 0409330 7 30 0550733 0042911 0321744 8 30 0637800 0072757 0311209 9 30 0618267 0026486 0478354 10 30 0550700 0042986 0206670 N =300 x=0588553 vara=0787199 vare=3139595 vart=107845302 176566 2 /300=3926794 Źródło Stopnie Sumy Średnie Femp zmienności swobody kwadratów kwadraty Grupa 9 0787199 0087467 8079 Błąd losowy 290 3139595 0010826 Ogółem 299 3926794 Wartość krytyczna F(005;9,290)=1912 Odpowiedź: hipotezęh 0 :µ 1 ==µ 10 odrzucamy Wniosek: przynajmniej jedna grupa uzyskała inną średnią liczbę punktów niż pozostałe WZ WUM Wnioskowanie 71 WZ WUM Wnioskowanie 72

W! " # $ % & ' " ' & ( Procedura Tukeya(α = 005) Wartość krytyczna: t(005; 10, 290) = 4474 NIR=4474 0010826 1 30 =0084990 i x i 3 0476400 10 0550700 7 0550733 2 0555733 5 0606667 1 0607667 9 0618267 4 0629300 8 0637800 6 0652267 WZ WUM Wnioskowanie 73 1 ) * +, - / 0 1 2 1 2 3 4 5 6 7 8 9 10 WZ WUM Wnioskowanie 74