Statystyka matematyczna. w zastosowaniach

Wielkość: px
Rozpocząć pokaz od strony:

Download "Statystyka matematyczna. w zastosowaniach"

Transkrypt

1 Statystyka matematyczna w zastosowaniach Robert Pietrzykowski STATYSTYKA: nauka poświęcona metodom badania (analizowania) zjawisk masowych; polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w postaci zestawień tabelarycznych, wykresów, itp; posługuje się rachunkiem prawdopodobieństwa STATYSTYKA MATEMATYCZNA: dział matematyki stosowanej oparty na rachunku prawdopodobieństwa; zajmuje się badaniem zbiorów na podstawie znajomości własności ich części Encyklopedia Popularna PWN, Warszawa 1982 RP W SET Statystyka 1

2 Grupa Płeć Punkty Ocena Grupa Płeć Punkty Ocena RP W SET Statystyka 2

3 Grupa Płeć Punkty Ocena Grupa Płeć Punkty Ocena RP W SET Statystyka 3

4 Grupa Płeć Punkty Ocena Grupa Płeć Punkty Ocena RP W SET Statystyka 4

5 Grupa Płeć Punkty Ocena Grupa Płeć Punkty Ocena RP W SET Statystyka 5

6 Grupa Płeć Punkty Ocena Grupa Płeć Punkty Ocena RP W SET Statystyka 6

7 Punkty z klasówki 000: 0 005: 0 010: 0 015: 0 020: 0 025: 0 030: 1 035: 5 040: 9 045: : : : : : : : : 9 090: 1 095: 0 100: 0 Średnia 0589 Kwartyl dolny 0508 Mediana 0595 Kwartyl górny 0672 RP W SET Statystyka 7

8 Stopnie z klasówki 20: 76 30: 88 35: 92 40: 37 45: 7 50: 0 Średnia 306 Kwartyl dolny 200 Mediana 300 Kwartyl górny (29%) 20 (25%) 35 (31%) 40 (12%) 45(2%) RP W SET Statystyka 8

9 Oceny z klasówki Negatywne Pozytywne Razem Ogółem 76 (25%) 224 (75%) 300 Kobiety 46 (28%) 116 (72%) 162 Mężczyźni 30 (22%) 108 (78%) 138 Grupa 1 3 (10%) 27 ( 90%) 30 Grupa 2 11 (37%) 19 ( 63%) 30 Grupa 3 17 (57%) 13 ( 43%) 30 Grupa 4 0 ( 0%) 30 (100%) 30 Grupa 5 6 (20%) 24 ( 80%) 30 Grupa 6 4 (13%) 26 ( 87%) 30 Grupa 7 12 (40%) 18 ( 60%) 30 Grupa 8 3 (10%) 27 ( 90%) 30 Grupa 9 7 (23%) 23 ( 77%) 30 Grupa (43%) 17 ( 57%) 30 RP W SET Statystyka 9

10 Pytania 1 Na ile dokładne są podane wyniki? 2 Na ile wyniki odzwierciedlają stan wiedzy? 3 Jakich wyników można oczekiwać na następnej klasówce? 4 Jakich wyników można oczekiwać na egzaminie? RP W SET Statystyka 10

11 Populacja Wnioski o populacji Próba Wnioski z próby RP W SET Statystyka 11

12 F F F F F M M M F F M M F M M M M F M M F F M M M Próba 1: Średnia z próby: 340 Próba 2: Średnia z próby: 720 Próba 3: Średnia z próby: 920 Próba 4: Średnia z próby: 1180 Próba 5: Średnia z próby: 1060 Średnia populacji: 844 RP W SET Statystyka 12

13 844 Pytania Czy mając do dyspozycji tylko jedną próbę można ocenić na ile dobrze średnia z tej próby przybliża prawdziwą średnią? Co zrobić, by być pewniejszym wyniku? RP W SET Statystyka 13

14 Populacja Zbiór obiektów z wyróżnioną cechą (cechami) Próba Wybrana część populacji podlegająca badaniu Cecha Wielkość losowa charakteryzująca obiekty danej populacji Cecha jakościowa Cecha przyjmująca wartości nie będące liczbami (np kolor, płeć, smakowitość) Cecha (ilościowa) skokowa Cecha przyjmująca pewne wartości liczbowe i nie przyjmująca wartości pośrednich (np ilość bakterii, ilość pracowników, ilość pasażerów) Cechy te nazywane są również dyskretnymi Cecha (ilościowa) ciągła Cecha przyjmująca wartości z pewnego przedziału liczbowego (np wzrost, waga, plon) RP W SET Statystyka 14

15 Jakość wnioskowania statystycznego Oceniamy parametr θ cechy na podstawie próby X 1, X 2,, X n Niech ˆθ(X 1, X 2,, X n ) będzie jakąś oceną parametru θ Nieobciążoność Jeżeli średnia wartość oceny ˆθ jest równa wartości parametru θ, to ocenę ˆθ nazywamy nieobciążoną Minimalna wariancja Z dwóch różnych nieobciążonych ocen ˆθ oraz ˆθ tego samego parametru θ za lepszą uznajemy tę, która średnio przyjmuje wartości bliższe parametrowi θ Minimalny błąd średniokwadratowy Jeżeli ocena ˆθ nie jest nieobciążona, to wówczas jako miernik jakości stosuje się błąd średniokwadratowy Jest to uśrednienie obciążenia oraz wariancji RP W SET Statystyka 15

16 Elementy rachunku prawdopodobieństwa Rachunek prawdopodobieństwa zajmuje się analizą praw rządzących zdarzeniami losowymi Pojęciami pierwotnymi są: zdarzenie elementarne ω oraz zbiór zdarzeń elementarnych Ω Doświadczenie losowe realizacja określonego zespołu warunków wraz z góry określonym zbiorem wyników Zdarzenie losowe A jest podzbiorem zbioru zdarzeń elementarnych Ω RP W SET Statystyka 16

17 Prawdopodobieństwo (definicja aksjomatyczna) jest funkcją określoną na zbiorze zdarzeń losowych: 1 P (A) 0, 1 2 P (Ω) = 1 3 P (A B) = P (A) + P (B), o ile A B = Prawdopodobieństwo (definicja klasyczna) Jeżeli Ω składa się z n jednakowo prawdopodobnych zdarzeń elementarnych, to prawdopodobieństwo zdarzenia A składającego się z k zdarzeń elementarnych wyraża się wzorem P (A) = k n Prawdopodobieństwo warunkowe zajścia zdarzenia A pod warunkiem realizacji zdarzenia B: P (A B) = P (A B) P (B) (P (B) > 0) RP W SET Statystyka 17

18 Prawdopodobieństwo całkowite Jeżeli zdarzenia B 1,, B n są takie, że B i B j = dla wszystkich i j, B 1 B n = Ω oraz P (B i ) > 0 dla wszystkich i, to dla dowolnego zdarzenia A zachodzi P (A) = P (A B 1 )P (B 1 ) + + P (A B n )P (B n ) Twierdzenie Bayesa P (B k A) = P (B k )P (A B k ) P (A B 1 )P (B 1 ) + + P (A B n )P (B n ) Niezależność zdarzeń Zdarzenia A oraz B są niezależne, jeżeli Równoważnie P (A B) = P (A)P (B) P (A B) = P (A) P (B A) = P (B) RP W SET Statystyka 18

19 Zmienna losowa (cecha) Funkcja o wartościach rzeczywistych określona na zbiorze zdarzeń elementarnych Rozkład zmiennej losowej Zbiór wartości zmiennej losowej oraz prawdopodobieństwa z jakimi są te wartości przyjmowane Przykład Jednokrotny rzut kostką Zmienna losowa: ilość wyrzuconych oczek Zbiór wartości: {1, 2, 3, 4, 5, 6} Rozkład (kostka uczciwa) x i p i 1/6 1/6 1/6 1/6 1/6 1/6 Rozkład (kostka nieuczciwa) x i p i 1/24 1/24 1/24 1/24 1/6 2/3 RP W SET Statystyka 19

20 Zmienna losowa skokowa (dyskretna) jest to zmienna, której zbiór wartości jest skończony lub przeliczalny Jeżeli x 1 oraz x 2 są kolejnymi wartościami zmiennej losowej skokowej, to nie przyjmuje ona żadnych wartości między x 1 a x 2 Przykłady Rzut kostką, liczba bakterii, ilość pracowników Zmienna losowa ciągła jest to zmienna przyjmująca wszystkie wartości z pewnego przedziału (najczęściej zbioru liczb rzeczywistych) Jeżeli x 1 oraz x 2 są dwiema wartościami zmiennej losowej ciągłej, to może ona przyjąć dowolną wartość między x 1 a x 2 Przykłady Wzrost, ciężar paczki towaru, wydajność pracowników RP W SET Statystyka 20

21 Dystrybuanta F jest funkcją określoną na zbiorze liczb rzeczywistych R wzorem F (x) = P {X x}, x R Najważniejsze własności dystrybuanty 1 0 F (x) 1 2 F ( ) = 0, F ( ) = 1 3 dystrybuanta jest funkcją niemalejącą 4 P {a < X b} = F (b) F (a) Funkcja (gęstości) rozkładu prawdopodobieństwa f jest funkcją określoną na zbiorze liczb rzeczywistych R wzorem f(x) = { F (x), jeżeli F (x) istnieje 0, w przeciwnym przypadku Najważniejsze własności funkcji gęstości 1 f(x) 0 2 P {a < X b} = b a f(x)dx RP W SET Statystyka 21

22 Skokowa zmienna losowa Funkcja rozkładu prawdopodobieństwa Dystrybuanta RP W SET Statystyka 22

23 Ciągła zmienna losowa Funkcja gęstości F (b) F (a) a Dystrybuanta b RP W SET Statystyka 23

24 Charakterystyki liczbowe zmiennych losowych Wartość oczekiwana (średnia) Wartość oczekiwana EX zmiennej losowej X jest liczbą charakteryzującą położenie zbioru jej wartości EX = { xi p i dla zmiennej skokowej xf(x)dx dla zmiennej ciągłej Prawo wielkich liczb: X 1 + X X n n EX Wariancja Wariancja D 2 X zmiennej losowej jest liczbą charakteryzującą rozrzut zbioru jej wartości wokół wartości średniej EX D 2 X = { (xi EX) 2 p i (x EX) 2 f(x)dx RP W SET Statystyka 24

25 Odchylenie standardowe Odchylenie standardowe DX zmiennej losowej X jest liczbą charakteryzującą rozrzut zbioru jej wartości wokół wartości średniej EX DX = D 2 X Kwantyl rzędu p zmiennej losowej X jest to taka liczba x p, że F (x p ) = p Frakcja Jeżeli A jest danym podzbiorem zbioru wartości zmiennej losowej X, to frakcją nazywamy liczbę p = P {X A} Asymetria (skośność) Liczba γ 1 charakteryzująca niejednakowość rozproszenia wartości zmiennej losowej wokół wartości oczekiwanej RP W SET Statystyka 25

26 Rozkład dwupunktowy Zmienna losowa X ma rozkład D(p), jeżeli P {X = 1} = p = 1 P {X = 0} EX = p D 2 X = p(1 p) Doświadczenie Bernoulliego Wykonujemy dwuwynikowe doświadczenie Wyniki nazywane są umownie sukces oraz porażka Prawdopodobieństwo sukcesu wynosi p (porażki: 1 p) Niech zmienną losową X będzie uzyskanie sukcesu Zmienna losowa X ma rozkład D(p) Przykłady Płeć osoby Wadliwość produktu RP W SET Statystyka 26

27 Rozkład dwumianowy Zmienna losowa X ma rozkład B(n, p), jeżeli P n,p {X = k} = ( ) n p k (1 p) n k, k = 0, 1,, n k EX = np D 2 X = np(1 p) Schemat Bernoulliego Zmienną losową o rozkładzie D(p) obserwujemy n krotnie w sposób niezależny Niech zmienną losową X będzie ilość sukcesów Zmienna losowa X ma rozkład B(n, p) Przykłady Ilość nasion, z których wzeszły rośliny Ilość wadliwych produktów Popularność danej osobistości publicznej P n,p {X = k} = P n,1 p {X = n k} RP W SET Statystyka 27

28 Przykład Niezaliczalność klasówki jest równa 30% Obliczyć prawdopodobieństwo, że na dziesięć wylosowanych klasówek będzie co najwyżej jedna niepozytywna Doświadczenie Bernoulliego: ocena klasówki Sukces klasówka niezaliczona; p = 03 X liczba niezaliczonych klasówek wśród dziesięciu wylosowanych P 10,03 {X 1} = P 10,03 {X = 0} + P 10,03 {X = 1} Tablice: Q(k; n, p) = n P n,p {X = i} i=k P 10,03 {X 1} = 1 Q(2; 10, 03) = P 10,03 {X = 1} = Q(1; 10, 03) Q(2; 10, 03) = = RP W SET Statystyka 28

29 Rozkład Poissona Zmienna losowa X ma rozkład P o(λ), jeżeli P λ {X = k} = λk k! e λ, k = 0, 1, EX = λ D 2 X = λ Przykłady Ilość wad na metrze kwadratowym produkowanego materiału Ilość klientów przybywających do sklepu w jednostce czasu RP W SET Statystyka 29

30 Przykład Ile średnio powinno przypadać rodzynków na bułeczkę, by prawdopododobieństwo, że w bułeczce znajdzie się co najmniej jeden rodzynek, było nie mniejsze niż 099? X ilość rodzynków w bułeczce X P o(λ), λ =? Znaleźć takie λ, że P λ {X 1} 099 Tablice: Q(k; λ) = P λ {X = i} i=k Q(1; λ) 099 = λ = 48 Obliczenia: P {X 1} = 1 P {X = 0} = 1 e λ e λ 001 = λ log 001 = RP W SET Statystyka 30

31 Rozkład normalny Zmienna losowa X ma rozkład normalny N(µ, σ 2 ) o wartości średniej µ i wariancji σ 2, jeżeli jej funkcja gęstości wyraża się wzorem f µ,σ 2(x) = 1 σ 2π e 1 2( x µ σ ) 2, < x < EX = µ D 2 X = σ 2 Przykłady Błędy pomiarowe Ciężar ciała Zawartość białka w mięsie Standardowy rozkład normalny: N(0, 1) Dystrybuanta F (x) standardowego rozkładu normalnego (N(0, 1)) jest stablicowana F (x) = 1 F ( x) RP W SET Statystyka 31

32 Rozkład normalny µ = 0 µ = 1 µ = 1 σ = 05 σ = 10 σ = 20 RP W SET Statystyka 32

33 Jeżeli X N(µ, σ 2 ), to Standaryzacja Z = X µ σ N(0, 1) { ( a µ P {X (a, b)} = P Z σ, b µ )} σ ( ) ( ) b µ a µ = F F σ σ Przykład Dla zmiennej losowej X N(10, 16) obliczyć P {X (8, 14)} P {X (8, 14)} = P { Z ( 8 10, 4 = F (1) F ( 05) = ( ) = )} RP W SET Statystyka 33

34 Prawo trzech sigm P { X µ < σ} = P { X µ < 2σ} = P { X µ < 3σ} = µ µ σ µ + σ µ 2σ µ + 2σ µ 3σ µ + 3σ RP W SET Statystyka 34

35 Pożyteczne przybliżenia X B(n, p), n duże, p małe X P o(np) X B(n, p), n duże, p około 05 X N(np, np(1 p)) X P o(λ), λ duże X N(λ 05, λ) lub X N ( ) λ, 1 4 RP W SET Statystyka 35

36 Estymacja parametrów rozkładu cechy Estymujemy parametr θ rozkładu cechy X Próba: X 1, X 2,, X n Estymator (punktowy) jest funkcją próby ˆθ = ˆθ(X 1, X 2,, X n ) przybliżającą wartość parametru θ Przedział ufności (estymator przedziałowy) jest przedziałem o końcach zależnych od próby, który z pewnym z góry zadanym prawdopodobieństwem pokrywa nieznaną wartość parametru θ P {θ (θ(x 1,, X n ), θ(x 1,, X n ))} = 1 α Poziom ufności: prawdopodobieństwo 1 α Co wpływa na długość d przedziału ufności? 1 Liczność próby (n = d ) 2 Poziom ufności (1 α = d ) 3 Wariancja cechy (σ 2 = d ) RP W SET Statystyka 36

37 Rozkład normalny Estymacja parametrów Próba (prosta): X 1, X 2,, X n Estymator średniej µ średnia arytmetyczna X = 1 n n i=1 X i = X X n n Estymator wariancji σ 2 wariancja próbkowa S 2 = 1 n 1 n (X i X) 2 i=1 Suma kwadratów odchyleń od średniej varx = n (X i X) 2 = i=1 n Xi 2 n X 2 i=1 Estymator odchylenia standardowego σ S = S 2 RP W SET Statystyka 37

38 Szereg rozdzielczy (dane skumulowane) Przedział klasowy Liczebność x 0 x 1 n 1 x 1 x 2 n 2 x k 1 x k n k n Średnia z próby (ẋ i = (x i 1 + x i )/2) X = 1 n k ẋ i n i i=1 Suma kwadratów odchyleń od średniej varx = k (ẋ i X) 2 n i i=1 RP W SET Statystyka 38

39 Liczność próby Jeżeli X 1,, X n są niezależnymi zmiennymi losowymi takimi, że X i N(µ, σ 2 ), i = 1,, n, to ) X N (µ, σ2 n Przykład Jakie jest prawdopodobieństwo, że średnia X trafi bliżej µ niż 01σ? P { X µ < 01σ} = P { X (µ 01σ, µ + 01σ)} ( ) ( ) (µ + 01σ) µ (µ 01σ) µ F σ/ F n σ/ = n F (01 n) F ( 01 n) = 2F (01 n) 1 n P n P RP W SET Statystyka 39

40 Przedział ufności dla średniej Wariancja σ 2 jest nieznana Poziom ufności: 1 α ( X t(α; n 1) S n, X + t(α; n 1) S n ) t(α; n 1): wartość krytyczna rozkładu t (Studenta) z ν stopniami swobody Długość przedziału: d = 2t(α; n 1) S n Przedziały jednostronne (, X + t(2α; n 1) S n ) ( X t(2α; n 1) S n, ) RP W SET Statystyka 40

41 Przykład Na podstawie próby 11, 12, 08, 09, 12, 13, 10, 07, 08, 10 oszacować wartość średnią rozkładu obserwowanej cechy x = = 10 varx = (11 10) (10 10) 2 = 036 s 2 = = 004, s = s 2 = 02 Poziom ufności 1 α = 095, czyli α = 005 t(005; 9) = t(005; 9) s n = = 014 (1 014, ) = (086, 114) Wniosek Średnia wartość cechy jest jakąś liczbą z przedziału (086, 114) Zaufanie do tego wniosku wynosi 95% RP W SET Statystyka 41

42 Przykład Oszacować przeciętną ilość punktów uzyskiwanych na klasówce n = 300 xi = x 2 i = Populacja: Słuchacze podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce Założenie: cecha X ma rozkład normalny N(µ, σ 2 ) Zadanie: oszacować parametr µ Technika statystyczna: przedział ufności dla średniej poziom ufności 1 α = 095 RP W SET Statystyka 42

43 Obliczenia x = 1 n xi = ( xi ) 2 = 0589 varx = x 2 i 1 n = = s 2 = = , s = s 2 = t(005; 299) 196 t(005; 299) s n = = ( , ) = (0576, 0602) Odpowiedź: µ (0576, 0602) Wniosek Przeciętna liczba punktów zdobywana na klasówce jest liczbą z przedziału (0576, 0602) Zaufanie do tego wniosku wynosi 95% RP W SET Statystyka 43

44 Przedział ufności dla wariancji Średnia µ jest nieznana Poziom ufności: 1 α ( varx χ 2 ( α 2 ; n 1), ) varx χ ( 2 1 α 2 ; n 1) χ 2 (α; n 1) jest stablicowaną wartością krytyczną rozkładu chi kwadrat z ν stopniami swobody Przedziały jednostronne ( varx 0, χ 2 (α; n 1) ( varx χ 2 (1 α; n 1), ) ) RP W SET Statystyka 44

45 Przykład Na podstawie próby 11, 12, 08, 09, 12, 13, 10, 07, 08, 10 oszacować zróżnicowanie rozkładu obserwowanej cechy x = = 10 varx = (11 10) (10 10) 2 = 036 s 2 = = 004, s = s 2 = 02 Poziom ufności 1 α = 095, czyli α = 005 ( χ 2 α ) 2 ; n 1 = χ 2 (0025; 9) = ( χ 2 1 α ) 2 ; n 1 = χ 2 (0975; 9) = ( ) , 036 = (0019, 0133) Wniosek Wariancja cechy jest jakąś liczbą z przedziału (0019, 0133) Zaufanie do tego wniosku wynosi 95% RP W SET Statystyka 45

46 Przedział ufności dla odchylenia standardowego Średnia µ jest nieznana Poziom ufności: 1 α ( varx χ 2 ( α 2 ; n 1), ) varx χ 2 (1 α 2 ; n 1) Przedziały jednostronne ( ( 0, varx χ 2 (α; n 1) ) ) varx χ 2 (1 α; n 1), Przykład (cd) Przedział ufności dla odchylenia standardowego: ( 0019, 0133) = (0136, 0365) RP W SET Statystyka 46

47 Przykład Oszacować zróżnicowanie ilości punktów uzyskiwanych na klasówce n = 300 xi = x 2 i = Populacja: Słuchacze podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce Założenie: cecha X ma rozkład normalny N(µ, σ 2 ) Zadanie: oszacować parametr σ Technika statystyczna: przedział ufności dla odchylenia standardowego poziom ufności 095 RP W SET Statystyka 47

48 Obliczenia x = 0589 varx = ( χ 2 α ) 2 ; n 1 = χ 2 (0025; 299) = χ 2 ( 1 α 2 ; n 1 ) = χ 2 (0975; 299) = ( ) , = (010610, ) Odpowiedź: σ (010610, ) Wniosek Odchylenie standardowe liczby punktów zdobywanych na klasówce jest liczbą z przedziału (0106, 0125) Zaufanie do tego wniosku wynosi 95% RP W SET Statystyka 48

49 Rozkład dwupunktowy Estymacja parametru p frakcja, wskaźnik struktury Próba: X 1,, X n (X i = 0 lub = 1) k = n i=1 X i ilość jedynek (sukcesów) Estymator punktowy: ˆp = k n Przedział ufności na poziomie ufności 1 α (p 1 (1 α 2 ; k, n k ), 1 p 1 ( 1 α 2 ; n k, k )) Jednostronne przedziały ufności (p 1 (1 α; k, n k), 1) (0, 1 p 1 (1 α; n k, k)) RP W SET Statystyka 49

50 Przykład Wśród 20 zbadanych detali znaleziono dwa braki Ocenić na tej podstawie wadliwość produkcji Cecha X jakość detalu (dobry, zły) Sukces detal wybrakowany Pytanie: p =? n = 20, k = 2 = ˆp = 2/20 = 01 Poziom ufności 1 α = 09, czyli α = 01 p 1 ( 1 α 2 ; k, n k ) = p 1 (095; 2, 18) = p 1 ( 1 α 2 ; n k, k ) = p 1 (095; 18, 2) = (00123, ) = (00123, 03170) Wniosek Wadliwość produkcji wyraża się liczbą z przedziału (123%, 3170%) Zaufanie do wniosku wynosi 90% RP W SET Statystyka 50

51 Przybliżony przedział ufności ( ˆp u 1 α/2 ˆp(1 ˆp) n ) ˆp(1 ˆp), ˆp + u 1 α/2 n u α jest kwantylem rzędu α rozkładu N(0, 1) Przykład (cd) n = 200, k = 20 = ˆp = 20/200 = 01 Poziom ufności 1 α = 09, czyli α = 01 u 1 α/2 = u 095 = (1 01) (1 01) = = Wniosek Wadliwość produkcji wyraża się liczbą z przedziału (651%, 1349%) Zaufanie do wniosku wynosi 90% RP W SET Statystyka 51

52 Przykład Oszacować odsetek ocen dostatecznych otrzymywanych na klasówce n = 300 k = 88 Populacja: Słuchacze podstawowego kursu statystyki Cecha X: ocena dostateczna z klasówki Założenie: cecha X ma rozkład D(p) Zadanie: oszacować parametr p Technika statystyczna: przybliżony przedział ufności dla prawdopodobieństwa poziom ufności 095 RP W SET Statystyka 52

53 Obliczenia p = = 029 u 1 α/2 = u 0975 = (1 029) (1 029) = = Odpowiedź: p (02387, 03413) Wniosek Odsetek ocen dostatecznych zdobywanych na klasówce jest liczbą z przedziału (2387%, 3413%) Zaufanie do tego wniosku wynosi 95% RP W SET Statystyka 53

54 Porównanie dwóch rozkładów normalnych Założenia: 1 X 1 N(µ 1, σ 2 1), X 2 N(µ 2, σ 2 2) 2 X 1, X 2 są niezależne Ocena µ 1 µ 2 oraz σ 2 1/σ 2 2 Próby: X 11,, X 1n1 ; X 21,, X 2n2 X 1, varx 1, s 2 1 = varx 1 n 1 1 X 2, varx 2, s 2 2 = varx 2 n 2 1 RP W SET Statystyka 54

55 Ocena różnicy między średnimi µ 1 µ 2 Ocena punktowa: X 1 X 2 Przedział ufności (poziom ufności 1 α) 1 Założenie σ 2 1 = σ 2 2 ( X 1 X 2 t(α; n 1 + n 2 2)s r, X 1 X 2 + t(α; n 1 + n 2 2)s r ) s 2 e = varx 1 + varx 2 n 1 + n 2 2, s2 r = s 2 e ( 1 n n 2 ) 2 Bez założenia σ 2 1 = σ 2 2 ( X 1 X 2 V (α; n 1 1, n 2 1, c)s r, X 1 X 2 + V (α; n 1 1, n 2 1, c)s r ) s 2 r = ( ) s s2 2 n 1 n 2 c = s 2 1/n 1 s 2 1 /n 1 + s 2 2 /n 2 V (α; n 1 1, n 2 1, c) wartość krytyczna testu Behrensa Fishera RP W SET Statystyka 55

56 Przykład Ocenić różnicę między średnimi wynikami klasówki pań i panów Panowie: n 1 = 138, x1i = 82833, varx 1 = Panie: n 2 = 162, x2i = 93733, varx 2 = Populacja 1: Słuchacze podstawowego kursu statystyki Populacja 2: Słuchaczki podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce Założenie: cecha X ma w populacji 1 rozkład N(µ 1, σ 2 1) cecha X ma w populacji 2 rozkład N(µ 2, σ 2 2) σ 2 1 = σ 2 2 Zadanie: oszacować różnicę µ 1 µ 2 Technika statystyczna: przedział ufności t dla różnicy średnich poziom ufności 095 RP W SET Statystyka 56

57 Obliczenia s 2 r = x 1 = , x 2 = , = ( ) 162 t(005; 298) 196; t(005; 298)s r = ( ± ) = ( , ) Odpowiedź: µ 1 µ 2 ( , ) Wniosek Różnica średnich ilości punktów zdobywanych na klasówce przez panie i panów jest liczbą z przedziału ( , ) Zaufanie do tego wniosku wynosi 95% Sugestia Ponieważ przedział obejmuje zero, więc można uznać, że µ 1 = µ 2 RP W SET Statystyka 57

58 Ocena ilorazu wariancji σ 2 1/σ 2 2 Ocena punktowa: S 2 1/S 2 2 Przedział ufności (poziom ufności 1 α) ( S 2 1 S 2 2 F ( 1 α ) 2 ; n 1 1, n 2 1, S 2 1 S 2 2 F ( α 2 ; n 1 1, n 2 1) ) F (α; u, v) jest stablicowaną wartością krytyczną rozkładu F Snedecora (Fishera Snedecora) F (1 α; u, v) = 1 F (α; v, u) RP W SET Statystyka 58

59 Przykład Porównać zróżnicowanie ocen wyników klasówek pań i panów Panowie: n 1 = 138, x1i = 82833, varx 1 = Panie: n 2 = 162, x2i = 93733, varx 2 = Populacja 1: Słuchacze podstawowego kursu statystyki Populacja 2: Słuchaczki podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce Założenie: cecha X ma w populacji 1 rozkład N(µ 1, σ 2 1) cecha X ma w populacji 2 rozkład N(µ 2, σ 2 2) Zadanie: oszacować iloraz σ 2 1/σ 2 2 Technika statystyczna: przedział ufności dla ilorazu wariancji poziom ufności 090 RP W SET Statystyka 59

60 Obliczenia s 2 1 = = , s2 2 = = , F (005; 137, 161) = F (095; 137, 161) = F (005; 161, 137) 1 = = ( ) , = (066415, ) Odpowiedź: σ 2 1/σ 2 2 (066415, ) Wniosek Iloraz wariancji ilości punktów zdobywanych na klasówce jest liczbą z przedziału (066415, ) Zaufanie do tego wniosku wynosi 90% Sugestia Ponieważ przedział obejmuje jedynkę, więc można uznać, że σ 2 1 = σ 2 2 RP W SET Statystyka 60

61 Porównanie dwóch rozkładów dwupunktowych Założenia: 1 X 1 D(p 1 ), X 2 D(p 2 ) 2 X 1, X 2 są niezależne Ocena p 1 p 2 Próby: X 11,, X 1n1 ; X 21,, X 2n2 (X ij = 0 lub 1) k 1 = n 1 i=1 X 1i k 2 = n 2 i=1 X 12 ˆp 1 = k 1 /n 1 ˆp 2 = k 2 /n 2 ˆp = (k 1 + k 2 )/(n 1 + n 2 ) Przedział ufności (poziom ufności 1 α) ˆp 1 ˆp 2 u 1 α 2 ( 1 ˆp(1 ˆp) + 1 n 1 n 2 ˆp 1 ˆp 2 + u 1 α 2 ), ( 1 ˆp(1 ˆp) + 1 ) n 1 n 2 RP W SET Statystyka 61

62 Przykład Oszacować różnicę między niezaliczalnością klasówki ze statystyki przez panie i panów Na podstawie dotychczasowych danych wiadomo, że na 162 pań nie zaliczyło klasówki 46 pań oraz na 138 panów 30 uzyskało ocenę negatywną Populacja 1: Słuchacze podstawowego kursu statystyki Populacja 2: Słuchaczki podstawowego kursu statystyki Cecha X: uzyskanie z klasówki oceny negatywnej Założenie: cecha X ma w populacji 1 rozkład D(p 1 ) cecha X ma w populacji 2 rozkład D(p 2 ) Zadanie: oszacować różnicę p 1 p 2 Technika statystyczna: przybliżony przedział ufności dla różnicy prawdopodobieństw poziom ufności 095: u 0975 = 196 RP W SET Statystyka 62

63 Obliczenia n 1 = 162 k 1 = 46 n 2 = 138 k 2 = 30 ˆp 1 = k 1 n 1 = = ˆp 2 = k 2 n 2 = = ˆp = (k 1 + k 2 ) (n 1 + n 2 ) 02533( ) 300 = ( ) ( ) = ( ) 138 = ( , ) ( 00321, 01653) Wniosek Różnica prawdopodobieństw jest liczbą z przedziału ( 00321, 01653) Sugestia Ponieważ przedział obejmuje zero, więc odsetki pań i panów niezaliczających klasówki można traktować jako porównywalne RP W SET Statystyka 63

64 Weryfikacja hipotez statystycznych Przykład Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2% Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi W jaki sposób ma to zrobić? Krok 1 Zakładamy, że partia ma wadliwość 2% Krok 2 Pobierana jest próba elementów z partii towaru (np 100 elementów) k P {X = k} P {X k} RP W SET Statystyka 64

65 Krok 3 (wnioskowanie) Zaobserwowano k = 7 wadliwych: 1 Przypuszczenie jest słuszne i próba pechowa lub 2 Próba jest dobra, a przypuszczenie złe Uznać twierdzenie producenta za nieprawdziwe! Zaobserwowano co najmniej siedem wadliwych Wnioski jak wyżej Ostatecznie: Po zaobserwowaniu więcej niż sześciu wadliwych elementów raczej uznać twierdzenie producenta za nieprawdziwe W przeciwnym przypadku można uznać twierdzenie producenta za uzasadnione RP W SET Statystyka 65

66 Hipotezą statystyczną nazywamy dowolne przypuszczenie dotyczące rozkładu prawdopodobieństwa cechy w populacji Oznaczenie H 0 Testem hipotezy statystycznej nazywamy postępowanie mające na celu odrzucenie lub nie odrzucenie hipotezy statystycznej Statystyką testową nazywamy funkcję próby na podstawie której wnioskuje się o odrzuceniu lub nie hipotezy statystycznej Rzeczywistość: Wniosek o hipotezie H 0 hipoteza H 0 nie odrzucać odrzucić prawdziwa prawidłowy nieprawidłowy nieprawdziwa nieprawidłowy prawidłowy RP W SET Statystyka 66

67 Błędem I rodzaju nazywamy błąd wnioskowania polegający na odrzuceniu hipotezy, gdy w rzeczywistości jest ona prawdziwa Błędem II rodzaju nazywamy błąd wnioskowania polegający na nieodrzuceniu hipotezy, gdy w rzeczywistości jest ona fałszywa Poziomem istotności nazywamy dowolną liczbę z przedziału (0, 1) określającą prawdopodobieństwo popełnienia błędu I rodzaju Oznaczenie: α Mocą testu nazywamy prawdopodobieństwo odrzucenia testowanej hipotezy, gdy jest ona nieprawdziwa, czyli prawdopodobieństwo nie popełnienia błędu II rodzaju Oznaczenie: 1 β RP W SET Statystyka 67

68 Rozkład normalny Porównanie z normą H 0 : µ = µ 0 Cecha X ma rozkład normalny N(µ, σ 2 ) Średnia µ oraz wariancja σ 2 są nieznane Test Studenta (poziom istotności α) Próba: X 1,, X n Statystyka testowa t emp = X µ 0 S Wartość krytyczna t(α; n 1) n Jeżeli t emp > t(α; n 1), to hipotezę H 0 : µ = µ 0 odrzucamy RP W SET Statystyka 68

69 Przykład Przypuszczenie: maszyna pakująca kostki masła nastawiona na jednostkową masę 250 g uległa po pewnym czasie rozregulowaniu W celu weryfikacji tego przypuszczenia z bieżącej produkcji pobrano próbę otrzymując wyniki 254, 269, 254, 248, 263, 256, 258, 261, 264, 258 Czy można na tej podstawie sądzić, że maszyna uległa rozregulowaniu? Populacja: paczkowane kostki masła Cecha X: masa kostki masła Założenie: cecha X ma rozkład normalny N(µ, σ 2 ) Formalizacja: Rozregulowanie maszyny może być interpretowane jako odejście od nominalnej wagi Zatem należy zbadać, czy średnia µ wynosi 250, czyli weryfikujemy hipotezę H 0 : µ = 250 RP W SET Statystyka 69

70 Technika statystyczna: test Studenta (test t) poziom istotności α = 005 Obliczenia x = 2585, s 2 = 3605, t emp = 447 Wartość krytyczna: t(005; 9) = Odpowiedź: hipotezę odrzucamy Wniosek: maszyna uległa rozregulowaniu RP W SET Statystyka 70

71 Moc testu Moc testu = 1 P {błąd II rodzaju} Moc testu = P {odrzucenie nieprawdziwej H 0 } Moc testu Studenta hipotezy H 0 : µ = µ 0 M(µ) = P { t emp > t(α; n 1) X N(µ, σ 2 )} M(µ 0 ) = α n = 10 n = 20 n = 30 RP W SET Statystyka 71

72 Przedział ufności a test hipotezy H 0 : µ = µ 0 Cecha X N(µ, σ 2 ) H 0 : µ = µ 0 H 0 nie odrzucamy na poziomie istotności α µ 0 t emp < t(α; n 1) t(α; n 1) < X µ 0 S ( n < t(α; n 1) X t(α; n 1) S n, X + t(α; n 1) S n ) µ 0 należy do przedziału ufności na poziomie ufności 1 α RP W SET Statystyka 72

73 H 0 : µ µ 0 Cecha X ma rozkład normalny N(µ, σ 2 ) Średnia µ oraz wariancja σ 2 są nieznane Test Studenta (poziom istotności α) Próba: X 1,, X n Statystyka testowa t emp = X µ 0 S Wartość krytyczna t(2α; n 1) n Jeżeli t emp > t(2α; n 1), to hipotezę H 0 : µ µ 0 odrzucamy RP W SET Statystyka 73

74 H 0 : σ 2 = σ 2 0 Cecha X ma rozkład normalny N(µ, σ 2 ) Średnia µ oraz wariancja σ 2 są nieznane Test chi kwadrat (poziom istotności α) Próba: X 1,, X n Statystyka testowa χ 2 emp = varx σ 2 0 Wartości krytyczne χ 2 ( 1 α 2 ; n 1) oraz χ 2 ( α 2 ; n 1) Jeżeli χ 2 emp < χ 2 ( 1 α 2 ; n 1) lub χ 2 emp > χ 2 ( α 2 ; n 1), to hipotezę H 0 : σ 2 = σ 2 0 odrzucamy RP W SET Statystyka 74

75 H 0 : σ 2 σ 2 0 Cecha X ma rozkład normalny N(µ, σ 2 ) Średnia µ oraz wariancja σ 2 są nieznane Test chi kwadrat (poziom istotności α) Próba: X 1,, X n Statystyka testowa χ 2 emp = varx σ 2 0 Wartość krytyczna χ 2 (α; n 1) Jeżeli χ 2 emp > χ 2 (α; n 1), to hipotezę H 0 : σ 2 σ 2 0 odrzucamy RP W SET Statystyka 75

76 Przykład Na podstawie obserwacji prowadzonych przez długi okres czasu stwierdzono, że dzienny udój uzyskiwany w pewnym stadzie krów jest wielkością losową, zaś przeciętny dzienny udój mleka wyraża sie liczbą z przedziału (900, 1200) Rachunek finansowy pokazał, że produkcja mleka jest opłacalna, jeżeli całkowity dzienny udój będzie wynosił nie mniej niż d = 700 l mleka przez co najmniej 280 dni w roku W jaki sposób można zbadać, czy produkcja mleka jest opłacalna? Populacja: Cecha: całkowity dzienny udój Założenia: Cecha X ma rozkład N(µ, σ 2 ) µ d = 900 µ µ g = 1200 RP W SET Statystyka 76

77 Formalizacja problemu P {X d} p = P {X d} = 1 F ( ) d µ σ 1 F ( ) d µd σ 1 F ( ) d µd σ 1 p F ( ) d µd σ 1 p d µ d σ d, µ d oraz p są ustalone, więc F 1 (1 p) = u 1 p σ 2 σ 2 0 = ( ) 2 d µd = u 1 p Produkcja mleka jest opłacalna, jeżeli wariancja σ 2 dziennych udojów jest większa niż σ 2 0 = H 0 : σ RP W SET Statystyka 77

78 Rozkład dwupunktowy Porównanie z normą H 0 : p = p 0 Cecha X ma rozkład D(p) Próba: X 1,, X n (X i = 0 lub = 1) Statystyka testowa Y = n i=1 X i Jeżeli Y k 1 lub Y k 2, to hipotezę H 0 : p = p 0 należy odrzucić Liczby k 1 oraz k 2 dobrane są tak, że jeżeli Y jest zmienną losową o rozkładzie B(n, p 0 ), to P {Y k 1 lub Y k 2 } α RP W SET Statystyka 78

79 H 0 : p = p 0 Test przybliżony (poziom istotności α) Przypadek: n duże Statystyka testowa u emp = Y np 0 np0 (1 p 0 ) Wartość krytyczna u 1 α/2 Jeżeli u emp > u 1 α/2, to H 0 : p = p 0 odrzucamy RP W SET Statystyka 79

80 H 0 : p p 0 Test przybliżony (poziom istotności α) Przypadek: n duże Statystyka testowa u emp = Y np 0 np0 (1 p 0 ) Wartość krytyczna u 1 α Jeżeli u emp > u 1 α, to H 0 : p p 0 odrzucamy RP W SET Statystyka 80

81 Przykład W swojej ofercie sprzedaży stawu rybnego jego właściciel podaje, iż w stawie żyje co najmniej tysiąc karpi Potencjalny nabywca zainteresowany jest sprawdzeniem prawdziwości tego twierdzenia W tym celu wyłowiono sto karpi i po zaobrączkowaniu ich wpuszczono je z powrotem do stawu Po jakimś czasie ponownie odłowiono sto ryb i stwierdzono, że wśród nich jest piętnaście zaobrączkowanych Czy w świetle uzyskanych wyników można reklamę uznać za prawdziwą? Populacja: ryby w stawie Cecha: zaobrączkowanie ryby Założenia: Cecha X ma rozkład D(p) RP W SET Statystyka 81

82 Formalizacja problemu Jeżeli w stawie żyje co najmniej N ryb, to odsetek zaobrączkowanych jest co najwyżej 100/N Zgodnie z twierdzeniem właściciela, N 1000, czyli odsetek ryb zaobrączkowanych nie przekracza 01 Technika statystyczna Przybliżony test hipotezy H 0 : p 01 Poziom istotności: α = 005 Obliczenia u emp = Y = 15 n = 100 Y np 0 np0 (1 p 0 ) = = Wartość krytyczna: u = Odpowiedź: hipotezę odrzucamy Wniosek: należy uznać, że ogólna liczb ryb w stawie jest mniejsza niż podana w ofercie RP W SET Statystyka 82

83 Porównanie dwóch rozkładów normalnych Założenia: 1 X 1 N(µ 1, σ 2 1), X 2 N(µ 2, σ 2 2) 2 X 1, X 2 są niezależne Czy µ 1 = µ 2? Czy σ 2 1 = σ 2 2? Próby: X 11,, X 1n1 ; X 21,, X 2n2 X 1, varx 1, s 2 1 = varx 1 n 1 1 X 2, varx 2, s 2 2 = varx 2 n 2 1 RP W SET Statystyka 83

84 H 0 : µ 1 = µ 2 Założenie σ 2 1 = σ 2 2 Test Studenta (poziom istotności α) Statystyka testowa t emp = X 1 X 2 S r S r = S 2 e ( 1 n n 2 ), S 2 e = varx 1 + varx 2 n 1 + n 2 2 Wartość krytyczna t(α; n 1 + n 2 2) Jeżeli t emp > t(α; n 1 + n 2 2), to hipotezę H 0 : µ 1 = µ 2 odrzucamy RP W SET Statystyka 84

85 H 0 : µ 1 = µ 2 Bez założenia σ 2 1 = σ 2 2 Test V Behrensa Fishera (poziom istotności α) Statystyka testowa V = X 1 X 2 S r S r = S 2 1 n 1 + S2 2 n 2 Wartość krytyczna V (α; n 1 1, n 2 1, c) (n 1 n 2 ) c = S 2 1/n 1 S 2 1 /n 1 + S 2 2 /n 2 Jeżeli V > V (α; n 1 1, n 2 1, c), to hipotezę H 0 : µ 1 = µ 2 odrzucamy RP W SET Statystyka 85

86 Przykład Porównać przeciętne osiągnięcia punktowe pań i panów na klasówce ze statystyki Panowie: n 1 = 138, x1i = 82833, varx 1 = Panie: n 2 = 162, x2i = 93733, varx 2 = Populacja 1: Słuchacze podstawowego kursu statystyki Populacja 2: Słuchaczki podstawowego kursu statystyki Cecha X: ilość punktów zdobytych na klasówce Założenia: cecha X ma w populacji 1 rozkład N(µ 1, σ 2 1) cecha X ma w populacji 2 rozkład N(µ 2, σ 2 2) σ 2 1 = σ 2 2 Zadanie: zweryfikować hipotezę H 0 : µ 1 = µ 2 Technika statystyczna: test t poziom istotności 005 RP W SET Statystyka 86

87 Obliczenia s 2 r = x 1 = x 2 = = ( ) 162 t emp = = 1634 Wartość krytyczna t(005; 298) 196 Odpowiedź: hipotezy nie odrzucamy Wniosek Średnie ilości punktów uzyskiwane przez panie i panów można traktować jako porównywalne RP W SET Statystyka 87

88 Przedział ufności a test hipotezy H 0 : µ 1 = µ 2 Cecha X 1 N(µ 1, σ 2 1), X 2 N(µ 2, σ 2 2), σ 2 1 = σ 2 2 H 0 : µ 1 = µ 2 H 0 nie odrzucamy na poziomie istotności α t emp < t(α; n 1 + n 2 2) t(α; n 1 + n 2 2) < X 1 X 2 S r < t(α; n 1 + n 2 2) 0 ( X1 X 2 ± t(α; n 1 + n 2 2)S r ) 0 należy do przedziału ufności na poziomie ufności 1 α RP W SET Statystyka 88

89 Przykład Porównać wartości średnie dwóch cech X 1 oraz X 2 o rozkładach normalnych H 0 : µ 1 = µ 2 Test V Behrensa Fishera (α = 005) Próby: n 1 = 20 x 1 = 7440 s 2 1 = 1541 n 2 = 20 x 2 = 6505 s 2 2 = 8373 V = = = 419 c = 1541/ / /20 = = 015 Wartość krytyczna V (005; 19, 19, 015) = 206 Ponieważ V > V (005; 19, 19, 015), więc hipotezę H 0 : µ 1 = µ 2 odrzucamy RP W SET Statystyka 89

90 H 0 : µ 1 µ 2 Założenie σ 2 1 = σ 2 2 Test Studenta (poziom istotności α) Statystyka testowa t emp = X 1 X 2 S r Wartość krytyczna t(2α; n 1 + n 2 2) Jeżeli t emp > t(2α; n 1 + n 2 2), to hipotezę H 0 : µ 1 µ 2 odrzucamy Bez założenia σ 2 1 = σ 2 2 Test V Behrensa Fishera (poziom istotności α) Statystyka testowa V = X 1 X 2 S r Wartość krytyczna V (2α; n 1 1, n 2 1, c) (n 1 n 2 ) Jeżeli V > V (2α; n 1 1, n 2 1, c), to hipotezę H 0 : µ 1 µ 2 odrzucamy RP W SET Statystyka 90

91 H 0 : σ 2 1 = σ 2 2 Test F (poziom istotności α) Statystyka testowa F emp = S2 1 S 2 2 Wartości ( krytyczne F 1 α ) 2 ; n 1 1, n 2 1 ( α F 2 ; n 1 1, n 2 1) Jeżeli F emp < F lub F emp > F ( 1 α ) 2 ; n 1 1, n 2 1 ( α 2 ; n 1 1, n 2 1) to hipotezę H 0 : σ 2 1 = σ 2 2 odrzucamy RP W SET Statystyka 91

92 Uwaga F (1 α; u, v) = 1 F (α; v, u) Reguła: większa wariancja do licznika Jeżeli S 2 1 > S 2 2, to wyznaczana jest statystyka F emp = S2 1 S 2 2 i hipoteza jest odrzucana, gdy F emp > F ( α 2 ; n 1 1, n 2 1) Jeżeli zaś S 2 1 < S 2 2, to wyznaczana jest statystyka F emp = S2 2 S 2 1 i hipoteza jest odrzucana, gdy F emp > F ( α 2 ; n 2 1, n 1 1) RP W SET Statystyka 92

93 Przykład Dla sprawdzenia stabilności pracy maszyny pobrano dwie próbki: pierwszą w początkowym okresie eksploatacji oraz drugą po miesięcznym okresie pracy tej maszyny Wykonano pomiary wylosowanych produktów i otrzymano wyniki: n 1 = 25, x 1 = 324, s 2 1 = oraz n 2 = 19, x 2 = 319, s 2 2 = Zbadać na tej podstawie czy maszyna nie rozregulowała się w trakcie pracy Populacja 1 produkcja maszyny w początkowym okresie Populacja 2 produkcja maszyny po miesiącu eksploatacji Cecha X pomiar produktu Założenia cecha X ma w populacji 1 rozkład N(µ 1, σ 2 1) cecha X ma w populacji 2 rozkład N(µ 2, σ 2 2) RP W SET Statystyka 93

94 Formalizacja Stabilność pracy maszyny może być mierzona podobieństwem wytwarzanych produktów: im własności produktów są do siebie bardziej zbliżone, tym bardziej stabilna jest praca maszyny Podobieństwo takie jest wyrażane wariancją cechy Zatem stabilność pracy można wyrazić liczbowo jako wariancję interesującej cechy produktu, a problem stabilności jako zagadnienie weryfikacji hipotezy H 0 : σ 2 1 = σ 2 2 Technika statystyczna Test F (poziom istotności α = 010) Obliczenia F emp = s2 2 s 2 1 = 1051 Wartość krytyczna F (005; 19, 24) = 2114 Odpowiedź: hipotezy nie odrzucamy Wniosek: można uznać że maszyna nie rozregulowała się w trakcie pracy RP W SET Statystyka 94

95 H 0 : σ 2 1 σ 2 2 Test F (poziom istotności α) Statystyka testowa F emp = S2 1 S 2 2 Wartość krytyczna F (α; n 1 1, n 2 1) Jeżeli F emp > F (α; n 1 1, n 2 1) to hipotezę H 0 : σ 2 1 σ 2 2 odrzucamy Uwaga W tym przypadku zasada większa wariancja do licznika nie ma sensu RP W SET Statystyka 95

96 Porównanie dwóch rozkładów dwupunktowych Założenia: 1 X 1 D(p 1 ), X 2 D(p 2 ) 2 X 1, X 2 są niezależne H 0 : p 1 = p 2 Test przybliżony (poziom istotności α) ˆp 1 = k 1 n 1, ˆp 2 = k 2 n 2, ˆp = (k 1 + k 2 ) (n 1 + n 2 ) Statystyka testowa u emp = ˆp 1 ˆp 2 ˆp(1 ˆp)( 1 n n 2 ) u emp u 1 α/2 = H 0 : p 1 = p 2 odrzucamy RP W SET Statystyka 96

97 Przykład Celem badania było porównanie przygotowania z matematyki kandydatów na studia będących absolwentami liceów oraz techników W tym celu spośród kandydatów zdających matematykę wylosowano 400 absolwentów liceów oraz 600 absolwentów techników W wylosowanej grupie stwierdzono, że 385 absolwentów liceów oraz 501 absolwentów techników rozwiązało test wstępny Czy można na tej podstawie sądzić, że przygotowanie w obu grupach absolwentów jest jednakowe? Populacja 1: absolwenci liceów zdający egzamin wstępny Populacja 2: absolwenci techników zdający egzamin wstępny Cecha X: umiejętność rozwiązania testu (tak/nie) Założenia: cecha X ma w populacji 1 rozkład D(p 1 ) cecha X ma w populacji 2 rozkład D(p 2 ) Formalizacja Weryfikacja hipotezy H 0 : p 1 = p 2 RP W SET Statystyka 97

98 Technika statystyczna Test przybliżony (poziom istotności α = 005) Obliczenia n 1 = 400 k 1 = 385 ˆp 1 = 385/400 = n 2 = 600 k 2 = 501 ˆp 2 = 501/600 = u emp = ˆp = ( )/( ) = (1 0886) ( ) = Wartość krytyczna u 0975 = 196 Odpowiedź: hipotezę H 0 : p 1 = p 2 odrzucamy Wniosek: przygotowanie absolwentów liceów i techników z matematyki nie jest takie same RP W SET Statystyka 98

99 H 0 : p 1 p 2 Test przybliżony (poziom istotności α) ˆp 1 = k 1 n 1, ˆp 2 = k 2 n 2, ˆp = (k 1 + k 2 ) (n 1 + n 2 ) Statystyka testowa u emp = ˆp 1 ˆp 2 ˆp(1 ˆp)( 1 n n 2 ) u emp u 1 α = H 0 : p 1 p 2 odrzucamy RP W SET Statystyka 99

100 Porównanie wielu rozkładów normalnych Założenia: 1 X i N(µ i, σi 2 ), i = 1,, k 2 X 1,, X k są niezależne Czy µ 1 = = µ k? Czy σ 2 1 = = σ 2 k? Próby: X i1,, X ini, i = 1,, k X i, varx i, s 2 i = varx i n i 1 ; i = 1,, k RP W SET Statystyka 100

101 H 0 : µ 1 = = µ k Założenie σ 2 1 = = σ 2 k Test F (poziom istotności α) Statystyka testowa F emp = S2 a S 2 e S 2 a = 1 k 1 k n i ( X i X) 2 i=1 S 2 e = 1 N k k n i (X ij X i ) 2 i=1 j=1 X i = 1 n i n i X ij, X = 1 N k n i X ij j=1 i=1 j=1 N = k n i i=1 RP W SET Statystyka 101

102 Jeżeli F emp > F (α; k 1, N k), to hipotezę H 0 : µ 1 = = µ k odrzucamy Wniosek praktyczny: przynajmniej jedna ze średnich µ 1,, µ k jest inna od pozostałych Model analizy wariancji X ij = µ i + ε ij Błąd losowy ε ij N(0, σ 2 ) Przykłady Plenność kilku odmian pewnej rośliny uprawnej Wydajność pracowników kilku zakładów pracy Zarobki kilku grup społecznych Czynnik: odmiana, zakład, grupa Poziomy czynnika: badane odmiany, badane zakłady, badane grupy RP W SET Statystyka 102

103 Model analizy wariancji X ij = µ + a i + ε ij a i efekt i tego poziomu czynnika: k i=1 a i = 0 H 0 : a 1 = = a k = 0, H 0 : Tabela analizy wariancji k a 2 i = 0 i=1 Źródło Stopnie Sumy Średnie F emp zmienności swobody kwadratów kwadraty Czynnik k 1 vara S 2 a = vara k 1 Błąd losowy N k vare S 2 e = vare N k Ogółem N 1 vart S2 a/s 2 e vara = k n i ( X i X) 2, vare = i=1 k n i (X ij X i ) 2, i=1 j=1 k n i vart = (X ij X) 2, i=1 j=1 vara + vare = vart RP W SET Statystyka 103

104 Grupy jednorodne podzbiory średnich, które można uznać za takie same Procedury porównań wielokrotnych postępowanie statystyczne zmierzające do podzielenia zbioru średnich na grupy jednorodne Procedury: Tukeya, Scheffégo, Bonfferroniego, Duncana, Newmana Kuelsa i inne Ogólna idea procedur porównań wielokrotnych (n 1 = = n k ) N IR najmniejsza istotna różnica Jeżeli X i X j < NIR, to uznajemy, że µ i = µ j Jeżeli X i X j < NIR X i X l < NIR X l X j < NIR, to uznajemy, że µ i = µ j = µ l Badając w ten sposób wszystkie pary średnich próbkowych otrzymujemy podział zbioru średnich na grupy jednorodne RP W SET Statystyka 104

105 Procedura Tukeya Założenie: n 1 = = n k = n NIR = t(α; k, N k)s e 1 n t(α; k, N k) wartość krytyczna studentyzowanego rozstępu Przypadek nierównolicznych prób Jedna z modyfikacji procedury Tukeya NIR ij = t(α; k, N k)s e 1 2 ( 1 n i + 1 n j ) RP W SET Statystyka 105

106 Przykład Przeprowadzić analizę porównawczą wyników punktowych klasówki w grupach studenckich Populacje Możemy wyodrębnić dziesięć populacji indeksowanych numerami grup studenckich Cecha X Ilość punktów uzyskanych na klasówce Założenia cecha X ma w i tej populacji rozkład N(µ i, σ 2 i ) (i = 1,, 10) σ 2 1 = = σ 2 10 Formalizacja weryfikacja hpotezy H 0 : µ 1 = = µ 10 Techniki statystyczna Jednoczynnikowa analiza wariancji Porównania szczegółowe Poziom istotności 005 RP W SET Statystyka 106

107 Obliczenia i n i xi x 2 i i n i x i n i ( x i x) 2 varx i N =300 x= vara= vare= vart = /300 = RP W SET Statystyka 107

108 Tabela analizy wariancji Źródło Stopnie Sumy Średnie Femp zmienności swobody kwadratów kwadraty Grupa Błąd losowy Ogółem Wartość krytyczna F (005; 9, 290) = 1912 Odpowiedź: hipotezę H 0 : µ 1 = = µ 10 odrzucamy Wniosek: przynajmniej jedna grupa uzyskała inną średnią liczbę punktów niż pozostałe RP W SET Statystyka 108

109 Wyznaczenie grup jednorodnych Procedura Tukeya (α = 005) Wartość krytyczna: t(005; 10, 290) = 4474 NIR = = i x i RP W SET Statystyka 109

110 RP W SET Statystyka 110

111 Porównanie wariancji Cecha X i ma rozkład normalny N(µ i, σi 2) Średnie µ i oraz wariancje σi 2 są nieznane H 0 : σ 2 1 = = σ 2 k Test Bartletta (poziom istotności α) Statystyka testowa M = (N k) ln ( 1 N k k k (n i 1)Si 2 i=1 ) i=1 (n i 1) ln S 2 i S 2 i = 1 n i 1 n i j=1 (X ij X i ) 2 Jeżeli M > m(α), to H 0 : σ 2 1 = = σ 2 k odrzucamy RP W SET Statystyka 111

112 m(α) = 1 c 1 c [(c 1 c 3 )m 1 (α; k, c 1 ) + (c 3 c)m 2 (α; k, c 1 )] c 1 = k i=1 1 n i 1 1 N k c 3 = k i=1 1 (n i 1) 1 3 (N k), 3 c = c 3 1/k 2, m 1 (α; k, c 1 ), m 2 (α; k, c 1 ) są stablicowane Jeżeli wszystkie n i > 4, to statystyka testowa M 1 + c 1 /(3(k 1)) ma w przybliżeniu rozkład chi kwadrat z k 1 stopniami swobody Jeżeli c 1 = 0, to m 1 (α; k, c 1 ) = m 2 (α; k, c 1 ) = χ 2 (α; k 1) RP W SET Statystyka 112

113 Przypadek n 1 = = n k = n Test Cochrana (poziom istotności α) Statystyka testowa G = S 2 max S S2 k S 2 max = max{s 2 1,, S 2 k} Jeżeli G > g(α; k, n), to H 0 : σ 2 1 = = σ 2 k odrzucamy Wartości krytyczne g(α; k, n) są podane w tablicach RP W SET Statystyka 113

114 Przypadek n 1 = = n k = n Test Hartleya (poziom istotności α) Statystyka testowa F max = S2 max S 2 min S 2 min = min{s 2 1,, S 2 k} Jeżeli F max > f max (α; k, n), to H 0 : σ 2 1 = = σ 2 k odrzucamy Wartości krytyczne f max (α; k, n) są podane w tablicach RP W SET Statystyka 114

115 Przykład W celu porównania zróżnicowania cen targowiskowych na jaja w czterech województwach w Polsce z każdego województwa wylosowano pewne ilości targowisk i zanotowano przeciętne ceny jaj na tych targowiskach Po odpowiednich przeliczeniach uzyskano nastepujące wyniki Województwo Liczba targowisk n i Wariancja s 2 i Czy można na tej podstawie uznać, że zróżnicowanie cen w badanych województwach jest takie same? Populacje Są cztery populacje: targowiska w badanych województwach Cecha X przeciętna cena jaj na targowisku Założenie cecha w i tej populacji ma rozkład N(µ i, σ 2 i ) (i = 1, 2, 3, 4) RP W SET Statystyka 115

116 Formalizacja Miernikiem zróżnicowania cechy jest jej wariancja Zatem problem analizy porównawczej zróżnicowania cen można zapisać jako zagadnienie weryfikacji hipotezy H 0 : σ 2 1 = = σ 2 4 Technika statystyczna Test Bartletta (poziom istoności α = 005) Obliczenia n i (n i 1)s 2 i (n i 1)lns 2 i 1/(n i 1) 1/(n i 1) Razem M = (26 4) ln ( ) = c 1 = c 3 = (26 4) = (26 4) 3 = c = = RP W SET Statystyka 116

117 Wartość krytyczna m(005) = m 1 (005; 4, 07141) = m 2 (005; 4, 07141) = ( )84630+( ) = Odpowiedź: nie ma podstaw do odrzucenia weryfikowanej hipotezy Wniosek: zróżnicowanie cen targowiskowych w badanych województwach można uznać za takie same RP W SET Statystyka 117

118 Badanie zgodności z określonym rozkładem H 0 : Cecha X ma rozkład F F jest dowolnym rozkładem prawdopodobieństwa Test chi kwadrat zgodności F jest rozkładem ciągłym Test Kołmogorowa F jest rozkładem normalnym Test Shapiro Wilka RP W SET Statystyka 118

119 Test Chi kwadrat zgodności (poziom istotności α) Statystyka testowa Klasa Liczebność 1 n 1 2 n 2 k n k χ 2 emp = k i=1 (n i n t i )2 n t i n t i = Np t i, N = k n i, i=1 p t i = P F {X przyjęła wartość z klasy i} Wartość krytyczna χ 2 (α; k u 1) (u jest liczbą nieznanych parametrów hipotetycznego rozkładu F ) Wniosek Jeżeli χ 2 emp > χ 2 (α; k u 1), to hipotezę H 0 odrzucamy RP W SET Statystyka 119

120 Przykład Pracodawca przypuszcza, że liczba pracowników nieobecnych w różne dni tygodnia nie jest taka sama W tym celu w ciągu pewengo okresu czasu zebrał następujące dane Dzień n i Poniedziałek 200 Wtorek 160 Środa 140 Czwartek 140 Piątek 100 Populacja: Cecha X: dzień nieobecności pracownika Założenie: cecha przyjmuje wartości będące nazwami dni tygodnia (cecha jakościowa) RP W SET Statystyka 120

hipotez statystycznych

hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

Elementy Rachunek prawdopodobieństwa

Elementy Rachunek prawdopodobieństwa Elementy rachunku prawdopodobieństwa Rachunek prawdopodobieństwa zajmuje się analizą praw rządzących zdarzeniami losowymi Pojęciami pierwotnymi są: zdarzenie elementarne ω oraz zbiór zdarzeń elementarnych

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

Porównanie wielu rozkładów normalnych

Porównanie wielu rozkładów normalnych Porównanie wielu rozkładów normalnych Założenia:. X i N(µ i, σi 2 ), i =,..., k 2. X,..., X k są niezależne Czy µ = = µ k? Czy σ 2 = = σ 2 k? Próby: X i,..., X ini, i =,..., k X i, varx i, s 2 i = varx

Bardziej szczegółowo

Porównanie dwóch rozkładów normalnych

Porównanie dwóch rozkładów normalnych Porównanie dwóch rozkładów normalnych Założenia: 1. X 1 N(µ 1, σ 2 1), X 2 N(µ 2, σ 2 2) 2. X 1, X 2 są niezależne Ocena µ 1 µ 2 oraz σ 2 1/σ 2 2. Próby: X 11,..., X 1n1 ; X 21,..., X 2n2 X 1, varx 1,

Bardziej szczegółowo

1.1 Wstęp Literatura... 1

1.1 Wstęp Literatura... 1 Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................

Bardziej szczegółowo

Estymacja parametrów rozkładu cechy

Estymacja parametrów rozkładu cechy Estymacja parametrów rozkładu cechy Estymujemy parametr θ rozkładu cechy X Próba: X 1, X 2,..., X n Estymator punktowy jest funkcją próby ˆθ = ˆθX 1, X 2,..., X n przybliżającą wartość parametru θ Przedział

Bardziej szczegółowo

1 Weryfikacja hipotez statystycznych

1 Weryfikacja hipotez statystycznych Spis treści Spis treści 1 Weryfikacja hipotez statystycznych 1 1.1 Pojęcia................................ 1 2 Porównania z normami 3 2.1 Wstęp................................ 3 2.2 Porównanie z normami:

Bardziej szczegółowo

Elementy rachunku prawdopodobieństwa. Statystyka matematyczna. w zastosowaniach

Elementy rachunku prawdopodobieństwa. Statystyka matematyczna. w zastosowaniach Statystyka matematyczna w zastosowaniach Elementy rachunku prawdopodobieństwa Robert Pietrzykowski STATYSTYKA: nauka poświęcona metodom badania(analizowania) zjawisk masowych; polega na systematyzowaniu

Bardziej szczegółowo

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym Badanie zgodności z określonym rozkładem H 0 : Cecha X ma rozkład F F jest dowolnym rozkładem prawdopodobieństwa Test chi kwadrat zgodności F jest rozkładem ciągłym Test Kołmogorowa F jest rozkładem normalnym

Bardziej szczegółowo

Podstawy wnioskowania statystycznego

Podstawy wnioskowania statystycznego P S S : naukapoświęconametodombadania(analizowania) zjawisk masowych; polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w postaci zestawień tabelarycznych,

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Estymacja punktowa i przedziałowa

Estymacja punktowa i przedziałowa Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

1 Podstawy rachunku prawdopodobieństwa

1 Podstawy rachunku prawdopodobieństwa 1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych cd. Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:

Bardziej szczegółowo

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów Wstęp do probabilistyki i statystyki Wykład 4. Statystyki i estymacja parametrów dr hab.inż. Katarzyna Zakrzewska, prof.agh, Katedra Elektroniki, WIET AGH Wstęp do probabilistyki i statystyki. Wykład 4

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić). Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano

Bardziej szczegółowo

Biostatystyka, # 3 /Weterynaria I/

Biostatystyka, # 3 /Weterynaria I/ Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów

Bardziej szczegółowo

Rachunek Prawdopodobieństwa i Statystyka

Rachunek Prawdopodobieństwa i Statystyka Rachunek Prawdopodobieństwa i Statystyka W 2. Probabilistyczne modele danych Zmienne losowe. Rozkład prawdopodobieństwa i dystrybuanta. Wartość oczekiwana i wariancja zmiennej losowej Dr Anna ADRIAN Zmienne

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd. WYKŁAD 9 TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd. Było: Przykład 1. Badano krąŝek o wymiarach zbliŝonych do monety jednozłotowej ze stronami oznaczonymi: A, B. NaleŜy ustalić, czy krąŝek jest symetryczny?

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej

Bardziej szczegółowo

Rozkłady prawdopodobieństwa zmiennych losowych

Rozkłady prawdopodobieństwa zmiennych losowych Rozkłady prawdopodobieństwa zmiennych losowych Rozkład dwumianowy Rozkład normalny Marta Zalewska Zmienna losowa dyskretna (skokowa) jest to zmienna, której zbór wartości jest skończony lub przeliczalny.

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

STATYSTYKA

STATYSTYKA Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja

Bardziej szczegółowo

1 Estymacja przedziałowa

1 Estymacja przedziałowa 1 Estymacja przedziałowa 1. PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ (a) MODEL I Badana cecha ma rozkład normalny N(µ, σ) o nieznanym parametrze µ i znanym σ. Przedział ufności: [ ( µ x u 1 α ) ( σn ; x + u 1 α

Bardziej szczegółowo

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15 VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,

Bardziej szczegółowo

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki Maszyna ustawiona jest tak, by produkowała kulki łożyskowe o średnicy 1 cm. Pomiar dziesięciu wylosowanych z produkcji kulek dał x = 1.1 oraz s 2 = 0.009. Czy można uznać, że maszyna nie rozregulowała

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją

Bardziej szczegółowo

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1 Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, Ŝe 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.

Bardziej szczegółowo

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1 Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.

Bardziej szczegółowo

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X Własności EX, D 2 X i DX przy przekształceniach liniowych Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X Przemnożenie wartości zmiennej losowej przez wartość stałą: Y=a*X

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. D A R I U S Z P I W C Z Y Ń S K I 2 2 ROZKŁAD ZMIENNEJ LOSOWEJ Polega na przyporządkowaniu

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład (wstępny). Producent twierdzi, że wadliwość produkcji wynosi 5%. My podejrzewamy, że rzeczywista wadliwość produkcji wynosi 15%. Pobieramy próbę stuelementową

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

(C. Gauss, P. Laplace, Bernoulli, R. Fisher, J. Spława-Neyman) Wikipedia 2008

(C. Gauss, P. Laplace, Bernoulli, R. Fisher, J. Spława-Neyman) Wikipedia 2008 STATYSTYKA MATEMATYCZNA - dział matematyki stosowanej oparty na rachunku prawdopodobieństwa; zajmuje się badaniem zbiorów na podstawie analizy ich części. Nauka, której przedmiotem zainteresowania są metody

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Z poprzedniego wykładu

Z poprzedniego wykładu PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1. Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa STATYSTYKA MATEMATYCZNA rachunek prawdopodobieństwa treść Zdarzenia losowe pojęcie prawdopodobieństwa prawo wielkich liczb zmienne losowe rozkłady teoretyczne zmiennych losowych Zanim zajmiemy się wnioskowaniem

Bardziej szczegółowo

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga 1 Zagadnienia 1. Przypomnienie wybranych pojęć rachunku prawdopodobieństwa. Zmienna losowa. Rozkład

Bardziej szczegółowo

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Niech Ω będzie przestrzenią zdarzeń elementarnych. Definicja 1 Rodzinę S zdarzeń losowych (zbiór S podzbiorów zbioru

Bardziej szczegółowo

Teoria Estymacji. Do Powyżej

Teoria Estymacji. Do Powyżej Teoria Estymacji Zad.1. W pewnym przedsiębiorstwie wylosowano niezależnie próbę 25 pracowników. Staż pracy (w latach) tych pracowników w 1996 roku był następujący: 37; 34; 0*; 5; 17; 17; 0*; 2; 24; 33;

Bardziej szczegółowo

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą

Bardziej szczegółowo

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe

Bardziej szczegółowo

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Akademicka 15, p.211a bud. Agro II, e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów LISTA 4 1.Na pewnym obszarze dokonano 40 pomiarów grubości warstwy piasku otrzymując w m.: 54, 58, 64, 69, 61, 56, 41, 48, 56, 61, 70, 55, 46, 57, 70, 55, 47, 62, 55, 60, 54,57,65,60,53,54, 49,58,62,59,55,50,58,

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010 STATYSTYKA MATEMATYCZNA WYKŁAD 14 18 stycznia 2010 Model statystyczny ROZKŁAD DWUMIANOWY ( ) {0, 1,, n}, {P θ, θ (0, 1)}, n ustalone P θ {K = k} = ( ) n θ k (1 θ) n k, k k = 0, 1,, n Geneza: Rozkład Bernoulliego

Bardziej szczegółowo

Dokładne i graniczne rozkłady statystyk z próby

Dokładne i graniczne rozkłady statystyk z próby Dokładne i graniczne rozkłady statystyk z próby Przypomnijmy Populacja Próba Wielkość N n Średnia Wariancja Odchylenie standardowe 4.2 Rozkład statystyki Mówimy, że rozkład statystyki (1) jest dokładny,

Bardziej szczegółowo

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem

Bardziej szczegółowo

Matematyka i statystyka matematyczna dla rolników w SGGW

Matematyka i statystyka matematyczna dla rolników w SGGW Było: Testowanie hipotez (ogólnie): stawiamy hipotezę, wybieramy funkcję testową f (test statystyczny), przyjmujemy poziom istotności α; tym samym wyznaczamy obszar krytyczny testu (wartość krytyczną funkcji

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA LISTA 10 1.Dokonano 8 pomiarów pewnej odległości (w m) i otrzymano: 201, 195, 207, 203, 191, 208, 198, 210. Wiedząc,że błąd pomiaru ma rozkład normalny

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Wykład 11 Testowanie jednorodności

Wykład 11 Testowanie jednorodności Wykład 11 Testowanie jednorodności Wrocław, 17 maja 2018 Test χ 2 jednorodności Niech X i, i = 1, 2,..., k będą niezależnymi zmiennymi losowymi typu dyskretnego przyjmującymi wartości z 1, z 2,..., z l,

Bardziej szczegółowo

2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7

2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7 Spis treści Spis treści 1 Przedziały ufności 1 1.1 Przykład wstępny.......................... 1 1.2 Określenie i konstrukcja...................... 3 1.3 Model dwupunktowy........................ 5 1.4

Bardziej szczegółowo

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Statystyka matematyczna. Wykład V. Parametryczne testy istotności Statystyka matematyczna. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Weryfikacja hipotezy o równości wartości średnich w dwóch populacjach 2 3 Weryfikacja hipotezy o równości wartości średnich

Bardziej szczegółowo

Rozkłady zmiennych losowych

Rozkłady zmiennych losowych Rozkłady zmiennych losowych Wprowadzenie Badamy pewną zbiorowość czyli populację pod względem występowania jakiejś cechy. Pobieramy próbę i na podstawie tej próby wyznaczamy pewne charakterystyki. Jeśli

Bardziej szczegółowo

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy

Bardziej szczegółowo

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa Marek Kubiak Instytut Informatyki Politechnika Poznańska Plan wykładu Podstawowe pojęcia rachunku prawdopodobieństwa Rozkład

Bardziej szczegółowo

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego Rozdział 1 Statystyki Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego X = (X 1,..., X n ). Uwaga 1 Statystyka jako funkcja wektora zmiennych losowych jest zmienną losową

Bardziej szczegółowo

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści

Bardziej szczegółowo

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej 1 Statystyka opisowa Statystyka opisowa zajmuje się porządkowaniem danych i wstępnym ich opracowaniem. Szereg statystyczny - to zbiór wyników obserwacji jednostek według pewnej cechy 1. szereg wyliczający

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo