Metody probabilistyczne
|
|
- Robert Wojciechowski
- 6 lat temu
- Przeglądów:
Transkrypt
1 Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP / 30
2 Zagadnienia statystki Przeprowadzamy pewien eksperyment losowy, którego wynikiem są dane. Celem jest wyciągnięcie ogólnych wniosków na temat zbiorowości / zjawiska / procesu, z którego dane pochodzą. Wnioskowanie statystyczne jest podstawową metodologią badań w większości nauk (np. w medycynie, psychologii, ekonomii, fizyce eksperymentalnej), jak również stanowi bazę nowoczesnych metod sztucznej inteligencji (uczenie maszynowe) i analizy danych 2 / 30
3 Zagadnienia statystyki przykłady Sondaż wyborczy na próbie losowo wybranych osób celem oszacowania prawdziwego poparcia dla partii w całej populacji kraju Wnioskowanie o zmianach temperatury na podstawie pomiarów ze stacji pogodowych Sprawdzenie, czy istnieje zależność między danymi zjawiskami (np. palenie papierosów a zachorowalność na nowotworowy) Testowanie skuteczności nowego leku poprzez porównanie wyników próby badawczej (podajemy lek) i kontrolnej (podajemy placebo) Szacowanie czasu przejazdu po drogach na podstawie danych z GPS urządzeń mobilnych Badania marketingowe celem kierowania do konsumentów personalizowanych reklam 3 / 30
4 Próba i populacja Populacja (generalna) cała rozważana zbiorowość, np. wszyscy potencjalni wyborcy, wartości temperatur na całym globie, wszyscy możliwi pacjenci, itp. Próba zespół elementów wylosowany z populacji ( dane ), np. wyborcy wybrani do sondażu, wartości temperatur w stacjach pomiarowych, pacjenci wybrani do testowania leku, itp. 4 / 30
5 Próba i populacja Celem wnioskowania statystycznego jest wyciągnięcie wniosków o całej populacji na podstawie losowo wybranej próby 4 / 30
6 Próba i populacja Celem wnioskowania statystycznego jest wyciągnięcie wniosków o całej populacji na podstawie losowo wybranej próby Uwaga: Zakładamy, że próba jest reprezentatywna (każdy element populacji ma równe szanse na wejście do próby) i prosta (każdy element próby losowany niezależnie od pozostałych). 4 / 30
7 Populacja a rozkład prawdopodobieństwa Zwykle interesuje nas tylko konkretna cecha populacja, np. preferencje wyborcze, wysokość zarobków, temperatura, itp. 5 / 30
8 Populacja a rozkład prawdopodobieństwa Zwykle interesuje nas tylko konkretna cecha populacja, np. preferencje wyborcze, wysokość zarobków, temperatura, itp. 5 / 30
9 Populacja a rozkład prawdopodobieństwa Zwykle interesuje nas tylko konkretna cecha populacja, np. preferencje wyborcze, wysokość zarobków, temperatura, itp. 6/30 7/30 5/30 6/30 6/30 Zliczając częstości wystąpienia danej wartości cechy populację możemy traktować abstrakcyjnie jako rozkład prawdopodobieństwa cechy 5 / 30
10 Populacja a rozkład prawdopodobieństwa Zwykle interesuje nas tylko konkretna cecha populacja, np. preferencje wyborcze, wysokość zarobków, temperatura, itp. 6/30 7/30 5/30 6/30 6/30 Zliczając częstości wystąpienia danej wartości cechy populację możemy traktować abstrakcyjnie jako rozkład prawdopodobieństwa cechy Dla ciągłych cech modelujemy populację gęstością prawdopodobieństwa 5 / 30
11 Statystyka matematyczna Badaną cechę X modelujemy jako zmienną losową o pewnym rozkładzie P (na populacji) 6 / 30
12 Statystyka matematyczna Badaną cechę X modelujemy jako zmienną losową o pewnym rozkładzie P (na populacji) Próba o liczności n może być modelowana jako realizacje (wartości) n niezależnych zmiennych losowych o tym samym rozkładzie P X 1, X 2,..., X n 6 / 30
13 Statystyka matematyczna Badaną cechę X modelujemy jako zmienną losową o pewnym rozkładzie P (na populacji) Próba o liczności n może być modelowana jako realizacje (wartości) n niezależnych zmiennych losowych o tym samym rozkładzie P X 1, X 2,..., X n Obserwując próbę pochodzącą z nieznanego rozkładu P, wnioskujemy o interesujących nas własnościach tego rozkładu. 6 / 30
14 Rozkład empiryczny 6/30 7/30 5/30 6/30 6/30 7 / 30
15 Rozkład empiryczny 6/30 7/30 5/30 6/30 6/30 3/10 2/10 2/10 2/10 1/10 Rozkład empiryczny powstaje poprzez zliczenie częstości wystąpień poszczególnych wartości cechy na próbie. 7 / 30
16 Przykład: preferencje wyborcze Rozważmy drugą turę wyborów prezydenckich z kandydatami A i B. W populacji kandydat A ma poparcie 60%, a B 40% 8 / 30
17 Przykład: preferencje wyborcze Rozważmy drugą turę wyborów prezydenckich z kandydatami A i B. W populacji kandydat A ma poparcie 60%, a B 40% Niech X {0, 1} koduje poparcie kandydata A (X = 1) lub B (X = 0) 8 / 30
18 Przykład: preferencje wyborcze Rozważmy drugą turę wyborów prezydenckich z kandydatami A i B. W populacji kandydat A ma poparcie 60%, a B 40% Niech X {0, 1} koduje poparcie kandydata A (X = 1) lub B (X = 0) Cecha X ma więc rozkład dwupunktowy z parametrem p = / 30
19 Przykład: preferencje wyborcze Rozważmy drugą turę wyborów prezydenckich z kandydatami A i B. W populacji kandydat A ma poparcie 60%, a B 40% Niech X {0, 1} koduje poparcie kandydata A (X = 1) lub B (X = 0) Cecha X ma więc rozkład dwupunktowy z parametrem p = 0.6 Pobraliśmy próbę n = 10 elementów otrzymując wartości: 0, 1, 0, 1, 1, 1, 0, 0, 1, 0 8 / 30
20 Przykład: preferencje wyborcze Rozważmy drugą turę wyborów prezydenckich z kandydatami A i B. W populacji kandydat A ma poparcie 60%, a B 40% Niech X {0, 1} koduje poparcie kandydata A (X = 1) lub B (X = 0) Cecha X ma więc rozkład dwupunktowy z parametrem p = 0.6 Pobraliśmy próbę n = 10 elementów otrzymując wartości: 0, 1, 0, 1, 1, 1, 0, 0, 1, 0 Rozkład empiryczny jest rozkładem dwupunktowym z parametrem p = 5 10 = / 30
21 Teoria estymacji W ramach tego wykładu zajmiemy się tylko zadaniem estymacji parametrów rozkładu Teoria estymacji zajmuje się szacowaniem interesujących parametrów rozkładu na populacji na podstawie próby 9 / 30
22 Teoria estymacji W ramach tego wykładu zajmiemy się tylko zadaniem estymacji parametrów rozkładu Teoria estymacji zajmuje się szacowaniem interesujących parametrów rozkładu na populacji na podstawie próby Przykład: Cecha w populacji ma rozkład normalny N(µ, σ 2 ), gdzie µ i σ 2 są nieznane. Szacujemy te wartości na podstawie próby. 9 / 30
23 Statystyka i estymator Próba: Niezależne zmienne losowe X 1, X 2,..., X n o rozkładzie P. 10 / 30
24 Statystyka i estymator Próba: Niezależne zmienne losowe X 1, X 2,..., X n o rozkładzie P. Statystka Statystyką T = T (X 1, X 2,..., X n ) nazywamy dowolną funkcję próby Uwaga: statystyka jest zmienną losową, ponieważ jest funkcją zmiennych losowych! 10 / 30
25 Statystyka i estymator Próba: Niezależne zmienne losowe X 1, X 2,..., X n o rozkładzie P. Statystka Statystyką T = T (X 1, X 2,..., X n ) nazywamy dowolną funkcję próby Uwaga: statystyka jest zmienną losową, ponieważ jest funkcją zmiennych losowych! Estymator Estymatorem = (X 1, X 2,..., X n ) nazywamy statystykę szacującą nieznany parametr θ rozkładu P Uwaga: estymator jest zmienną losową, więc ma swój rozkład, wartość oczekiwaną, wariancję, itp. 10 / 30
26 Przykład: szacowanie wartości oczekiwanej Załóżmy, że chcemy oszacować wartość oczekiwaną µ = EX rozkładu zmiennej losowej X. 11 / 30
27 Przykład: szacowanie wartości oczekiwanej Załóżmy, że chcemy oszacować wartość oczekiwaną µ = EX rozkładu zmiennej losowej X. Rozważmy estymator parametru µ będący średnią arytmetyczną próby µ = X n = 1 n X i n 11 / 30
28 Przykład: szacowanie wartości oczekiwanej Załóżmy, że chcemy oszacować wartość oczekiwaną µ = EX rozkładu zmiennej losowej X. Rozważmy estymator parametru µ będący średnią arytmetyczną próby Zgodnie z prawem wielkich liczb: µ = X n = 1 n X i n X n z pr. 1 µ, a więc zwiększając wielkość próby n do nieskończoności, estymator µ zbiega do prawdziwej wartości parametru µ. 11 / 30
29 Zgodność estymatora Estymator parametru θ nazywamy silnie zgodnym jeśli: z pr. 1 θ Estymator nazywamy słabo zgodnym jeśli P θ Zgodność estymatora oznacza, że zbiega on do prawdziwej wartości parametru, gdy rozmiar próby n rośnie do nieskończoności 12 / 30
30 Zgodność estymatora Estymator parametru θ nazywamy silnie zgodnym jeśli: z pr. 1 θ Estymator nazywamy słabo zgodnym jeśli P θ Zgodność estymatora oznacza, że zbiega on do prawdziwej wartości parametru, gdy rozmiar próby n rośnie do nieskończoności Wniosek: estymator µ = X n jest silnie zgodnym estymatorem wartości oczekiwanej µ = EX. 12 / 30
31 Przykład: preferencje wyborcze Rozważmy drugą turę wyborów prezydenckich (kandydaci A 1 i B 0). Zmienna X {0, 1} (poparcie A) ma rozkład B(p), gdzie p = EX jest poparciem kandydata w populacji. 13 / 30
32 Przykład: preferencje wyborcze Rozważmy drugą turę wyborów prezydenckich (kandydaci A 1 i B 0). Zmienna X {0, 1} (poparcie A) ma rozkład B(p), gdzie p = EX jest poparciem kandydata w populacji. Estymator wartości oczekiwanej p: p = 1 n X i n = #sukcesów w próbie n jest częstością sukcesów w próbie. 13 / 30
33 Przykład: preferencje wyborcze Rozważmy drugą turę wyborów prezydenckich (kandydaci A 1 i B 0). Zmienna X {0, 1} (poparcie A) ma rozkład B(p), gdzie p = EX jest poparciem kandydata w populacji. Estymator wartości oczekiwanej p: p = 1 n X i n = #sukcesów w próbie n jest częstością sukcesów w próbie. p jest silnie zgodnym estymatorem parametru p. 13 / 30
34 Metoda momentów Estymator wartości oczekiwanej X n jest przykładem zastosowania tzw. metody momentów: Chcąc oszacować moment rozkładu m k = E(X k ), użyjmy estymatora m k będącego odpowiednim momentem rozkładu empirycznego: m k = 1 n n (zamiast wartości oczekiwanej bierzemy średnią po próbie) X k i 14 / 30
35 Przykład: estymator wariancji Chcemy oszacować wariancję σ 2 = D 2 (X ) rozkładu zmiennej losowej X. 15 / 30
36 Przykład: estymator wariancji Chcemy oszacować wariancję σ 2 = D 2 (X ) rozkładu zmiennej losowej X. Ponieważ D 2 (X ) = E(X 2 ) (EX ) 2 = m 2 m1 2, bierzemy estymator wariancji: σ 2 = m 2 m 2 1 = 1 n n X 2 i (X n ) 2 15 / 30
37 Przykład: estymator wariancji Chcemy oszacować wariancję σ 2 = D 2 (X ) rozkładu zmiennej losowej X. Ponieważ D 2 (X ) = E(X 2 ) (EX ) 2 = m 2 m1 2, bierzemy estymator wariancji: σ 2 = m 2 m 2 1 = 1 n n X 2 i (X n ) 2 = 1 n n (X i X n ) 2 15 / 30
38 Przykład: estymator wariancji Chcemy oszacować wariancję σ 2 = D 2 (X ) rozkładu zmiennej losowej X. Ponieważ D 2 (X ) = E(X 2 ) (EX ) 2 = m 2 m1 2, bierzemy estymator wariancji: σ 2 = m 2 m 2 1 = 1 n n X 2 i (X n ) 2 = 1 n n (X i X n ) 2 Zadanie 1 Uzasadnij, ostatnią równość, tzn. pokaż wzór skróconego mnożenia: 1 n n (X i X n ) 2 = 1 n n X 2 i (X n ) 2 Zwróć uwagę na analogię do E ( (X EX ) 2) = E(X 2 ) (EX ) 2, tyle że zamiast uśredniać po rozkładzie, uśredniamy po próbie. 15 / 30
39 Przykład: estymator wariancji Chcemy oszacować wariancję σ 2 = D 2 (X ) rozkładu zmiennej losowej X. Ponieważ D 2 (X ) = E(X 2 ) (EX ) 2 = m 2 m1 2, bierzemy estymator wariancji: σ 2 = m 2 m 2 1 = 1 n n X 2 i (X n ) 2 = 1 n n (X i X n ) 2 Zadanie 2 Pokaż, że σ 2 jest silnie zgodny poprzez dwukrotne zastosowania prawa wielkich liczb do 1 n n X 2 i oraz do X n. 15 / 30
40 Estymator nieobciążony Zgodność estymatora jest własnością asymptotyczną: mówi o zachowaniu estymatora tylko dla bardzo dużych prób (n ) 16 / 30
41 Estymator nieobciążony Zgodność estymatora jest własnością asymptotyczną: mówi o zachowaniu estymatora tylko dla bardzo dużych prób (n ) Obciążenie estymatora Obciążeniem estymatora parametru θ nazywamy różnicę między wartością oczekiwaną estymatora a nieznaną wartością parametru: E() θ 16 / 30
42 Estymator nieobciążony Zgodność estymatora jest własnością asymptotyczną: mówi o zachowaniu estymatora tylko dla bardzo dużych prób (n ) Obciążenie estymatora Obciążeniem estymatora parametru θ nazywamy różnicę między wartością oczekiwaną estymatora a nieznaną wartością parametru: Estymator nieobciążony E() θ Estymator nazywamy nieobciążonym jeśli jego obciążenie jest równe zero, tzn: E() = θ Estymator średnio trafia w wybrany parametr. Uwaga: to ma sens, bo estymator jest zmienną losową, więc ma swoją wartość oczekiwaną! 16 / 30
43 Estymator nieobciążony Zgodnie z prawem wielkich liczb, wartość oczekiwaną estymatora E() można interpretować jako średnią wartość estymatora przy wielokrotnym losowaniu próby θ θ 17 / 30
44 Estymator nieobciążony Zgodnie z prawem wielkich liczb, wartość oczekiwaną estymatora E() można interpretować jako średnią wartość estymatora przy wielokrotnym losowaniu próby θ θ 17 / 30
45 Estymator nieobciążony Zgodnie z prawem wielkich liczb, wartość oczekiwaną estymatora E() można interpretować jako średnią wartość estymatora przy wielokrotnym losowaniu próby Estymator nieobciążony θ Estymator obciążony θ 17 / 30
46 Estymator wartości oczekiwanej Estymator wartości oczekiwanej µ = EX postaci: µ = X n = 1 n jest nieobciążony n X i 18 / 30
47 Estymator wartości oczekiwanej Estymator wartości oczekiwanej µ = EX postaci: µ = X n = 1 n jest nieobciążony n X i Dowód: E( µ) = E ( 1 n ) n X i 18 / 30
48 Estymator wartości oczekiwanej Estymator wartości oczekiwanej µ = EX postaci: µ = X n = 1 n jest nieobciążony n X i Dowód: E( µ) = E ( 1 n ) n X i = 1 n EX n }{{} i =µ 18 / 30
49 Estymator wartości oczekiwanej Estymator wartości oczekiwanej µ = EX postaci: µ = X n = 1 n jest nieobciążony n X i Dowód: E( µ) = E ( 1 n ) n X i = 1 n EX n }{{} i =µ = µ 18 / 30
50 Estymator wartości oczekiwanej Estymator wartości oczekiwanej µ = EX postaci: jest nieobciążony Dowód: E( µ) = E µ = X n = 1 n X i n ( 1 n ) n X i = 1 n EX n }{{} i =µ = µ (jest to przypomnienie z wykładu o twierdzeniach granicznych, gdzie już udowodniliśmy, że EX n = µ) 18 / 30
51 Estymator wariancji Wyznacz obciążenie estymatora wariancji σ 2 = D 2 (X ) postaci: σ 2 = 1 n (X i X n ) 2 = 1 n Xi 2 n n X 2 n 19 / 30
52 Estymator wariancji Wyznacz obciążenie estymatora wariancji σ 2 = D 2 (X ) postaci: σ 2 = 1 n (X i X n ) 2 = 1 n Xi 2 n n X 2 n Odpowiedź: E( σ 2 ) = 1 n n E(X 2 i ) E(X 2 n) = E(X 2 ) E(X 2 n) 19 / 30
53 Estymator wariancji Wyznacz obciążenie estymatora wariancji σ 2 = D 2 (X ) postaci: σ 2 = 1 n (X i X n ) 2 = 1 n Xi 2 n n X 2 n Odpowiedź: E( σ 2 ) = 1 n n Ze wzoru skróconego mnożenia mamy: E(X 2 i ) E(X 2 n) = E(X 2 ) E(X 2 n) D 2 (X ) = E(X 2 ) (EX }{{}) 2, oraz D 2 (X n ) = E(X 2 n) (EX n ) 2, }{{} =µ =µ 19 / 30
54 Estymator wariancji Wyznacz obciążenie estymatora wariancji σ 2 = D 2 (X ) postaci: σ 2 = 1 n (X i X n ) 2 = 1 n Xi 2 n n X 2 n Odpowiedź: E( σ 2 ) = 1 n n Ze wzoru skróconego mnożenia mamy: E(X 2 i ) E(X 2 n) = E(X 2 ) E(X 2 n) D 2 (X ) = E(X 2 ) (EX }{{}) 2, oraz D 2 (X n ) = E(X 2 n) (EX n ) 2, }{{} =µ =µ stąd: E( σ 2 ) = D 2 (X ) + µ 2 ( D 2 (X n ) + µ 2) = D 2 (X ) D 2 (X n ) 19 / 30
55 Estymator wariancji Wyznacz obciążenie estymatora wariancji σ 2 = D 2 (X ) postaci: σ 2 = 1 n (X i X n ) 2 = 1 n Xi 2 n n X 2 n Odpowiedź: E( σ 2 ) = D 2 (X ) D 2 (X n ) 19 / 30
56 Estymator wariancji Wyznacz obciążenie estymatora wariancji σ 2 = D 2 (X ) postaci: σ 2 = 1 n (X i X n ) 2 = 1 n Xi 2 n n X 2 n Odpowiedź: E( σ 2 ) = D 2 (X ) D 2 (X n ) Zauważmy, że: D 2 (X ) = σ 2 19 / 30
57 Estymator wariancji Wyznacz obciążenie estymatora wariancji σ 2 = D 2 (X ) postaci: σ 2 = 1 n (X i X n ) 2 = 1 n Xi 2 n n X 2 n Odpowiedź: E( σ 2 ) = D 2 (X ) D 2 (X n ) Zauważmy, że: D 2 (X ) = σ 2 ( 1 D 2 (X n ) = D 2 n ) n X i 19 / 30
58 Estymator wariancji Wyznacz obciążenie estymatora wariancji σ 2 = D 2 (X ) postaci: σ 2 = 1 n (X i X n ) 2 = 1 n Xi 2 n n X 2 n Odpowiedź: E( σ 2 ) = D 2 (X ) D 2 (X n ) Zauważmy, że: D 2 (X ) = σ 2 ( 1 D 2 (X n ) = D 2 n ) n X i = 1 n n 2 D 2 (X i ) = }{{} σ 2 σ 2 n 19 / 30
59 Estymator wariancji Wyznacz obciążenie estymatora wariancji σ 2 = D 2 (X ) postaci: σ 2 = 1 n (X i X n ) 2 = 1 n Xi 2 n n X 2 n Odpowiedź: E( σ 2 ) = D 2 (X ) D 2 (X n ) Zauważmy, że: D 2 (X ) = σ 2 ( ) 1 n D 2 (X n ) = D 2 X i = 1 n n n 2 D 2 (X i ) = }{{} σ 2 Stąd: E( σ 2 ) = σ 2 σ2 n = n 1 n σ2 σ 2 Estymator wariancji σ 2 jest obciążony (niedoszacowuje!) σ 2 n 19 / 30
60 Ratujemy estymator wariancji Pokazaliśmy, że: E( σ 2 ) = n 1 n σ2, gdzie σ 2 = 1 n n (X i X n ) 2 20 / 30
61 Ratujemy estymator wariancji Pokazaliśmy, że: E( σ 2 ) = n 1 n σ2, gdzie σ 2 = 1 n Modyfikujemy estymator wariancji: n (X i X n ) 2 σ 2 = 1 n 1 n (X i X n ) 2 = n n 1 σ2 20 / 30
62 Ratujemy estymator wariancji Pokazaliśmy, że: E( σ 2 ) = n 1 n σ2, gdzie σ 2 = 1 n Modyfikujemy estymator wariancji: n (X i X n ) 2 σ 2 = 1 n 1 n (X i X n ) 2 = n n 1 σ2 Nowy estymator jest nieobciążony, ponieważ: E( σ 2 ) = E ( ) n n 1 σ2 = n n 1 E( σ2 ) = n n 1 n 1 n σ2 = σ 2 20 / 30
63 Podsumowanie Nieobciążony estymator wartości średniej µ = EX : µ = X n = 1 n X i n Nieobciążony estymator wariancji σ 2 = D 2 (X ): σ 2 = 1 n 1 n (X i X n ) 2 21 / 30
64 Podsumowanie Nieobciążony estymator wartości średniej µ = EX : µ = X n = 1 n X i n Nieobciążony estymator wariancji σ 2 = D 2 (X ): σ 2 = 1 n 1 n (X i X n ) 2 Zadanie 3 Niech µ = n c i X i będzie estymatorem wartości oczekiwanej µ = EX dla pewnych współczynników c 1,..., c n niezależnych od danych. Jaki warunek muszą spełniać te stałe, aby estymator był nieobciążony? 21 / 30
65 Brak obciążenia nie wystarcza Łatwo uzyskać estymator nieobciążony, który jest trywialny 22 / 30
66 Brak obciążenia nie wystarcza Łatwo uzyskać estymator nieobciążony, który jest trywialny Rozważmy estymator wartości oczekiwanej postaci µ 1 = X 1 22 / 30
67 Brak obciążenia nie wystarcza Łatwo uzyskać estymator nieobciążony, który jest trywialny Rozważmy estymator wartości oczekiwanej postaci µ 1 = X 1 Mamy: E( µ 1 ) = EX 1 = µ (estymator nieobciążony!) 22 / 30
68 Brak obciążenia nie wystarcza Łatwo uzyskać estymator nieobciążony, który jest trywialny Rozważmy estymator wartości oczekiwanej postaci µ 1 = X 1 Mamy: E( µ 1 ) = EX 1 = µ (estymator nieobciążony!) Ale ten estymator odrzuca wszystkie elementy próby poza X 1! 22 / 30
69 Brak obciążenia nie wystarcza Łatwo uzyskać estymator nieobciążony, który jest trywialny Rozważmy estymator wartości oczekiwanej postaci µ 1 = X 1 Mamy: E( µ 1 ) = EX 1 = µ (estymator nieobciążony!) Ale ten estymator odrzuca wszystkie elementy próby poza X 1! Np. przy szacowaniu poparcia kandydata A w wyborach, µ 1 zwraca wartość równą pierwszemu elementowi próby, czyli 0 lub 1! 22 / 30
70 Brak obciążenia nie wystarcza Łatwo uzyskać estymator nieobciążony, który jest trywialny Rozważmy estymator wartości oczekiwanej postaci µ 1 = X 1 Mamy: E( µ 1 ) = EX 1 = µ (estymator nieobciążony!) Ale ten estymator odrzuca wszystkie elementy próby poza X 1! Np. przy szacowaniu poparcia kandydata A w wyborach, µ 1 zwraca wartość równą pierwszemu elementowi próby, czyli 0 lub 1! Średnio jest to poprawne (równe prawdziwemu poparciu), ale jest to raczej kiepskie oszacowanie poparcia. 22 / 30
71 Brak obciążenia nie wystarcza Łatwo uzyskać estymator nieobciążony, który jest trywialny Rozważmy estymator wartości oczekiwanej postaci µ 1 = X 1 Mamy: E( µ 1 ) = EX 1 = µ (estymator nieobciążony!) Ale ten estymator odrzuca wszystkie elementy próby poza X 1! Np. przy szacowaniu poparcia kandydata A w wyborach, µ 1 zwraca wartość równą pierwszemu elementowi próby, czyli 0 lub 1! Średnio jest to poprawne (równe prawdziwemu poparciu), ale jest to raczej kiepskie oszacowanie poparcia. Potrzebujemy innych kryteriów oceny estymatorów 22 / 30
72 Wariancja estymatora Chcemy, aby nieobciążony estymator miał jak najmniejszą wariancję D 2 () θ θ 23 / 30
73 Wariancja estymatora Chcemy, aby nieobciążony estymator miał jak najmniejszą wariancję D 2 () Estymator nieobciążony Estymator nieobciążony θ θ 23 / 30
74 Wariancja estymatora Chcemy, aby nieobciążony estymator miał jak najmniejszą wariancję D 2 () Estymator nieobciążony Duża wariancja θ Estymator nieobciążony Mała wariancja θ 23 / 30
75 Relacja efektywności Rozważmy dwa estymatory nieobciążone 1 i 2 parametru θ. Mówimy, że 1 jest efektywniejszy od estymatora 2, jeśli dla każdej wartości parametru θ. D 2 ( 1 ) D 2 ( 2 ) 24 / 30
76 Relacja efektywności Rozważmy dwa estymatory nieobciążone 1 i 2 parametru θ. Mówimy, że 1 jest efektywniejszy od estymatora 2, jeśli dla każdej wartości parametru θ. D 2 ( 1 ) D 2 ( 2 ) Ściślej powinno być: efektywniejszy lub tak samo efektywny jak 24 / 30
77 Relacja efektywności Rozważmy dwa estymatory nieobciążone 1 i 2 parametru θ. Mówimy, że 1 jest efektywniejszy od estymatora 2, jeśli dla każdej wartości parametru θ. D 2 ( 1 ) D 2 ( 2 ) Ściślej powinno być: efektywniejszy lub tak samo efektywny jak Warunek dla każdego θ jest potrzebny, ponieważ wariancje estymatorów mogą zależeć od parametru rozkładu 24 / 30
78 Relacja efektywności Rozważmy dwa estymatory nieobciążone 1 i 2 parametru θ. Mówimy, że 1 jest efektywniejszy od estymatora 2, jeśli dla każdej wartości parametru θ. D 2 ( 1 ) D 2 ( 2 ) Ściślej powinno być: efektywniejszy lub tak samo efektywny jak Warunek dla każdego θ jest potrzebny, ponieważ wariancje estymatorów mogą zależeć od parametru rozkładu Relacja efektywności dotyczy tylko estymatorów nieobciążonych 24 / 30
79 Relacja efektywności Rozważmy dwa estymatory nieobciążone 1 i 2 parametru θ. Mówimy, że 1 jest efektywniejszy od estymatora 2, jeśli dla każdej wartości parametru θ. D 2 ( 1 ) D 2 ( 2 ) Ściślej powinno być: efektywniejszy lub tak samo efektywny jak Warunek dla każdego θ jest potrzebny, ponieważ wariancje estymatorów mogą zależeć od parametru rozkładu Relacja efektywności dotyczy tylko estymatorów nieobciążonych Relacja efektywności jest porządkiem częściowym, tzn. dwa estymatory mogą być nieporównywalne w sensie efektywności 24 / 30
80 Relacja efektywności Rozważmy dwa estymatory nieobciążone 1 i 2 parametru θ. Mówimy, że 1 jest efektywniejszy od estymatora 2, jeśli dla każdej wartości parametru θ. D 2 ( 1 ) D 2 ( 2 ) Ściślej powinno być: efektywniejszy lub tak samo efektywny jak Warunek dla każdego θ jest potrzebny, ponieważ wariancje estymatorów mogą zależeć od parametru rozkładu Relacja efektywności dotyczy tylko estymatorów nieobciążonych Relacja efektywności jest porządkiem częściowym, tzn. dwa estymatory mogą być nieporównywalne w sensie efektywności Estymator nieobciążony efektywniejszy od wszystkich innych estymatorów nieobciążonych (jeśli istnieje) nazywamy estymatorem efektywnym 24 / 30
81 Przykład Dla próby losowej X 1, X 2,..., X n rozważmy rodzinę estymatorów wartości oczekiwanej µ postaci: µ k = 1 k k X i, k = 1,..., n (czyli µ k bierze średnią z k pierwszych elementów próby) 25 / 30
82 Przykład Dla próby losowej X 1, X 2,..., X n rozważmy rodzinę estymatorów wartości oczekiwanej µ postaci: µ k = 1 k k X i, k = 1,..., n (czyli µ k bierze średnią z k pierwszych elementów próby) E( µ k ) = 1 k k EX }{{} i µ = µ (nieobciążone) 25 / 30
83 Przykład Dla próby losowej X 1, X 2,..., X n rozważmy rodzinę estymatorów wartości oczekiwanej µ postaci: µ k = 1 k k X i, k = 1,..., n (czyli µ k bierze średnią z k pierwszych elementów próby) E( µ k ) = 1 k EX i = µ (nieobciążone) k }{{} µ D 2 ( µ k ) = 1 k k 2 D 2 σ 2 (X i ) = }{{} k σ 2 25 / 30
84 Przykład Dla próby losowej X 1, X 2,..., X n rozważmy rodzinę estymatorów wartości oczekiwanej µ postaci: µ k = 1 k k X i, k = 1,..., n (czyli µ k bierze średnią z k pierwszych elementów próby) E( µ k ) = 1 k EX i = µ (nieobciążone) k }{{} µ D 2 ( µ k ) = 1 k k 2 D 2 σ 2 (X i ) = }{{} k σ 2 Estymator µ n = X n jest najefektywniejszy, a µ 1 = X 1 najmniej efektywny 25 / 30
85 Zadanie Zadanie 4 Rozważ estymator wartości oczekiwanej µ postaci: µ = n c i X i, dla pewnych współczynników c 1,..., c n (niezależnych od danych). Załóżmy, że µ jest nieobciążony (patrz zadanie 3). Dla jakich wartości c 1,..., c n ma on najmniejszą wariancję? 26 / 30
86 Czy estymator może mieć dowolnie małą wariancję? 27 / 30
87 Czy estymator może mieć dowolnie małą wariancję? Nierówność Craméra-Rao Niech będzie nieobciążonym estymatorem parametru θ wyznaczonym z próby X 1, X 2,..., X n. Zdefiniujmy funkcję informacji Fishera I (θ) jako: Dla rozkładów dyskretnych: ( ( ) ln p(x ) 2 ) I (θ) = E, gdzie p(x) jest prawd. wartości x θ Dla rozkładów ciągłych: ( ( ) ln f (X ) 2 ) I (θ) = E, gdzie f (x) jest gęstością θ Wtedy: D 2 () 1 ni (θ) 27 / 30
88 Czy estymator może mieć dowolnie małą wariancję? Nierówność Craméra-Rao Niech będzie nieobciążonym estymatorem parametru θ wyznaczonym z próby X 1, X 2,..., X n. Zdefiniujmy funkcję informacji Fishera I (θ) jako: Dla rozkładów dyskretnych: ( ( ) ln p(x ) 2 ) I (θ) = E, gdzie p(x) jest prawd. wartości x θ Dla rozkładów ciągłych: ( ( ) ln f (X ) 2 ) I (θ) = E, gdzie f (x) jest gęstością θ Wtedy: D 2 () 1 ni (θ) Dowód Dowód znajduje się w materiałach dodatkowych 27 / 30
89 Przykład Załóżmy że X ma rozkład normalny N(µ, σ 2 ) i chcemy estymować µ f (x) = { } 1 exp (x µ)2 2πσ 2 2σ 2 28 / 30
90 Przykład Załóżmy że X ma rozkład normalny N(µ, σ 2 ) i chcemy estymować µ f (x) = { } 1 exp (x µ)2 2πσ 2 2σ 2 ( ) 1 Mamy: ln f (x) = ln 2πσ 2 (x µ)2 2σ 2 28 / 30
91 Przykład Załóżmy że X ma rozkład normalny N(µ, σ 2 ) i chcemy estymować µ f (x) = { } 1 exp (x µ)2 2πσ 2 2σ 2 ( ) 1 (x µ)2 Mamy: ln f (x) = ln 2πσ 2 2σ 2 ln f (x) = ( ) (x µ) 2 µ µ 2σ 2 = 28 / 30
92 Przykład Załóżmy że X ma rozkład normalny N(µ, σ 2 ) i chcemy estymować µ f (x) = { } 1 exp (x µ)2 2πσ 2 2σ 2 ( ) 1 (x µ)2 Mamy: ln f (x) = ln 2πσ 2 2σ 2 ln f (x) = ( ) (x µ) 2 µ µ 2σ 2 = x µ σ 2 28 / 30
93 Przykład Załóżmy że X ma rozkład normalny N(µ, σ 2 ) i chcemy estymować µ f (x) = { } 1 exp (x µ)2 2πσ 2 2σ 2 ( ) 1 (x µ)2 Mamy: ln f (x) = ln 2πσ 2 2σ 2 ln f (x) = ( ) (x µ) 2 µ µ 2σ 2 = x µ σ 2 ( (X ) ) µ 2 I (µ) = E σ 2 = 28 / 30
94 Przykład Załóżmy że X ma rozkład normalny N(µ, σ 2 ) i chcemy estymować µ f (x) = { } 1 exp (x µ)2 2πσ 2 2σ 2 ( ) 1 (x µ)2 Mamy: ln f (x) = ln 2πσ 2 2σ 2 ln f (x) = ( ) (x µ) 2 µ µ 2σ 2 = x µ σ 2 ( (X ) ) µ 2 I (µ) = E σ 2 = 1 ( σ 4 E (X µ) 2) = }{{} σ 2 1 σ 2 28 / 30
95 Przykład c.d. X N(µ, σ 2 ), I (µ) = 1 σ 2 Z nierówności Craméra-Rao wynika więc, że dla dowolnego nieobciążonego estymatora µ wartości oczekiwanej µ: D 2 ( µ) 1 ni (µ) = 1 n1/σ 2 = σ2 n. 29 / 30
96 Przykład c.d. X N(µ, σ 2 ), I (µ) = 1 σ 2 Z nierówności Craméra-Rao wynika więc, że dla dowolnego nieobciążonego estymatora µ wartości oczekiwanej µ: D 2 ( µ) 1 ni (µ) = 1 n1/σ 2 = σ2 n. Ale wiemy, że estymator X n jest nieobciążony i ma wariancję σ2 n! 29 / 30
97 Przykład c.d. X N(µ, σ 2 ), I (µ) = 1 σ 2 Z nierówności Craméra-Rao wynika więc, że dla dowolnego nieobciążonego estymatora µ wartości oczekiwanej µ: D 2 ( µ) 1 ni (µ) = 1 n1/σ 2 = σ2 n. Ale wiemy, że estymator X n jest nieobciążony i ma wariancję σ2 n! Wniosek: Estymator µ = X n wartości oczekiwanej µ jest efektywny jeśli X ma rozkład normalny. 29 / 30
98 Zadanie Zadanie 4 Pokaż, że funkcja informacji Fishera I (p) dla rozkładu dwupunktowego B(p) ma postać: 1 I (p) = p(1 p) Następnie pokaż, że estymator X n wartości oczekiwanej p jest efektywny dla tego rozkładu 30 / 30
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Centralne twierdzenie graniczne
Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski Wykład 4 Ważne uzupełnienie Dwuwymiarowy rozkład normalny N (µ X, µ Y, σ X, σ Y, ρ): f XY (x, y) = 1 2πσ X σ Y 1 ρ 2 { [ (x ) 1
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Prawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory 1 grudnia 2014 Wprowadzenie Przykład: pomiar z błędem Współczynnik korelacji r(x, Z) = 0, 986 Wprowadzenie Przykład: pomiar z błędem Współczynnik korelacji
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 3 1 / 8 ZADANIE z rachunku
Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów
Wykład 6 Estymatory efektywne. Własności asymptotyczne estymatorów Wrocław, 30 listopada 2016r Powtórzenie z rachunku prawdopodobieństwa Zbieżność Definicja 6.1 Niech ciąg {X } n ma rozkład o dystrybuancie
Wykład z analizy danych: estymacja punktowa
Wykład z analizy danych: estymacja punktowa Marek Kubiak Instytut Informatyki Politechnika Poznańska Cel wykładu Model statystyczny W pewnej zbiorowości (populacji generalnej) obserwowana jest pewna cecha
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Dokładne i graniczne rozkłady statystyk z próby
Dokładne i graniczne rozkłady statystyk z próby Przypomnijmy Populacja Próba Wielkość N n Średnia Wariancja Odchylenie standardowe 4.2 Rozkład statystyki Mówimy, że rozkład statystyki (1) jest dokładny,
Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war
Wykład 5 Estymatory nieobciążone z jednostajnie minimalną wariancją Wrocław, 25 października 2017r Statystyki próbkowe - Przypomnienie Niech X = (X 1, X 2,... X n ) będzie n elementowym wektorem losowym.
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Metody probabilistyczne
Metody probabilistyczne. Twierdzenia graniczne Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 20.2.208 / 26 Motywacja Rzucamy wielokrotnie uczciwą monetą i zliczamy
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)
MODELE STATYSTYCZNE Punktem wyjścia w rozumowaniu statystycznym jest zmienna losowa (cecha) X i jej obserwacje opisujące wyniki doświadczeń bądź pomiarów. Zbiór wartości zmiennej losowej X (zbiór wartości
... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011 Temat. Weryfikacja hipotez statystycznych dotyczących proporcji. Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio
LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.
LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja
Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014
Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu
Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)
Wykład 4 Próbkowanie i rozkłady próbkowe µ = średnia w populacji, µ=ey, wartość oczekiwana zmiennej Y σ= odchylenie standardowe w populacji, σ =(Var Y) 1/2, pierwiastek kwadratowy wariancji zmiennej Y,
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Rozkłady statystyk z próby. Statystyka
Rozkłady statystyk z próby tatystyka Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających ten
Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015
Zmienne losowe, statystyki próbkowe Wrocław, 2 marca 2015 Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20
Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne
Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład
Wykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 19 października 2016r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Wykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 18 października 2017r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15
IV WYKŁAD STATYSTYKA 26/03/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 4 Populacja generalna, próba, losowanie próby, estymatory Statystyka (populacja generalna, populacja próbna, próbka mała, próbka duża, reprezentatywność,
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015
Testowanie hipotez dla proporcji Wrocław, 13 kwietnia 2015 Powtórka z rachunku prawdopodobieństwa Centralne Twierdzenie Graniczne Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu o średniej µ i
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017
Testowanie hipotez dla frakcji Wrocław, 29 marca 2017 Powtórzenie z rachunku prawdopodobieństwa Centralne Twierdzenie Graniczne Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu o średniej µ i skończonej
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów
Metody probabilistyczne
Metody probabilistyczne Teoria estymacji Jędrzej Potoniec Bibliografia Bibliografia Próba losowa (x 1, x 2,..., x n ) Próba losowa (x 1, x 2,..., x n ) (X 1, X 2,..., X n ) Próba losowa (x 1, x 2,...,
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.
Tematy: WSTĘP 1. Wprowadzenie do przedmiotu. Próbkowe odpowiedniki wielkości populacyjnych. Modele statystyczne i przykładowe zadania wnioskowania statystycznego. Statystyki i ich rozkłady. 2. Estymacja
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012
Wykład 2 Wrocław, 11 października 2012 Próba losowa Definicja. Zmienne losowe X 1, X 2,..., X n nazywamy próba losową rozmiaru n z rozkładu o gęstości f (x) (o dystrybuancie F (x)) jeśli X 1, X 2,...,
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
WYKŁAD 5 TEORIA ESTYMACJI II
WYKŁAD 5 TEORIA ESTYMACJI II Teoria estymacji (wyznaczanie przedziałów ufności, błąd badania statystycznego, poziom ufności, minimalna liczba pomiarów). PRÓBA Próba powinna być reprezentacyjna tj. jak
ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW
ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW POPULACJI Szkic wykładu Wprowadzenie 1 Wprowadzenie 2 3 4 Przypomnienie dotychczasowych rozważań Przedziałem ufności nazywamy przedział losowy, o którym przypuszczamy
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Statystyka w analizie i planowaniu eksperymentu
29 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Statystyka w analizie i planowaniu eksperymentu
31 marca 2014 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Estymacja parametrów rozkładu cechy
Estymacja parametrów rozkładu cechy Estymujemy parametr θ rozkładu cechy X Próba: X 1, X 2,..., X n Estymator punktowy jest funkcją próby ˆθ = ˆθX 1, X 2,..., X n przybliżającą wartość parametru θ Przedział
Statystyka matematyczna. Wykład III. Estymacja przedziałowa
Statystyka matematyczna. Wykład III. e-mail:e.kozlovski@pollub.pl Spis treści Rozkłady zmiennych losowych 1 Rozkłady zmiennych losowych Rozkład χ 2 Rozkład t-studenta Rozkład Fischera 2 Przedziały ufności
Wykład z analizy danych: estymacja punktowa
Wykład z analizy danych: estymacja punktowa Marek Kubiak Instytut Informatyki Politechnika Poznańska Plan wykładu Cel wykładu Model statystyczny Pojęcia podstawowe estymacji Kryteria oceny estymatorów
Rozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
STATYSTYKA wykład 5-6
TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Stanisław Cichocki Natalia Nehrebecka. Wykład 7
Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD STATYSTYK Z PRÓBY
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD STATYSTYK Z PRÓBY Próba losowa prosta To taki dobór elementów z populacji, że każdy element miał takie samo prawdopodobieństwo znalezienia się w próbie Niezależne
Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014
Metoda momentów i kwantyli próbkowych Wrocław, 7 listopada 2014 Metoda momentów Momenty zmiennych losowych X 1, X 2,..., X n - próba losowa. Momenty zmiennych losowych X 1, X 2,..., X n - próba losowa.
Testowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść I
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść I Szkic wykładu 1 Przykład wprowadzajacy 2 Prawo wielkich liczb Bernoulliego i centralne tw. graniczne 3 4 Przykład wprowadzajacy W Polsce różne głosowania odbywaja
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści
Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów
Wstęp do probabilistyki i statystyki Wykład 4. Statystyki i estymacja parametrów dr hab.inż. Katarzyna Zakrzewska, prof.agh, Katedra Elektroniki, WIET AGH Wstęp do probabilistyki i statystyki. Wykład 4
Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!
CO POWINNIŚMY WIEDZIEĆ (I ROZUMIEĆ) ZABIERAJĄC SIĘ DO CZYTANIA 1. Jeśli mamy wynik (np. z kolokwium) podany w wartościach standaryzowanych (np.: z=0,8) to wiemy, że aby ustalić jaki był wynik przed standaryzacją
Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego
Rozdział 1 Statystyki Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego X = (X 1,..., X n ). Uwaga 1 Statystyka jako funkcja wektora zmiennych losowych jest zmienną losową
Ważne rozkłady i twierdzenia c.d.
Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
1.1 Wstęp Literatura... 1
Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................
Prawdopodobieństwo i statystyka
Wykład XI: Testowanie hipotez statystycznych 12 stycznia 2015 Przykład Motywacja X 1, X 2,..., X N N (µ, σ 2 ), Y 1, Y 2,..., Y M N (ν, δ 2 ). Chcemy sprawdzić, czy µ = ν i σ 2 = δ 2, czyli że w obu populacjach
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi
Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa
Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa Marek Kubiak Instytut Informatyki Politechnika Poznańska Plan wykładu Podstawowe pojęcia rachunku prawdopodobieństwa Rozkład
VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15
VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,
Komputerowa analiza danych doświadczalnych
Komputerowa analiza danych doświadczalnych Wykład 9 27.04.2018 dr inż. Łukasz Graczykowski lukasz.graczykowski@pw.edu.pl Semestr letni 2017/2018 Metoda największej wiarygodności ierównosć informacyjna
Testowanie hipotez statystycznych
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez
Metoda największej wiarogodności
Wprowadzenie Założenia Logarytm funkcji wiarogodności Metoda Największej Wiarogodności (MNW) jest bardziej uniwersalną niż MNK metodą szacowania wartości nieznanych parametrów Wprowadzenie Założenia Logarytm
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
O ŚREDNIEJ STATYSTYCZNEJ
Od średniej w modelu gaussowskim do kwantyli w podstawowym modelu nieparametrycznym IMPAN 1.X.2009 Rozszerzona wersja wykładu: O ŚREDNIEJ STATYSTYCZNEJ Ryszard Zieliński XII Międzynarodowe Warsztaty dla
O ŚREDNIEJ STATYSTYCZNEJ
O ŚREDNIEJ STATYSTYCZNEJ Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków Rachunek Prawdopodobieństwa i Statystyka Kraków, 20 26 IX 2009 r. WYNIKI OBSERWACJI X 1, X 2,..., X n WYNIKI
STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010
STATYSTYKA MATEMATYCZNA WYKŁAD 14 18 stycznia 2010 Model statystyczny ROZKŁAD DWUMIANOWY ( ) {0, 1,, n}, {P θ, θ (0, 1)}, n ustalone P θ {K = k} = ( ) n θ k (1 θ) n k, k k = 0, 1,, n Geneza: Rozkład Bernoulliego
Własności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Statystyka i eksploracja danych
Wykład II: i charakterystyki ich rozkładów 24 lutego 2014 Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa,
Metody Statystyczne. Metody Statystyczne.
gkrol@wz.uw.edu.pl #4 1 Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE