PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elemety kombiatoryki 2. Zmiee losowe i ich rozkłady 3. Populacje i próby daych, estymacja parametrów 4. Testowaie hipotez 5. Testy parametrycze 6. Testy ieparametrycze 7. Korelacja liiowa i ragowa 8. Regresja prosta 9. Aaliza wariacji
1. Rozkład populacji (teoretyczy) i próby (empiryczy) 2. Parametry populacji i ich estymatory 3. Tworzeie próby, błąd przypadkowy (próbkowaia) 4. Statystyczy opis próby 5. Błąd stadardowy średiej arytmetyczej 6. Przedziały ufości dla średiej
Populacja Próba pobieraie wioskowaie Rozkład teoretyczy Rozkład empiryczy Przykłady: jedostajy dwumiaowy ormaly Wartości cechy w próbie i ich częstości
Przykład 1: pleość pewej rasy świń Cała populacja (stadardy rasowe pleości) 0,10 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Rozkład teoretyczy Próba: liczebość miotów 100 macior 0,16 0,14 0,12 0,10 0,08 Rozkład empiryczy 0,06 0,04 0,02 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Rozkład teoretyczy Przykład 1: pleość pewej rasy świń 0,10 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 pokazuje prawdopodobieństwa jest symetryczy Rozkład empiryczy 0,16 0,14 0,12 0,10 pokazuje częstości może być skośy mogą być braki wartości 0,08 0,06 0,04 0,02 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 ale: PRZYPOMINA TEORETYCZNY (im większa próba tym bardziej)
Przykład 2: zawartość tłuszczu w mleku Rozkład teoretyczy rozkład ormaly 0,5 0,4 0,3 POPULACJA: rozkład przedstawia prawdopodobieństwa jest symetryczy 0,2 0,1 0 Rozkład empiryczy 0,25 0,2 PRÓBA: kostruuje się szereg rozdzielczy (klasy wartości) rozkład przedstawia częstości wartości w klasach może być skośy 0,15 mogą być braki wartości 0,1 0,05 0 1 2 3 4 5 6 7 8 9 10 ale: PRZYPOMINA TEORETYCZNY (im większa próba tym bardziej)
Podstawowe parametry opisujące rozklad Wartość oczekiwaa E X Wariacja 2 i 1 i p i X 2 E Dodatkowe parametry opisujące rozkład Mediaa (wartość środkowa, Me) Modala (wartość ajczęstsza, Mo) Współczyiki skośości Wiele iych gdzie E(X )
Populacja Próba ESTYMATORY E ( X ) 2 PARAMETRY i 1 E[ X ] 2 i p i ˆ 2 ˆ i 1 2 i1 s ( i i ) 2
Próba ESTYMATORY (oszacowaia wartości parametrów) 1 i 1 i Średia arytmetycza to dobry estymator wartości oczekiwaej (1) (2) s s 2 2 1 i1 1 1 ( i1 i ( i ) 2 ) 2 Wariacja w próbie jest dobrym estymatorem wariacji w populacji, jeśli obliczamy ją według wzoru (2)
Populacja Próba pobieraie Pobieraie próby: liczebość próby powtórzeia (replikacje) wybór losowy lub ielosowy
Populacja Próba pobieraie Liczebość próby: im większa tym lepsze dopasowaie rozkładu i tym dokładiejsza ocea prarametrów
170 175 165 171 169 Powtórzeia czyli replikacje zwiększają wiarygodość wiosków
Populacja Próba pobieraie Próba systematycza (stosowaie różych kryteriów wyboru) doświadczalictwo, sodaże. Próba losowa prosta (wybór przypadkowy) do badaia populacji biologiczych. Próba losowa powia być możliwie licza.
170 175 165 171 169 Różica między a średią z próby to błąd przypadkowy (błąd próbkowaia)
Próba OPIS STATYSTYCZNY PRÓBY 1) Sporządzeie szeregu liczbowego wartości 2) Określeie wartości maksymalej, miimalej, rozstępu wartości, mediay i modalej, etc. 1 i 1 i 3) Skostruowaie szeregu rozdzielczego i uzyskaie rozkładu empiryczego (histogram) 4) Obliczeie średiej i wariacji (odchyleia stadardowego) s 2 1 1 i1 ( i ) 2 5) Określeie dokładości uzyskaych estymatorów ALE JAK?
JAK określić dokładość estymatorów?? Nie zamy prawdziwej wartości parametru 175 165 171 169 NIE ZNAMY wielkości błędu próbkowaia!!!
Jak określić dokładość estymatora, p. średiej arytmetyczej?? 175 165 171 169 Potraktować estymator jako zmieą losową i zaleźć jego rozkład. Np. średia arytmetycza jest zmieą losową o określoym rozkładzie.
Jak określić dokładość średiej arytmetyczej?? 175 165 171 169 ~ N(, ) ~ N(, ) Jeżeli to gdzie: to liczebość próby
~ N(, ) ~ N (, ) 0,5 0,4 0,3 0,2 0,1 0 O zmieości (rozrzucie) średiej świadczy jej stadardowe odchyleie
Na stadardowe odchyleie estymatora mówimy: BŁĄD STANDARDOWY ~ N (, ) BŁĄD STANDARDOWY jest miarą dokładości estymatora WAŻNE: awet, gdy próba pochodzi z populacji o rozkładzie iym iż ormaly, rozkład średiej z -elemetowej próby, wraz ze wzrostem coraz lepiej odpowiada rozkładowi ormalemu N (, ) Czyżby cetrale twierdzeie graicze?
Jak obliczyć błąd stadardowy średiej z kokretej próby? odchyleie stadardowe w próbie daych: S S S N i1 i 1 2 liczebość próby daych Pytaia: W jaki sposób błąd stadardowy określa dokładość estymatora ( im większy błąd, tym )? Od czego zależy wielkość błędu stadardowego?
Błąd stadardowy średiej arytmetyczej określa dokładość estymatora średiej moża go wykorzystać do określeia przedziału liczbowego, w którym z wysokim prawdopodobieństwem zajduje się prawdziwa wartość oczekiwaa taki przedział to PRZEDZIAŁ UFNOŚCI S S Pojęcie przedział ufości stworzył, opracował i wprowadził do statystyki polski matematyk
Ogólie: Przedział ufości parametru, określoy a poziomie ufości 1- to taki przedział liczbowy, w którym z prawdopodobieństwem 1- zaduje się prawdziwa wartość parametru. Przedział ufości wartości średiej, określoy a poziomie ufości 1- to taki przedział liczbowy ( 1, 2) zaduje się prawdziwa wartość, w którym z prawdopodobieństwem 1- P( ) 1 1 2 graice przedziału ufości
Dwa podstawowe poziomy ufości P( 2) 1 1 (1) (2) dla = 0,05 1 = 0,95 dla = 0,01 1 = 0,99 95% przedział ufości 99% przedział ufości
Jak obliczyć wartości wyzaczające przedział ufości? 1. Wariacja populacji zaa (lub próba bardzo licza, >30) 1 z S 2 z S, z ~ N(0,1) 2. Wariacja populacji iezaa (mała próba) 1 t, N1S 2 t, N1S, t ~ rozkl.t Studeta z α ( t α ) wartości krytycze: takie wartości zmieej losowej, że prawdopodobieństwo, że zmiea przyjmie wartość miejszą od z α ( t α ) lub większą od z α ( t α ), wyosi α P( z z )
95% przedział ufości 99% przedział ufości = 0,05 1 = 0,95 = 0,01 1 = 0,99 Przykład: obliczoo przedziały ufości dla wartości oczekiwaej cechy ieśość poczatkowa kur, próba liczyła 30 pomiarów, średia wyiosła 219, stadardowe odchyleie 33. 208 < < 230 205 < < 234 Pytaie: Jak poziom ufości wpływa a długość przedziału?
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Zastosowaie przedziałów ufości: określaie (a podstawie wartości estymatora) przedziału liczbowego, w którym zajduje się prawdziwa wartość parametru (estymacja przedziałowa) sprawdzaie, czy próba pochodzi z populacji o zaych parametrach, czy dwie próby pochodzą z tej samej populacji (weryfikacja hipotez) 175 170 165 Szczegóły a ćwiczeiach ZAPRASZAM!
1. Rozkład populacji (teoretyczy) i próby (empiryczy) 2. Parametry populacji i ich estymatory 3. Tworzeie próby daych, błąd próbkowaia 4. Statystyczy opis próby 5. Błąd stadardowy średiej arytmetyczej 6. Przedziały ufości dla średiej