STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne 6. Testy nieparametryczne 7. Korelacja i regresja liniowa i nieliniowa 8. Analiza wariancji
WSTĘP 1. Populacja i próba danych 2. Parametr populacji i estymator 3. Ważne aspekty związane z tworzeniem prób danych i estymacją parametrów 4. Błąd próbkowania 5. Błąd standardowy estymatora i przedziały ufności
POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące wycinka populacji
PARAMETR POPULACJI I ESTYMATOR 2 POPULACJA Parametr parameter nieznany dotyczy całej populacji np. rzeczywista średnia masa ciała i jej odchylenie standardowe w populacji ryjówek, ˆ ˆ 2 PRÓBA DANYCH Estymator estimator znany wartość obliczona dla danej próby np. obliczona średnia masa ciała i jej odchylenie standardowe w próbie danych
PARAMETR POPULACJI I ESTYMATOR 2 E( ) E N i1 p X E( ) 2 i i POPULACJA Parametr nieznany dotyczy całej populacji np. rzeczywista średnia masa ciała i jej odchylenie standardowe w populacji ryjówek, ˆ 2 ˆ n i1 i1 n n i i n 1 2 PRÓBA DANYCH Estymator znany wartość obliczona dla danej próby np. obliczona średnia masa ciała i jej odchylenie standardowe w próbie danych
WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW WYBÓR PRÓBY DANYCH Z POPULACJI 1. Liczebność próby danych 2. Replikacje 3. Wybór osobników z populacji do próby danych
WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW LICZEBNOŚĆ PRÓBY DANYCH 1. Liczba obserwacji w próbie 2. Im większa próba danych tym dokładniej można oszacować wartości parametrów populacji 3. Wielkość próby danych zależy od: łatwości zdobywania obserwacji, kosztów, dostępności obserwacji 4. Analiza mocy - technika statystyczna pozwalająca na określenie minimalnej wielkości próby danych dla danego eksperymentu
WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW WYBÓR PRÓBY DANYCH Z POPULACJI 1. Liczebność próby danych 2. Replikacje 3. Wybór osobników z populacji do próby danych
WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW REPLIKACJE 23 23 23 22 24
WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW REPLIKACJE 1. Stosowanie replikacji znacznie zwiększa wiarogodność wyciągniętych wniosków 2. Wybór osobników do każdej replikacji powinien być losowy 3. Idealnie każda próba danych powinna zawierać różne osobniki 4. Jeżeli technicznie trudno pobrać osobniki do replikacji i niektóre powtarzają się w poszczególnych próbach danych pseudoreplikacje
WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW WYBÓR PRÓBY DANYCH Z POPULACJI 1. Liczebność próby danych 2. Replikacje 3. Wybór osobników z populacji do próby danych
WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW TWORZENIE PRÓBY DANYCH WYBÓR LOSOWY Osobniki wybierane są bez stosowania selekcji Osobniki muszą reprezentować wszystkie warianty efektów działających na populację np. lokalizacja, wiek, płeć, ekspozycja na warunki środowiskowe, spokrewnienie NIELOSOWY Wybór wg spokrewnienia Wybór wg wartości cechy Eksperyment
POPULACJA I PRÓBA DANYCH NIELOSOWY WYBÓR OSOBNIKÓW Z POPULACJI DO PRÓBY DANYCH Wybór wg spokrewnienia Małe rodziny jednopokoleniowe (nuclear families) populacje ludzkie
POPULACJA I PRÓBA DANYCH NIELOSOWY WYBÓR OSOBNIKÓW Z POPULACJI DO PRÓBY DANYCH Wybór wg spokrewnienia Duże rodziny jednopokoleniowe Populacje zwierząt
POPULACJA I PRÓBA DANYCH NIELOSOWY WYBÓR OSOBNIKÓW Z POPULACJI DO PRÓBY DANYCH Wybór wg wartości cechy grupa doświadczalna grupa kontrolna (case-control)
POPULACJA I PRÓBA DANYCH NIELOSOWY WYBÓR OSOBNIKÓW Z POPULACJI DO PRÓBY DANYCH Eksperyment P: A B Zaplanowane: -warunki środowiskowe, -struktura genetyczna, -spokrewnienie -itp. F1: AB AB Wysoki koszt Wykorzystanie wszystkich osobników F2:
WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW TWORZENIE PRÓBY DANYCH WYBÓR LOSOWY Osobniki wybierane są bez stosowania selekcji Osobniki muszą reprezentować wszystkie warianty efektów działających na populację np. lokalizacja, wiek, płeć, ekspozycja na warunki środowiskowe, spokrewnienie NIELOSOWY Wybór wg spokrewnienia Wybór wg wartości cechy Eksperyment
DYSKUSJA OSZACOWAĆ ŚREDNI WZROST MIESZKAŃCÓW WROCŁAWIA Jak zebrać próbę danych?
BŁĄD PRÓBKOWANIA 21 23 23 21 26
BŁĄD PRÓBKOWANIA 1. Nie możemy precyzyjnie określić wielkości błędu próbkowania 2. Możemy w przybliżeniu określić dokładność estymatora Błąd standardowy estymatora Przedziały ufności estymatora
BŁĄD STANDARDOWY JAK DOKŁADNY JEST DANY ESTYMATOR??? BŁĄD STANDARDOWY PRZEDZIAŁ UFNOŚCI
BŁĄD STANDARDOWY 23 21 26 23 24 23 23
BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Błąd standardowy estymatora średniej: odchylenie standardowe rozkładu estymatora średniej s Jaki jest rozkład? Jak obliczyć S?
BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Jaki rozkład ma estymator średniej? Dla dużych prób danych (N): rozkład estymatora średniej zbliża się do rozkładu normalnego estymator średniej zbliża się do prawdziwej wartości parametru próby niezależnie od rozkładu obserwacji w próbie danych
BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Błąd standardowy estymatora średniej (standard error): odchylenie standardowe rozkładu estymatora średniej s Jaki jest rozkład? Jak obliczyć S?
BŁĄD STANDARDOWY ŚREDNIEJ ARYTMETYCZNEJ Jak obliczyć odchylenie standardowe rozkładu średniej (bez konieczności pobierania wielu prób danych)? Odchylenie standardowe w próbie danych: S S N S N i1 i N 1 2 Liczebność próby danych BŁĄD STANDARDOWY ŚREDNIEJ
BŁĄD STANDARDOWY JAK DOKŁADNY JEST DANY ESTYMATOR??? BŁĄD STANDARDOWY PRZEDZIAŁ UFNOŚCI
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Przedział ufności dla estymatora średniej: przedział w jakim z określonym prawdopodobieństwem znajduje się prawdziwa wartość parametru min ma granice przedziału ufności
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Jerzy Neyman
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Jak obliczyć granice przedziału ufności? 1. Wariancja próby znana (lub próba bardzo liczna) min z S ma z S, z N(0,1) 2. Wariancja próby nieznana (obliczana na podstawie obserwacji w próbie) min t, N1 S ma t, N1 S, t rozkl.t Studenta z α ( t α ) wartości krytyczne: takie wartości zmiennej losowej, że prawdopodobieństwo, że zmienna przyjmie wartość mniejszą od z α ( t α ) lub większą od z α ( t α ), wynosi α P( z z )
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ Prawdopodobieństwo wystąpienia prawdziwej średniej w przedziale ufności, a długość przedziału 1. Przedział ufności 95% P 0. 95 2. Przedział ufności 99% P 0. 99
INTERPRETACJA WYKRESÓW 4.0 2.0 0.0-2.0-4.0 1 2 3 4 5 6 7 8 9 10 4.0 2.0 0.0-2.0-4.0 1 2 3 4 5 6 7 8 9 10
PODSUMOWANIE 1. Populacja i próba danych 2. Parametr populacji i estymator 3. Ważne aspekty związane z tworzeniem prób danych i estymacją parametrów 4. Błąd próbkowania 5. Błąd standardowy estymatora i przedziały ufności