STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Podobne dokumenty
STATYSTYKA MATEMATYCZNA

METODY STATYSTYCZNE W BIOLOGII

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Wnioskowanie statystyczne. Statystyka w 5

1 Podstawy rachunku prawdopodobieństwa

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Analiza niepewności pomiarów

Z poprzedniego wykładu

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

METODY STATYSTYCZNE W BIOLOGII

STATYSTYKA MATEMATYCZNA

Zarządzanie populacjami zwierząt. Parametry genetyczne cech

Pozyskiwanie wiedzy z danych

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

METODY STATYSTYCZNE W BIOLOGII

Rozkłady statystyk z próby. Statystyka

Zadania ze statystyki, cz.6

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Pobieranie prób i rozkład z próby

W1. Wprowadzenie. Statystyka opisowa

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

CECHY ILOŚCIOWE PARAMETRY GENETYCZNE

WNIOSKOWANIE STATYSTYCZNE

Oszacowanie i rozkład t

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Metody Statystyczne. Metody Statystyczne.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

STATYSTYKA wykład 5-6

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Próba własności i parametry

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Zadania ze statystyki cz.8. Zadanie 1.

Estymacja parametrów rozkładu cechy

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

1 Estymacja przedziałowa

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

STATYSTYKA POWTORZENIE. Dr Wioleta Drobik-Czwarno

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Rozkłady statystyk z próby

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Estymacja punktowa i przedziałowa

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Statystyka Matematyczna Anna Janicka

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Statystyka matematyczna

Wykład 3 Hipotezy statystyczne

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

STATYSTYKA MATEMATYCZNA

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

WYKŁAD 5 TEORIA ESTYMACJI II

Kolokwium ze statystyki matematycznej

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

INFORMATYKA W CHEMII Dr Piotr Szczepański

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Dokładne i graniczne rozkłady statystyk z próby

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka matematyczna i ekonometria

WNIOSKOWANIE STATYSTYCZNE

KARTA KURSU. Kod Punktacja ECTS* 1

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wykład 3. Rozkład normalny

METODY STATYSTYCZNE W BIOLOGII

1.1 Wstęp Literatura... 1

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Statystyka matematyczna i ekonometria

Transkrypt:

STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych

POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące wycinka populacji Copyright 2010, Joanna Szyda

PARAMETR POPULACJI I ESTYMATOR 2 POPULACJA Parametr parameter nieznany dotyczy całej populacji np. rzeczywista średnia masa ciała i jej odchylenie standardowe w populacji ryjówek x s 2 PRÓBA DANYCH Estymator estimator znany wartość obliczona dla danej próby np. obliczona średnia masa ciała i jej odchylenie standardowe w próbie danych Copyright 2010, Joanna Szyda

WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW WYBÓR PRÓBY DANYCH Z POPULACJI 1. Liczebność próby danych 2. Replikacje 3. Wybór osobników z populacji do próby danych Copyright 2010, Joanna Szyda

WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW LICZEBNOŚĆ PRÓBY DANYCH 1. Liczba obserwacji w próbie 2. Im większa próba danych tym dokładniej można oszacować wartości parametrów populacji 3. Wielkość próby danych zależy od: łatwości zdobywania obserwacji, kosztów, dostępności obserwacji 4. Czynniki wpływające na wymaganą wielkość próby danych zmienność obserwacji = odchylenie standardowe, dokładność pomiarów, hipoteza badawcza Copyright 2013, Joanna Szyda

WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW WYBÓR PRÓBY DANYCH Z POPULACJI 1. Liczebność próby danych 2. Replikacje 3. Wybór osobników z populacji do próby danych Copyright 2010, Joanna Szyda

WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW x 23 REPLIKACJE estymacja parametrów w kilku próbach danych x 23 23 x 22 x 24 Copyright 2010, Joanna Szyda

WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW REPLIKACJE 1. Stosowanie replikacji znacznie zwiększa wiarogodność wyciągniętych wniosków 2. Wybór osobników do każdej replikacji powinien być losowy 3. Idealnie każda próba danych powinna zawierać różne osobniki 4. Jeżeli technicznie trudno pobrać osobniki do replikacji i niektóre powtarzają się w poszczególnych próbach danych pseudoreplikacje Copyright 2010, Joanna Szyda

PRZYKŁAD

PRZYKŁAD

WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW WYBÓR PRÓBY DANYCH Z POPULACJI 1. Liczebność próby danych 2. Replikacje 3. Wybór osobników z populacji do próby danych Copyright 2010, Joanna Szyda

WAŻNE ASPEKTY ZWIĄZANE Z TWORZENIEM PRÓB DANYCH I ESTYMACJĄ PARAMETRÓW TWORZENIE PRÓBY DANYCH WYBÓR LOSOWY NIELOSOWY Osobniki wybierane są bez stosowania selekcji Osobniki muszą reprezentować wszystkie warianty efektów działających na populację np. lokalizacja, wiek, płeć, ekspozycja na warunki środowiskowe, spokrewnienie Wybór wg spokrewnienia Wybór wg wartości cechy Eksperyment Copyright 2010, Joanna Szyda

POPULACJA I PRÓBA DANYCH NIELOSOWY WYBÓR OSOBNIKÓW Z POPULACJI DO PRÓBY DANYCH Wybór wg spokrewnienia Małe rodziny jednopokoleniowe (nuclear families) populacje ludzkie Copyright 2010, Joanna Szyda

POPULACJA I PRÓBA DANYCH NIELOSOWY WYBÓR OSOBNIKÓW Z POPULACJI DO PRÓBY DANYCH Wybór wg spokrewnienia Duże rodziny jednopokoleniowe Populacje zwierząt Copyright 2010, Joanna Szyda

POPULACJA I PRÓBA DANYCH NIELOSOWY WYBÓR OSOBNIKÓW Z POPULACJI DO PRÓBY DANYCH Wybór wg wartości cechy grupa doświadczalna grupa kontrolna (case-control) Copyright 2010, Joanna Szyda

POPULACJA I PRÓBA DANYCH NIELOSOWY WYBÓR OSOBNIKÓW Z POPULACJI DO PRÓBY DANYCH Wybór wg spokrewnienia oraz case-control Duże rodziny jednopokoleniowe

POPULACJA I PRÓBA DANYCH NIELOSOWY WYBÓR OSOBNIKÓW Z POPULACJI DO PRÓBY DANYCH Eksperyment P: A x B Zaplanowane: -warunki środowiskowe, -struktura genetyczna, -spokrewnienie -itp. F1: AB x AB Wysoki koszt Wykorzystanie wszystkich osobników F2: Copyright 2010, Joanna Szyda

BŁĄD PRÓBKOWANIA x 21 x 23 23 x 21 x 26 Copyright 2010, Joanna Szyda

BŁĄD PRÓBKOWANIA 1. Nie możemy precyzyjnie określić wielkości błędu próbkowania 2. Możemy w przybliżeniu określić dokładność estymatora Błąd standardowy estymatora Przedziały ufności estymatora Copyright 2010, Joanna Szyda

DYSKUSJA OSZACOWAĆ ŚREDNI WZROST MIESZKAŃCÓW WROCŁAWIA Jak zebrać próbę danych? Copyright 2010, Joanna Szyda

ZMIENNE JAKOŚCIOWE nr ID, płeć ILOŚCIOWE dyskretne pomiar w skali nominalnej grupa krwi, maść konia pomiar w skali porządkowej liczba urodzonych prosiąt w miocie X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } ciągłe wysokość konia w kłębie W [ 150, 190 ]

FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function P(X=x) f (w) ZMIENNA LOSOWA DYSKRETNA ZMIENNA LOSOWA CIĄGŁA 0,25 0,20 9 i 1 P X 1 x i f w dw 1 0,15 0,10 0,05 0,00 1 2 3 4 5 6 7 8 9 liczba szczeniąt x wysokość w kłębie w

STATYSTYKI OPISOWE średnia wariancja STATYSTYKI OPISOWE modalna mediana

x M,m,x STATYSTYKI OPISOWE Średnia arytmetyczna liczba, wokół której skupiają się poszczególne wartości zmiennej തX = 1 n X i i=1 Wariancja miara zmienności liczba określająca rozproszenie wartości zmiennej wokół wartości oczekiwanej odchylenie standardowe n S x 2 = X i തX 2 n 1 S x = S x 2

PRZYKŁAD WYDAJNOŚĆ MLEKA W DWÓCH STADACH W jednym stadzie krów (stado A) stwierdzono następującą wydajność dobową mleka: 20, 21, 20, 19, 20, 20 kg, a w drugim (stado B): 25, 18, 23, 17, 20 i 17 kg.

PRZYKŁAD WYDAJNOŚĆ MLEKA W DWÓCH STADACH W jednym stadzie krów (stado A) stwierdzono następującą wydajność dobową mleka: 20, 21, 20, 19, 20, 20 kg, a w drugim (stado B): 25, 18, 23, 17, 20 i 17 kg. n x ҧ = 1 n i=1 x i = 120 6 = 20 s 2 x = x i xҧ 2 n 1 = 20 20 2 + 21 20 2 + + 21 20 2 5 = 0,4 s x = 0,4 = 0,63

PRZYKŁAD WYDAJNOŚĆ MLEKA W DWÓCH STADACH W jednym stadzie krów (stado A) stwierdzono następującą wydajność dobową mleka: 20, 21, 20, 19, 20, 20 kg, a w drugim (stado B): 25, 18, 23, 17, 20 i 17 kg. n x ҧ = 1 n i=1 x i = 120 6 = 20 s 2 x = x i xҧ 2 n 1 = 11,2 s x = 11,2 = 3,35

PRZYKŁAD WYDAJNOŚĆ MLEKA W DWÓCH STADACH W jednym stadzie krów (stado A) stwierdzono następującą wydajność dobową mleka: 20, 21, 20, 19, 20, 20 kg, a w drugim (stado B): 25, 18, 23, 17, 20 i 17 kg.

x M,m,x STATYSTYKI OPISOWE Mediana wartość środkowa nieparzysta / parzysta liczba obserwacji mniej zależna od odstających obserwacji niż średnia Modalna (dominanta) liczba, która występuje najczęściej może nie być wartości modalnej W jednym stadzie krów (stado A) stwierdzono następującą wydajność dobową mleka: 20, 21, 20, 19, 20, 20 kg, a w drugim (stado B): 25, 18, 23, 17, 20 i 17 kg. Mediana i modalna dla stada A i B?

STATYSTYKI OPISOWE średnia modalna mediana rozkład symetryczny 1 2 3 4 5 6 7 modalna mediana średnia 1 2 3 4 5 6 7 rozkład skośny Copyright 2011, Joanna Szyda

STATYSTYKI OPISOWE 1 2 3 4 5 6 7 duża wariancja 1 2 3 4 5 6 7 mała wariancja Copyright 2009, Joanna Szyda

STATYSTYKI OPISOWE 5 number data summary a set of descriptive statistics that provide information about a dataset. five most important sample percentiles: the sample minimum (smallest observation) the lower quartile or first quartile the median (middle value) the upper quartile or third quartile the sample maximum (largest observation) Copyright 2013, Joanna Szyda

STATYSTYKI OPISOWE wykres pudełkowy box plot maksimum 3 kwartyl: 75% danych mediana: 50% danych 1 kwartyl: 25% danych minimum obserwacja odstająca Copyright 2013, Joanna Szyda

PRZYKŁAD WYDAJNOŚĆ MLEKA W DWÓCH STADACH 19.0 19.5 20.0 20.5 21.0 18 20 22 24 W jednym stadzie krów (stado A) stwierdzono następującą wydajność dobową mleka: 20, 21, 20, 19, 20, 20 kg, a w drugim (stado B): 25, 18, 23, 17, 20 i 17 kg.

STATYSTYKI OPISOWE Jak będzie wyglądał box plot dla wartości 11, 9, 8, 10, 7, 10, 9, 8, 9, 8, 9? narysuj na tablicy narysuj w programie R

PRZYKŁADOWE ROZKŁADY

ROZKŁAD NORMALNY Średnia = mediana = modalna 2.1% 2.1% 0.1% 0.1% - 3s -2s -1s 0 1s 2s 3s Bardzo często spotykany w danych biologicznych Np. wydajność mleka Np. masa ciała prosięcia w 4 tygodniu życia

ROZKŁAD t Studenta William Gosset - pseudonim student Kształt zależny od stopni swobody Dla wielu stopni swobody zbliżony do rozkładu normalnego Stosujemy gdy odchylenie standardowe populacji jest nieznane n 30

ROZKŁAD 2 Skośny Brak wartości ujemnych Kształt zależny od liczby stopni swobody