Wykład 10: Elementy statystyki

Podobne dokumenty
Wykład 13. Zmienne losowe typu ciągłego

Wykłady 14 i 15. Zmienne losowe typu ciągłego

Przedmiot statystyki. Graficzne przedstawienie danych.

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Sposoby prezentacji problemów w statystyce

3. Podstawowe pojęcia statystyki matematycznej i rachunku prawdopodobieństwa wykład z Populacja i próba

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Estymacja parametrów w modelu normalnym

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Środowisko R wprowadzenie c.d. Wykład R2; Struktury danych w R c.d.

6.4 Podstawowe metody statystyczne

Podstawowe pojęcia statystyczne

Zmienne losowe. dr Mariusz Grządziel Wykład 12; 20 maja 2014

Przedmiot statystyki. Graficzne przedstawienie danych.

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Statystyka matematyczna i ekonometria

Statystyka w pracy badawczej nauczyciela

Statystyka matematyczna dla leśników

Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Wykład ze statystyki. Maciej Wolny

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Wykład 11: Podstawowe pojęcia rachunku prawdopodobieństwa

CZEŚĆ PIERWSZA. Wymagania na poszczególne oceny,,matematyka wokół nas Klasa III I. POTĘGI

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Próba własności i parametry

Funkcje: wielomianowa, wykładnicza, logarytmiczna wykład 2

Dyskretne zmienne losowe

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Ciągi liczbowe wykład 3

Testy dla dwóch prób w rodzinie rozkładów normalnych

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Zmienne losowe. dr Mariusz Grzadziel. rok akademicki 2016/2017 semestr letni. Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; Weryfikacja założenia o normalności rozkładu populacji

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Wykład 7 Testowanie zgodności z rozkładem normalnym

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

W4 Eksperyment niezawodnościowy

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Funkcje: wielomianowa, wykładnicza, logarytmiczna wykład 3

W1. Wprowadzenie. Statystyka opisowa

Rozkłady zmiennych losowych

Literatura. Podgórski J., Statystyka dla studiów licencjackich, PWE, Warszawa 2010.

4,5. Dyskretne zmienne losowe (17.03; 31.03)

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Analiza danych. TEMATYKA PRZEDMIOTU

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Pojęcie szeregu nieskończonego:zastosowania do rachunku prawdopodobieństwa wykład 1

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

166 Wstęp do statystyki matematycznej

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Rachunku prawdopodobieństwa: rys historyczny, aksjomatyka, prawdopodobieństwo warunkowe,

WYMAGANIA Z MATEMATYKI NA POSZCZEGÓLNE OCENY KLASYFIKACYJNE DLA UCZNIÓW KLAS TRZECICH. Sposoby sprawdzania wiedzy i umiejętności uczniów

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Wykład 13. Podstawowe pojęcia rachunku prawdopodobieństwa

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 2 Zmienne losowe i ich rozkłady

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Katalog wymagań na poszczególne stopnie szkolne klasa 3

Wykład 4: Statystyki opisowe (część 1)

Zbiory liczbowe i funkcje wykład 1

Statystyka Matematyczna Anna Janicka

Statystyka. Wykład 1. Magdalena Alama-Bućko. 26 lutego Magdalena Alama-Bućko Statystyka 26 lutego / 34

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Wprowadzenie do analizy korelacji i regresji

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Spis treści 3 SPIS TREŚCI

Pochodna funkcji c.d.-wykład 5 ( ) Funkcja logistyczna

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Matematyka 2. dr inż. Rajmund Stasiewicz

KONSPEKT FUNKCJE cz. 1.

Wykład: 20 godz., ćwiczenia: 20 godz. Zasady zaliczenia: zaliczenie ćwiczeń na ocenę, zaliczenie wykładu - egzamin (pisemne).

Statystyka matematyczna i ekonometria

Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Z-LOGN1-006 Statystyka Statistics

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Graficzna prezentacja danych statystycznych

MATEMATYKA3 Mathematics3. Elektrotechnika. I stopień ogólnoakademicki. studia stacjonarne. Katedra Matematyki dr Zdzisław Piasta

1 Podstawy rachunku prawdopodobieństwa

STATYSTYKA MATEMATYCZNA

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Transkrypt:

Wykład 10: Elementy statystyki dr Mariusz Grządziel 0 grudnia 010 Podstawowe pojęcia Biolodzy: -badają pojedyńcze rośliny lub zwierzęta; -chcemy rozszerzyć wnioski na wszystkich przedstawicieli gatunku lub odmiany: -można to osiągnąć wykonując analizę statystyczną. Definicja 1. Populacja nazywamy zbiorowość (skończona lub nieskończona), w stosunku do której maja być formułowane wnioski. Próba jest natomiast skończona część populacji. Stosowane podejścia metody analizy danych: statystyki opisowe, metody graficzne wnioskowanie statystyczne- oparte na metodach i pojęciach teorii prawdopodobieństwa Podstawowe pojęcia Zazwyczaj jesteśmy zainteresowani kilkoma konkretnymi cechami populacji. Cechy: -jakościowe (kolor oczu, kolor włosów itd.) -ilościowe (masa zwierząt, liczba jaj składanych przez określony gatunek ptaków itd.) Jeśli w badanich ograniczamy się do jednej cechy- populacja jednocechowa. Np. badając badając zwierzęta określonego gatunku możemy być zainteresowani tylko ich temperaturą itd. Przykład Dane normtemp zebrane w celu weryfikacji hipotezy mówiącej, że średnia wartość temperatury zdrowego człowieka jest równa 98,6 stopni w skali Fahrenheita (37,0 stopni w skali Celsjusza). Dane nt. temperatury i tętna (temperatura- stopnie Fahrenheita) Można je pobrać z odpowiedniego repozytorium a następnie zapisać do zbioru o nazwie np. t (tzw. data frame ). Zbiór t składa się z trzech zmiennych: temperature, gender i hr. Aby uczynić naszą prezentację bardziej czytelną, zmieniamy nazwy zmiennych na odpowiednio: temp, plec i tetno. Odpowiednie polecenia systemu R są zapisane w pliku t.r. Wydruk tego pliku zamieszczamy poniżej (na następnym slajdzie): Pobieranie zbioru danych z repozytorium systemu R library(utils) install.packages(c("xlsreadwrite","usingr"), 1

repo="http://cran.r-project.org") library(xlsreadwrite) library(usingr) t<-normtemp names(t)<-c("temp","plec","tetno") write.xls(t, c:/t.xls ) # zbior t zapisany # do pliku t.xls System R.8 można pobrać pod adresem http://r.meteo.uni.wroc.pl/bin/windows/base/ Pobieranie zbioru danych z repozytorium systemu R > names(t) [1] "temp" "plec" "tetno" > t[1:10,] temp plec tetno 1 96.3 1 70 96.7 1 71 3 96.9 1 74 4 97.0 1 80 5 97.1 1 73 6 97.1 1 75 7 97.1 1 8 8 97. 1 64 9 97.3 1 69 10 97.4 1 70 > sort() [1] 96.3 96.4 96.7 96.7 96.8 96.9 97.0 97.1 [9] 97.1 97.1 97. 97. 97. 97.3 97.4 97.4... [19] 100.0 100.8 Szereg rozdzielczy Dla zbioru danych liczbowych {y 1, y..., y N } niech: MIN1 oznacza liczbę mniejszą od najmniejszej z liczb {y 1, y..., y N } MAX1 oznacza liczbę większą lub równą od największej z liczb {y 1, y..., y N } MIN1 i MAX1 mogą być odpowiednimi zaokrągleniami wartości, odpowiednio, minimalnej i maksymalnej naszego zbioru danych MIN1 < MAX1. Podzielmy odcinek (MIN1, MAX1] na k przedziałów (zwanych klasami) o równej długości: (x 0, x 1 ], (x 1, x ],..., (x k 1, x k ], gdzie x 0 = MIN1, x k = MAX1. Funkcję przyporządkowującą poszczególnym przedziałom liczbę elementów naszego zbioru danych do nich należących będziemy nazywać szeregiem rozdzielczym. Liczbę klas k w szeregu rozdzielczym wyznaczamy korzystając z wzorów: k log n lub k 3 n 4.

Szereg rozdzielczy dane NT Przyjmujemy: MIN1 = 96, MAX1 = 101, k = 10 3 130 4. Zakładając, że dane dotyczące temperatury zdrowych ludzi znajdują się w zmiennej konstruujemy szereg rozdzielczy w środowisku R: > table(cut(, breaks = c(96,96.5,97,97.5,98, + 98.5,99,99.5,100,100.5,101))) (96,96.5] (96.5,97] (97,97.5] (97.5,98] 5 14 30 (98,98.5] (98.5,99] (99,99.5] (99.5,100] 30 35 11 (100,100.5] (100.5,101] 0 1 Histogram- dane NT Wykres słupkowy odpowiadający szeregowi rozdzielczemu-histogram liczebności Histogram of Frequency 0 5 10 15 0 5 30 35 Rysunek 1: Histogram dla danych NT odpowiadający szeregowi rozdzielczemu z poprzedniego slajdu Histogram probabilistyczny- dane NT Histogram probablistyczny-tak wyskalowany, aby "pole pod nim było równe 1": wyskości słupków:, 5,...; histogram probabilistyczny- przez niektórych definiowany jako funkcja przedziałami ciągła (stała), której wykres "pokrywa się" z zdefiniowanym wyżej wykresem słupkowym Histogram probabilistyczny-funkcja przedziałami ciagła h(x) =. 5 1, dla x (96; 96,5], dla x (96,5, 97], dla x (100,5; 101] 3

Histogram of Density 0.0 0.1 0. 0.3 0.4 0.5 Rysunek : Histogram probabilistyczny dla danych NT Frakcja obserwacji należących do (96; 97]; 97 96 h(x)dx = 1 ( 130 0,5 + 5 ) 130 0,5 = 7 130 0,054 Konstrukcja histogramu probabilistycznego przypadek ogólny W ogólnym przypadku wysokość k-tego słupka histogramu probabilistycznego (wartość funkcji dla argumentów należących do k-tej klasy) jest równa n k nd, gdzie n k jest liczebnością k tej klasy, d jest długością klasy, n jest liczbą obserwacji. Funkcja h histogram probabilistyczny zdefiniowana wzorem: h(x) = { nk nd, x należy do k-tej klasy, 0, x nie należy do żadnej z klas. Dziedziną funkcji h jest zbiór liczb rzeczywistych R. Histogram probabilistyczny i gęstość cechy Chcemy obliczyć frakcję osób mających temperaturę w przedziale (96; 97] w populacji wszystkich dorosłych zdrowych ludzi (a także w innych przedziałach [a, b]). Zamiast histogramu probabilistycznego do obliczeń można użyć funkcję ciągłą f, która go sensownie wygładza ; szukana frakcja: 97 96 f(x)dx Wielobok częstotliwości Prosta recepta na wygładzenie histogramu probabilistycznego: wielobok częstotliwości. W ogólnym przypadku: odcinek (MIN1, MAX1] na k przedziałów (zwanych klasami) o równej długości: (x 0, x 1 ], (x 1, x ],..., (x k 1, x k ], 4

gdzie x 0 = MIN1, x k = MAX1 Niech: H = x 1 x 0, x i = x i H/, i = 0,..., k; x k+1 = x 0 + H/ Wielobok czętotliwości powstaje z połączenia: ( x 0, 0), ( x 1, h( x 1 )),..., ( x k, h( x k )), ( x k+1, 0) Histogram+wielobok częstotliwości Histogram of Density 0.0 0.1 0. 0.3 0.4 0.5 Rysunek 3: Histogram+wielobok częstotliwości Uwagi o wykresach dla danych jakościowych Dla danych jakościowych, np. dotyczących składu wyznaniowego Warszawy w roku 1864, można sprządzić odpowiednie wykresy słupkowe lub kołowe por. J. Koronacki, J. Mielniczuk, Statystyka dla kierunków technicznych i przyrodniczych, WNT 001, paragraf 1..1, str. 14 17. 5