Wykład: 20 godz., ćwiczenia: 20 godz. Zasady zaliczenia: zaliczenie ćwiczeń na ocenę, zaliczenie wykładu - egzamin (pisemne).

Podobne dokumenty
STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

Prawdopodobieństwo i statystyka Wykład I: Nieco historii

Prawdopodobieństwo i statystyka Wykład I: Przestrzeń probabilistyczna

Statystyka Matematyczna Anna Janicka

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

1 Podstawy rachunku prawdopodobieństwa

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Spis treści 3 SPIS TREŚCI

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Pozyskiwanie wiedzy z danych

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Wykład 5: Statystyki opisowe (część 2)

W1. Wprowadzenie. Statystyka opisowa

Opis przedmiotu: Probabilistyka I

Statystyka matematyczna i ekonometria

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Transport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Studia stacjonarne (stacjonarne / niestacjonarne)

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Próba własności i parametry

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Analiza danych. TEMATYKA PRZEDMIOTU

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

studia stacjonarne w/ćw zajęcia zorganizowane: 30/15 3,0 praca własna studenta: 55 Godziny kontaktowe z nauczycielem akademickim: udział w wykładach

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

PRZEWODNIK PO PRZEDMIOCIE

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Przedmiot statystyki. Graficzne przedstawienie danych.

Laboratorium 3 - statystyka opisowa

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Inżynierskie zastosowania statystyki Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Ćwiczenia 1-2 Analiza rozkładu empirycznego

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyczne metody analizy danych

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Biostatystyka, # 1 /Weterynaria I/

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Przedmiot statystyki. Graficzne przedstawienie danych.

Parametry statystyczne

Sposoby prezentacji problemów w statystyce

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Z poprzedniego wykładu

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Statystyka matematyczna dla leśników

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Miary statystyczne w badaniach pedagogicznych

Wykład 10: Elementy statystyki

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Wykład 4: Statystyki opisowe (część 1)

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Prawdopodobieństwo i statystyka

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Analiza struktury i przeciętnego poziomu cechy

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Xi B ni B

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Statystyka i eksploracja danych

Dyskretne zmienne losowe

1.1 Wstęp Literatura... 1

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA

przedmiot podstawowy obowiązkowy polski drugi

Transkrypt:

Tematy: Statystyka opisowa. rozproszenia. WSTĘP Miary tendencji centralnej i Doświadczenia losowe. Aksjomaty teorii prawdopodobieństwa. Własności prawdopodobieństwa. Klasyczna definicja prawdopodobieństwa. Prawdopodobieństwo warunkowe. Niezależność zdarzeń i niezależność doświadczeń losowych. Schemat Bernoulliego. Zmienna losowa i jej rozkład. Dystrybuanta. Wartość oczekiwana i wariancja. Informacja i entropia. Przykłady wnioskowania statystycznego: estymacja wartości oczekiwanej, testowanie prostych hipotez o wartości oczekiwanej. Elementy teorii procesów stochastycznych: definicja, procesy o przyrostach niezależnych, procesy stacjonarne, podstawowe charakterystyki. Wykład: 20 godz., ćwiczenia: 20 godz. Zasady zaliczenia: zaliczenie ćwiczeń na ocenę, zaliczenie wykładu - egzamin (pisemne). 1

Literatura podstawowa: 1. A. Plucińska, E. Pluciński, Probabilistyka: rachunek prawdopodobieństwa, statystyka matematyczna, procesy stochastyczne, WNT, Warszawa, 2000. 2. J. Jakubowski, R. Sztencel, Rachunek prawdopodobieństwa dla (prawie) każdego, SCRIPT, Warszawa, 2006. 3. J. Koronacki, J. Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT, Warszawa, 2004. Literatura uzupełniająca: 1. D. Applebaum, Probability and information: an integrated approach, Cambridge University Press, 2008. 2. R. B. Ash, M. I. Gardner, Topics in stochastic processes, Academic Press, New York, 1975. 3. P. J. Brockwell, R. A. Davis, Time series: theory and methods, Springer-Verlag, New York, 1987. 4. W. Niemiro, Rachunek prawdopodobieństwa i statystyka matematyczna, Szkoła Nauk Ścisłych, Warszawa, 1999. Prezentacje są dostępne na www-users.mat.umk.pl/ alzaig/materialy.html 2

Rachunek prawdopodobieństwa to sztuka (umiejętność) obliczania prawdopodobieństw zdarzeń. Teoria prawdopodobieństwa to dział matematyki, na którym opierają się praktyczne obliczenia dokonywane w rachunku prawdopodobieństwa. Statystyka to sztuka (umiejętność) wnioskowania na podstawie próby losowej. Statystyka matematyczna to dział matematyki, który rozwija metody uzasadniające poprawność wnioskowania statystycznego. Trochę historii Druga połowa XVII w., Blaise Pascal, Pierre de Fermat i Christiaan Huygens stworzyli matematykę gier hazardowych (nie używając pojęcia prawdopodobieństwa). 1662 r., John Graunt zbudował pierwsze tablice śmiertelności ; na podstawie London bills of mortality (tygodniowe statystyki pogrzebów, chrztów i ślubów) i odkrył pewne regularności w rozwoju populacji ludzkich; m.in. stwierdził, ze w Londynie rodzi się 14 chłopców na 13 dziewczynek (1,077) (obecnie przyjmuje się, ze jest to 1,07). 3

Lata 80-te XVII w., Jakub Bernoulli napisał książkę pt. Ars Conjectandi ( Sztuka przewidywania ) - opublikowana w 1713 r., 8 lat po śmierci Jakuba Bernoullego; zawiera fakt, który dziś nazywamy Prawem wielkich liczb Bernoullego ; rok 1713 przyjmuje się jako date narodzin rachunku prawdopodobieństwa jako dyscypliny naukowej. 1738 r., Abraham de Moivre w drugim wydaniu książki pt. The Doctrine of Chances or a Method of Calculating the Probability of Events in Play pokazał szczególny przypadek faktu, który dziś nazywamy Centralnym twierdzeniem granicznym. 1933 r., Andriej Kołmogorow opublikował książkę Grundbegriffe der Wahrscheinlichkeitsrechnung ( Podstawy rachunku prawdopodobieństwa ), która nadała ostateczny kształt współczesnej teorii prawdopodobieństwa. 4

Przykłady problemów statystycznych: - badanie opinii publicznej (np. na temat preferencji wyborczych); - badanie skuteczności nowego leku; - określenie wpływu warunków klimatycznych i środowiskowych na rozwój roślin danego gatunku w biologii; - badanie stopnia zanieczyszczenia gleb metalami ciężkimi w pewnym obszarze; - badanie socjologiczne (np. na temat spędzania wolnego czasu przed komputerem), itd. Działamy poprzez przeprowadzenie doświadczeń. Uzyskane wyniki mają charakter losowy: nie da się ich przewidzieć przed doświadczeniem. Zakładamy, że jesteśmy w stanie powtórzyć te doświadczenia w tych samych warunkach pewną liczbę razy (może nawet dowolną liczbę razy). Podstawowe cechy badań. 1. Mamy do czynienia ze zbiorem (populacja generalna) pojedynczych nośników informacji (jednostka statystyczna). Populacja może być skończona (najczęściej) lub nieskończona. 2. Jednostki statystyczne są charakteryzowane przez pewne cechy. Interesujące nas cechy jednostek, które nie są takie same dla wszystkich jednostek, nazywamy zmiennymi. 5

3. Badanie może być pełne i częściowe. W przypadku drugim, badając tylko małą część populacji (próbka losowa) chcemy sądzić o całej populacji. Próbka musi być reprezentatywna. Nawet poprawne wnioskowanie statystyczne może być błędne. Statystyka matematyczna zawiera modele i metody, które na podstawie wyników z próby pozwalają wnioskować o całej populacji. Etapy badania statystycznego: - przygotowanie badania; - gromadzenie danych i ich opracowanie; - wnioskowanie statystyczne; - prezentacja wyników. Statystyka opisowa. Rozkład częstości zmiennej: jakie wartości zmienna przyjęła i jak często. Metody przedstawiania rozkładu częstości zmiennej: w postaci tabeli i w postaci wykresów (słupkowe, kołowe). Gdy zmienna przyjmuje dużo różnych wartości i liczebność próbki nie jest mała, rysujemy histogram: obser- 6

wowane wartości grupujemy w klasach, czyli przedziałach o jednakowej długości (najczęściej). Liczba klas r zależy od liczebności próbki (patrz np. tabelę): Liczebność próbki n Liczba klas r 30-60 5-8 60-100 7-10 100-200 9-12 200-500 11-17 500-1000 16-25 Długość każdej klasy d określamy dzieląc zakres zmiany zmiennej d = x max x min przez liczbę klas i zaokrąglając z nadmiarem: d d/r, d d/r. Granice poszczególnych klas obliczamy, dodając kolejne wartości d do początku pierwszej klasy. Gdy podział na klasy został przeprowadzony, obliczamy liczebności poszczególnych klas. Liczebnością j-tej klasy n j nazywamy liczbę wartości, którzy trafiły do j-tej klasy; oczywiście n 1 + +n r =n. Częstością względną j-tej klasy w j nazywamy w j = n j /n; oczywiście w 1 + + w r = 1. W wyniku takiego grupowania wartości z próbki otrzy- 7

mujemy tzw.szereg rozdzielczy, który można scharakteryzować poprzez środki kolejnych klas x 0 j i liczebności klas n j, j = 1,..., r. Stosowane są również liczebności i częstości skumulowane, które otrzymujemy poprzez kolejne sumowanie n j i w j zaczynając od pierwszej klasy. Przykład. Rozważmy wyniki badania wzrostu (w centymetrach) 100 uczniów pewnej szkoły wyższej. Wyniki badania są zawarte w tabeli: 185 187 165 183 167 180 165 175 170 164 188 171 162 178 190 184 168 172 184 180 163 171 180 159 173 185 176 165 181 189 177 171 174 175 165 166 173 158 182 182 179 182 163 164 166 181 161 160 176 184 182 173 185 160 186 157 184 194 163 169 187 172 185 187 164 183 169 183 191 171 175 166 174 179 161 173 181 186 181 178 177 181 173 172 158 177 170 179 188 189 184 173 168 168 178 173 162 178 170 191 Jakie wartości zmienna przyjęła i jak często? Rozkład liczebności występowania poszczególnych wartości zmiennej pokazują następujące tabele: 8

Wzrost 157 158 159 160 161 162 163 164 165 166 Liczeb. 1 2 1 2 2 2 3 3 4 3 Liczeb. skum. 1 3 4 6 8 10 13 16 20 23 167 168 169 170 171 172 173 174 175 176 177 178 179 1 3 2 3 4 3 7 2 3 2 3 4 3 24 27 29 32 36 39 46 48 51 53 56 60 63 180 181 182 183 184 185 186 187 188 189 190 191 194 3 5 4 3 5 4 2 3 2 2 1 2 1 66 71 75 78 83 87 89 92 94 96 97 99 100 Tworzymy szereg rozdzielczy. klas r wynosi 10. Przyjmijmy, że liczba Klasy Klasy dokł. Środek Liczeb. Liczeb. skum. 157-160 156,5-160,5 158,5 6 6 161-164 160,5-164,5 162,5 10 16 165-168 164,5-168,5 166,5 11 27 169-172 168,5-172,5 170,5 12 39 173-176 172,5-176,5 174,5 14 53 177-180 176,5-180,5 178,5 13 66 181-184 180,5-184,5 182,5 17 83 185-188 184,5-188,5 186,5 11 94 189-192 188,5-192,5 190,5 5 99 193-196 192,5-196,5 194,5 1 100 9

Na podstawie szeregu rozdzielczego budujemy histogram. Jest to wykres słupkowy pokazujący rozkład badanej cechy. Podstawy słupków to klasy, a wysokości - liczebności bądź częstości. Łącząc łamaną punkty o współrzędnych (x 0 j, n j) (bądź (x 0 j, w j)), otrzymujemy tzw. wielobok (liczebności bądź częstości). 10

Miary tendencji centralnej i rozproszenia. Są to liczbowe charakterystyki rozkładu zmiennej. Miary tendencji centralnej. Odpowiadają na pytanie, jaka wartość zmiennej jest najbardziej typowa. Średnia arytmetyczna: na podstawie danych z próbki x = 1 n n i=1 x i; na podstawie szeregu rozdzielczego x = 1 n r j=1 x0 j n j. W naszym przykładzie wyliczając średnią z próby mamy x = 175,07, natomiast z szeregu rozdzielczego x 175,18. Mediana - wartość środkowa, która dzieli próbkę na dwie równe części: na podstawie danych z próbki Me = x ( n+1 2 ), n jest nieparzyste x ( n 2 ) +x ( n 2 +1) 2, n jest parzyste; indeksy w nawiasach oznaczają, że wartości x 1,..., x n zostały uporządkowane w sposób niemalejący, czyli x (1) x (2)... x (n) ; na podstawie szeregu rozdzielczego Me = a m + d ( m 1 n n m 2 11 j=1 n j ),

gdzie a m jest dolną granicą klasy, w której znajduje się mediana, n m jest liczebnością tej klasy, d jest długością klasy. W naszym przykładzie wyliczając mediane z próby mamy Me = 175, natomiast z szeregu rozdzielczego Me = 172,5 + 4 14 (50 39) 175,64. Oprócz mediany czasami wyliczamy też kwartyle: Q 1, Q 2, Q 3. Kwartyle dzielą próbkę na 4 równoliczne (w przybliżeniu) części, przy czym Q 2 = Me, natomiast Q 1 to mediana lewej połowy uporządkowanego zbioru wartości zmiennej, a Q 3 to mediana prawej połowy uporządkowanego zbioru wartości zmiennej. Moda (wartość modalna) to najczęściej powtarzająca się wartość w próbce. Na podstawie szeregu rozdzielczego wylicza się w sposób następujący: n m n m 1 Mo = a m + d (n m n m 1 ) + (n m n m+1 ), gdzie a m jest dolną granicą najliczniejszej klasy, n m jest liczebnością tej klasy. W naszym przykładzie na podstawie danych z próbki mamy Mo = 173, natomiast na podstawie szeregu rozdzielczego mamy Mo=180,5 + 17 13 4 12 (17 13)+(17 11) 182,1.

Miary rozproszenia. Rozstęp: Ro = x (n) x (1) ; w naszym przykładzie Ro = 194 157 = 37. Odchylenie standardowe z próby: s = (lub ŝ = s 9,16. 1 n n 1 i=1 (x i x) 2 1 n n i=1 (x i x) 2 ). W naszym przykładzie Na podstawie szeregu rozdzielczego wyliczamy odchylenie standardowe według wzoru: s = 1 r n j (x 0 j n 1 x)2. j=1 W naszym przykładzie s 9,20. Współczynnik zmienności: v = s x ; w naszym przykładzie v = 9,16 175,07 0,05. Bardziej zaawansowane liczbowe charakterystyki rozkładu zmiennej: miara asymetrii (skośność), miara koncentracji (kurtoza). 13