Statystyczny opis danych

Podobne dokumenty
Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Statystyka w pracy badawczej nauczyciela

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Statystyka Matematyczna Anna Janicka

Podstawowe pojęcia statystyczne

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Z poprzedniego wykładu

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

Wykład ze statystyki. Maciej Wolny

Próba własności i parametry

Statystyka matematyczna i ekonometria

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

Literatura. Podgórski J., Statystyka dla studiów licencjackich, PWE, Warszawa 2010.

Statystyka. Wykład 1. Magdalena Alama-Bućko. 26 lutego Magdalena Alama-Bućko Statystyka 26 lutego / 34

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki Cz. 1. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Wykład 10: Elementy statystyki

Podstawowe pojęcia cd. Etapy badania statystycznego

STATYSTYKA. dr Agnieszka Figaj

Statystyka matematyczna dla leśników

W1. Wprowadzenie. Statystyka opisowa

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka w analizie i planowaniu eksperymentu

Estymacja punktowa i przedziałowa

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

STATYSTYKA I DOŚWIADCZALNICTWO

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Matematyka i statystyka matematyczna dla rolników w SGGW

Wykład z dnia 8 lub 15 października 2014 roku

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Przedmiot i rola statystyki

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wydział Matematyki. Testy zgodności. Wykład 03

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Matematyka 2. dr inż. Rajmund Stasiewicz

Sposoby prezentacji problemów w statystyce

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Rodzaje badań statystycznych

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Spis treści 3 SPIS TREŚCI

1.1 Wstęp Literatura... 1

Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

przedmiot podstawowy obowiązkowy polski drugi

Rozkłady zmiennych losowych

Badania Statystyczne

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Przedmiot statystyki. Graficzne przedstawienie danych.

Testowanie hipotez statystycznych cd.

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

(C. Gauss, P. Laplace, Bernoulli, R. Fisher, J. Spława-Neyman) Wikipedia 2008

Statystyka. Zadanie 1.

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2

Statystyczne metody analizy danych

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Analiza struktury i przeciętnego poziomu cechy

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

STATYSTYKA MATEMATYCZNA

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Rozkłady statystyk z próby

STATYSTYKA I DOŚWIADCZALNICTWO

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

1 Podstawy rachunku prawdopodobieństwa

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Zawartość składników pokarmowych w roślinach

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

PDF created with FinePrint pdffactory Pro trial version

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

Wykład 3: Prezentacja danych statystycznych

Transkrypt:

Temat: Statystyczny opis danych Oznaczenia żółty nowe pojęcie czerwony uwaga * - materiał nadobowiązkowy 1

Zagadnienia 1. Wprowadzenie 2. Pojęcia: populacja, próba, cecha, typy cech 3. Elementy opisu statystycznego: a. empiryczny rozkład wartości b. opis parametryczny 2

Termin statystyka 3

Termin statystyka Statystyka (łac. status) stan rzeczy Znaczenie historyczne (do poł. XIX w.) Statystyka uporządkowany, czyli podany w formie tabeli, zbiór danych liczbowych dotyczących stanu państwa. 4

Termin statystyka Znaczenie współczesne Statystyka zgromadzone różnorakie dane liczbowe dotyczące wybranego zjawiska, np.: statystyka urodzeń, statystyka wyjazdów turystycznych, statystyka zachorowań na grypę, statystyka produkcji rolnej. 5

Termin statystyka Statystyka dyscyplina naukowa zajmująca się tworzeniem metod służących: pozyskiwaniu danych, ich prezentacji, oraz analizie i interpretacji. Celem tych metod jest otrzymanie użytecznych, uogólnionych informacji na temat badanego zjawiska. 6

Elementy badań statystycznych (1) Pozyskiwanie danych to element badania statystycznego, w ramach którego dokonuje się obserwacji danego zjawiska, a następnie pomiaru lub zliczenia. 7

Elementy badań statystycznych (2) Prezentacja danych polega na przedstawieniu nawet bardzo licznych zbiorów danych w takiej postaci tabelarycznej lub graficznej, która ułatwi ich ocenę i analizę. 8

Elementy badań statystycznych (3) Analizę danych można przedstawić: metodami statystyki opisowej (wykonać opis statystyczny), metodami statystyki matematycznej (przeprowadzić wnioskowanie statystyczne). UWAGA. Statystyka matematyczna bazuje na metodach rachunku prawdopodobieństwa. 9

Przedmiot badań statystycznych Badanie statystyczne zawsze dotyczy pewnej zbiorowości (statystycznej), której elementami są obiekty materialne lub zjawiska, np.: studenci kierunku Rolnictwo I SGGW, drzewa owocowe w ustalonym sadzie, krowy wybranej rasy, wypadkowość w gospodarstwach rolnych danej gminy. 10

Przedmiot badań statystycznych Zbiorowość statystyczną określa się mianem populacji (generalnej), a jej elementy to jednostki statystyczne. Populacja skończona - ma skończenie wiele jednostek statystycznych. Populacja nieskończona - ma nieskończenie wiele jednostek statystycznych. 11

* Komentarz Przypadek populacji nieskończonej na ogół jest wynikiem przyjętego modelu zjawiska, np. populacja pomiarów wysokości pędu rośliny ustalonej odmiany, populacja rzutów monetą. Czasem populacja, choć skończona, jest tak liczna, że można ją traktować jak nieskończoną. 12

Cechy statystyczne - przykłady Populacja - studenci kierunku Rolnictwo I SGGW. Jednostki statystyczne tej populacji mają właściwości, które nazywamy cechami statystycznymi, np.: płeć, wzrost, wagę, wiek, kolor oczu, liczba niezdanych egzaminów z semestru 1. Komentarz o typach cech. 13

Klasyfikacja cech Cechy mierzalne niemierzalne ciągłe skokowe Uwaga. Cechy miarzalne nazywa się także ilościowymi, a niemierzalne jakościowymi. 14

Cecha mierzalna Cechę mierzalną można otrzymać przez: 1. pomiar bezpośredni, 2. pomiar pośredni wielkości związanych z badaną cechą i dokonanie przeliczeń w oparciu o znane zależności, 3. zliczanie. 15

Przykłady cech mierzalnych wysokość drzew owocowych w sadzie, plon ziarna jęczmienia zebranego z poletka doświadczalnego, stężenie roztworu, średni dobowy przyrost masy zwierzęcia hodowlanego, liczba jabłek zepsutych w skrzynce, liczba szkodników znalezionych na poletku po zastosowaniu preparatu, liczba krów w gospodarstwie rolnym 16

Definicja cechy mierzalnej ciągłej Cecha mierzalna ciągła może przyjąć każdą wartość z określonego przedziału liczbowego, np.: wydajność dzienna mleka od krowy (l), zawartość cukru w burakach cukrowych (%). 17

Definicja cechy mierzalnej skokowej Cecha mierzalna skokowa (dyskretna) może przyjąć tylko niektóre wartości liczbowe, np.: liczba prosiąt w jednym miocie, liczba rozgałęzień na krzewie róży, liczba nasion w jednym strąku grochu. 18

* Uwaga Wiele cech ciągłych z natury, np. wysokość rośliny, ze względu na stosowaną technikę pomiaru ma charakter cech skokowych, np. wysokość rośliny określona z dokładnością do centymetra. 19

Definicja cechy niemierzalnej Cecha niemierzalna (jakościowa) - każda badana jednostka statystyczna może być zakwalifikowana do jednej z wielu kategorii, bez przypisywania określonej wartości liczbowej, np.: barwa oczu - niebieska, szara, piwna, ocena nasion - zdatne lub niezdatne do siewu, barwa kwiatu - czerwona, różowa, biała 20

Uwaga nt. cechy niemierzalnej Kategoriom cechy niemierzalnej można przyporządkować liczby, np.: liczba 0 - ziarno pszenicy o sile kiełkowania mniejszej niż 90%, liczba 1 pozostałe ziarna, jednak liczby te nie wyrażają wartości cechy. 21

Rodzaje badań statystycznych Badanie pełne (wyczerpujące) - badaniu poddana jest cała populacja. Badanie częściowe (niewyczerpujące) - badaniu poddana jest tylko część populacji (niektóre jednostki). 22

Uwaga Badanie pełne jest niemożliwe do wykonania np. wtedy, gdy: populacja jest nieskończona, metoda badawcza ma charakter niszczący, wysoki jest koszt pojedynczego badania. 23

Przykłady badań niszczących analiza ilości skrobi w bulwie ziemniaka, analiza jakości mąki pszennej, analiza zawartości składnika koncentratu pomidorowego w puszce. 24

Próba Próba (populacja próbna) - ta część populacji generalnej, która bezpośrednio podlega badaniu. Próba reprezentatywna stanowi taką część populacji, która zachowuje wszelkie właściwości struktury całej populacji. 25

Jak otrzymać próbę reprezentatywną? Przy pobieraniu próby z populacji należy spełnić dwa warunki: losowość - każda jednostka populacji ma jednakową szansę dostania się do próby, niezależność - dodawanie następnej jednostki do próby jest niezależne od pobranych wcześniej jednostek. 26

Badanie próby reprezentatywnej Zaleta Badanie próby reprezentatywnej pobranej z populacji pozwala poprawnie wnioskować o całej populacji. 27

Źródła danych statystycznych w rolnictwie sprawozdania z kontroli np. udojów mleka, nieśności kur, zużycia parku maszynowego w pracach polowych rejestracje i spisy rolne doświadczenie naukowe i obserwacja 28

Schemat badania statystycznego PYTANIE - badacz stawia pytanie DOŚWIADCZENIE - zakłada doświadczenie WYNIKI - uzyskuje wyniki ANALIZA - analizuje wyniki ODPOWIEDŹ - odpowiada na pytanie 29

Przykład Badamy porażenie roślin pewnego gatunku. 1. sposób pomiaru cechy Obliczamy procent powierzchni porażonej pędów dla sześciu roślin (w %): 0,0 20,0 18,9 3,5 1,7 20,8 Badana cecha to powierzchnia porażenia, a wynikami pomiaru są liczby rzeczywiste (cecha mierzalna ciągła). 30

Przykład cd. 2. sposób pomiaru cechy Liczymy porażone pędy dla sześciu roślin: 0 4 3 2 1 4 Badana cecha to liczba pędów porażonych, a wynikami pomiaru są liczby naturalne (cecha mierzalna skokowa). 31

Przykład cd. 3. sposób pomiaru cechy Obserwujemy, czy roślina została porażona, czy nie. Wyniki dla sześciu roślin: O P P P P P Badana cecha to fakt porażenia rośliny, a wyniki pomiaru w ogóle nie są wyrażone liczbowo! P - oznacza roślinę porażoną, O - roślinę odporną (cecha niemierzalna). 32

Przykład cd. W każdym z przytoczonych przykładów ogólny cel działania był określony jednakowo badanie porażenia. Ale za każdym razem inaczej określono cechę: powierzchnia porażonej rośliny, liczba porażonych pędów na roślinie, fakt porażenia lub nie rośliny. Za każdym razem inny był typ badanej cechy. Od typu cechy (typu uzyskanych wyników) zależy dobór metody analizy, więc przy późniejszej prezentacji metod zawsze pojawi się ważna informacja, dla jakiego typu cechy dana metoda jest przeznaczona. 33

Opis statystyczny 34

Opis statystyczny Opis statystyczny polega na przedstawieniu: struktury zbiorowości współzależności cech zmian zjawisk w czasie 35

Formy opisu statystycznego tabelaryczna (dane liczbowe zestawione w szeregi i tablice) graficzna (dane w postaci wykresów) parametryczna (parametry to charakterystyki liczbowe) 36

Opis statystyczny zadanie Dla wskazanych danych utwórz: a. szereg rozdzielczy b. histogram c. wielobok częstości d. dystrybuantę empiryczną 37

Tworzenie szeregu rozdzielczego 1. ustalamy zakres wartości, 2. ustalamy liczbę klas, 3. zakres wartości dzielimy na klasy, 4. wyznaczamy liczebność (lub częstość) w każdej klasie, 5. przedstawiamy klasy w postaci zestawienia w tabeli (szereg rozdzielczy) lub graficznie (histogram, wielobok częstości). 38

Liczba klas szeregu rozdzielczego Ozn.: k - liczba klas, n liczebność próby n k 30-60 6-8 60-100 7-10 100-200 9-12 200-500 11-17 500-1500 16 25 przeważnie najwyżej 30 39

Szereg rozdzielczy przykład 1 Określono czasu dojazdu do pracy pracowników pewnego zakładu. Czas dojazdu w minutach Liczba pracowników 5-15 3 15-25 13 25-35 40 35-45 43 45-55 15 55-65 6 Ogółem 120 40

Histogram, wielobok cz. przykład 1 pracowników 50 40 30 20 10 Liczba 0 10 20 30 40 50 60 Czas dojazdu Histogram (zielone słupki) Wielobok częstości (pomarańczowa łamana) 41

Szereg rozdzielczy przykład 2 Gospodarstwa domowe według wielkości Liczba osób w gosp. domowym Liczba gospodarstw 1 670 2 2 182 3 3 681 4 4 779 5 1 918 6 i więcej 937 Ogółem 14 167 42

Histogram, wielobok cz. przykład 2 5000 Liczba gospodarstw 4000 3000 2000 1000 0 1 2 3 4 5 6 i więcej Liczba osób w gospodarstwie Histogram Wielobok częstości 43

Szereg rozdzielczy przykład 3 Struktura pracujących według poziomu wykształcenia. Wykształcenie Odsetek pracujących Wyższe 11,4 Średnie: techniczne i zawodowe 27,9 ogólnokształcące 6,0 zasadnicze zawodowe 33,5 Podstawowe i niepełne podstawowe 21,2 Razem 100,0 44

Histogram przykład 3 Odsetek pracujących 40 35 30 25 20 15 10 5 0 wyŝsze techn. i zawod. ogólnokszt. zas. zawod. podst. i niep. podst. Wykształcenie Histogram 45

Szereg rozdzielczy skumulowany Przykład. Pracownicy pewnego zakładu według czasu dojazdu do pracy. Czas dojazdu w minutach Liczba pracowników Liczba pracowników narastająco 5-15 3 3 15-25 13 16 25-35 40 56 35-45 43 99 45-55 15 114 55-65 6 120 Ogółem 120 46

Histogram skumulowany - przykład 140 120 100 80 60 40 20 0 10 20 30 40 50 60 Czas dojazdu Histogram skumulowany Dystrybuanta empiryczna (!) 47

Rozkłady emp. cechy mierzalnej Typy rozkładów Ze względu na rozmieszczenie liczebności badanych jednostek przy odpowiednich wartościach cechy mierzalnej. 48

Przykłady typów rozkładów 45 40 35 30 25 20 15 10 5 0 Liczba miotów 6 i mniej 7 8 9 10 11 12 i więcej Rys. 1. R. symetryczny Liczba aut 35 30 25 20 15 10 5 0 Pn Wt Śr Cz Pt So N Rys. 3. R. równomierny Liczba kwadracików 160 140 120 100 80 60 40 20 0 0 1 2 3 4 5 6 Liczba komórek droŝdŝy Rys. 2. R. asymetryczny 160 140 120 100 80 60 40 20 0 0 1 2 3 4 5 6 Rys. 4. Rozkład bimodalny 49

Przykłady typów rozkładów, cd. Zachmurzenie 0,5 0,4 0,3 0,2 0,1 0,0 0 1 2 3 4 5 6 7 8 9 10 Rys. 5. Rozkład typu U 50