STATYSTYKA zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne) DANYCH STATYSTYKA MATEMATYCZNA analiza i interpretacja danych przy wykorzystaniu metod rachunku prawdopodobieństwa.
Statystyka - wprowadzenie Zagadnienia statystyki matematycznej pojawiają się wszędzie tam, gdzie na podstawie informacji uzyskanej po zbadaniu pewnego podzbioru elementów (próbki), chcemy uzyskać umotywowane informacje o wszystkich elementach należących do danego zbioru (populacji). We wnioskowaniu statystycznym nie mają znaczenia same elementy badanego zbioru, a tylko pewne cechy tych elementów.
POPULACJA GENERALNA pewna zbiorowość obiektów materialnych lub zjawisk podlegająca badaniu. Populacja generalna skończona dotyczy obiektów Populacja generalna nieskończona dotyczy zjawisk CECHY STATYSTYCZNE właściwości, które posiadają elementy populacji generalnej. Cechy mierzalne (ilościowe) np. wiek, waga, wzrost Cechy niemierzalne (jakościowe) np. kolor oczu, płeć, wykształcenie Rozkład wartości cechy mierzalnej w populacji generalnej traktujemy jako rozkład zmiennej losowej.
Badania pełne cała populacja generalna Badania częściowe reprezentatywna część populacji PRÓBA podzbiór elementów populacji generalnej podlegający badaniu. PRÓBA LOSOWA próba otrzymana w wyniku wyboru losowego, tzn. spełniającego dwa warunki: 1. Każda jednostka populacji generalnej ma dodatnie znane prawdopodobieństwo znalezienia się w próbie. 2. Można ustalić prawdopodobieństwo znalezienia się w próbie każdego zespołu elementów populacji generalnej.
Sposoby (schematy) losowania Los. zespołowe Los. Proste ze zwracaniem wszystkie Los. Warstwowe elementy populacji generalnej mają jednakowe prawdopodobieństwo Los. Proste (warstwy rozłączne) dostania się do próby i jest ono bez zwracania niezmienne w trakcie losowania, tzn. prawdopodobieństwo wylosowania określonego elementu na danym etapie nie zależy od wyników wcześniejszych losowań (niezależność losowania). Wnioskowanie statystyczne Estymacja (szacowanie) nieznanych parametrów rozkładu cechy w populacji. Sprawdzenie (weryfikacja) słuszności hipotez dotyczących wartości parametrów rozkładu cechy w populacji albo postaci rozkładu.
Przykłady 1. Populacja: wszyscy pacjenci odwiedzający Ośrodek Zdrowia przy ul. Tetmajera. Próba losowa prosta: 510 pacjentów wybranych losowo. Cechy statystyczne: płeć, wiek, waga, wykształcenie, rejon zamieszkania. Zbadać zależność nakładów poniesionych na leczenie w odniesieniu do powyższych cech. 2. Populacja: codzienne zanieczyszczenie powietrza na Krakowem. Próba losowa: codzienne zanieczyszczenie powietrza w latach 2010-2013. Cechy statystyczne: poziom SO 2, NO 2, temperatura powietrza. Przewidywanie poziomu zanieczyszczeń.
Przykłady 3. Populacja: Kwiaty koniczyny znajdujące się w moim ogrodzie Próba losowa prosta: 422 kwiaty wybrane losowo. Cechy statystyczne: liczba mszyc, liczba liści, rejon wzrostu. Zbadać zależność kondycji roślin w odniesieniu do rejonu wzrostu. Przewidywana liczba mszyc w kolejnym okresie wzrostu. 4. Populacja: Populacja noworodków w Krakowie. Próba losowa: noworodki urodzone w ubiegłym roku w Szpitalu Uniwersyteckim w Krakowie. Cechy statystyczne: waga, kolor oczu, obwód głowy, ocena wg Apgar Ocena przewidywanej liczby narodzin dzieci o wadze poniżej 3 kg w tym samym okresie roku bieżącego.
Ad. 4 Dzieci Populacja noworodków urodzonych w Krakowie. Próba losowa prosta: 86 noworodków urodzonych w grudniu ubiegłego roku w Szpitalu Uniwersyteckim w Krakowie. Cecha statystyczna podlegająca badaniu: grupa krwi, waga dziecka Zdarzenia elementarne to urodzenie dziecka o określonej grupie krwi, wadze. Przestrzeń zdarzeń elementarnych Ω ={AB, A, B, 0}, Ω=[0;10000] [g]. Tabela danych grupa krwi dzieci liczba dzieci 32 33 Grupa krwi dziecka Liczba dzieci Częstość dzieci A 33 0,38 B 14 0,17 AB 7 0,08 0 32 0,37 częstość dzieci 7 37% 14 38% 8% 17%
Tabela danych waga dzieci Waga dziecka Liczba dzieci Waga dziecka Liczba dzieci (0;500] 0 (5000;5500] 18 (500;1000] 0 (5500;6000] 7 (1000;1500] 0 (6000;6500] 3 (1500;2000] 1 (6500;7000] 2 (2000;2500] 1 (7000;7500] 2 (2500;3000] 4 (7500;8000] 1 (3000;3500] 6 (8000;8500] 0 (3500;4000] 10 (8500;9000] 0 (4000;4500] 16 (9000;9500] 0 (4500;5000] 15 (9500;10000] 0
Tabela danych 2 dzieci podział na klasy rozłączny, wyczerpujący Waga dzieci [g] Liczba dzieci (1500;2500] 2 (2500;3500] 10 35 Liczba dzieci 30 26 25 33 (3500;4500] 26 20 (4500;5500] 33 (5500;6500] 10 (6500;7500] 4 (7500;8500] 1 15 10 5 0 2 10 10 4 1 Waga dzieci
Szereg rozdzielczy wagi noworodków prosty skumulowany Waga dzieci (w gramach) Liczba dzieci Częstość n i dzieci w i Waga dzieci (w gramach) Skumulowana liczba dzieci Dystrybuanta empiryczna (1500;2500] 2 0,02 (2500;3500] 10 0,12 (3500;4500] 26 0,3 (4500;5500] 33 0,38 (5500;6500] 10 0,12 (6500;7500] 4 0,05 (7500;8500] 1 0,01 (1500;2500] 2 0,02 (2500;3500] 12 0,14 (3500;4500] 38 0,44 (4500;5500] 71 0,83 (5500;6500] 81 0,94 (6500;7500] 85 0,98 (7500;8500] 86 1
Histogram rozkładu wagi dzieci liczba dzieci 35 33 30 25 26 20 15 10 5 0 2 10 10 4 1 Waga dzieci
Wielobok liczebności wagi dzieci liczba dzieci 35 30 25 26 33 20 15 10 10 10 5 0 2 4 1 Waga dzieci
Histogram rozkładu wagi dzieci częstość dzieci 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 0,02 0,12 0,3 0,38 0,12 0,05 0,01 Waga dzieci
Wielobok częstości wagi dzieci częstość 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 0,02 0,12 0,3 0,38 0,12 0,05 0,01 Waga dzieci
Skumulowana częstości rozkładu wagi dzieci (dystrybuanta empiryczna) skumulowana częstość 1,2 1 0,8 0,6 0,4 0,2 0 Waga dzieci
Wielobok skumulowanych częstości rozkładu wagi dzieci 1,2 1 0,8 0,83 0,94 0,98 1 0,6 0,4 0,44 0,2 0 0,02 0,14 Waga dzieci
Ad. 4 Dzieci A 1 - zdarzenie elementarne, narodziny dziecka o wadze (1500;2500] [g] A 2 zdarzenie elementarne, narodziny dziecka o wadze (2500;3500] A 3 zdarzenie elementarne, narodziny dziecka o wadze (3500;4500]. A 7 zdarzenie elementarne, narodziny dziecka o wadze (7500;8500] Zbiór zdarzeń elementarnych Ω={A 1, A 2, A 3,,A 7 } ω A 1 A 2 A 3 A 4 A 5 A 6 A 7 X(ω)=x j 2000 3000 4000 5000 6000 7000 8000 P(X=x j )=p j 0,02 0,12 0,3 0,38 0,12 0,05 0,01 p 1 + p 2 + + p 7 = 1