Plan wykładu Statystyka opisowa Dane statystyczne miary położenia miary rozproszenia miary asymetrii Statystyka matematyczna Podstawy estymacji Testowanie hipotez statystycznych
Żródła Korzystałam z ksiażek: Stanisława Ostasiewicz, Zofia Rusnak, Urszula Siedlecka, Statystyka. Elementy Teorii i Zadania. Wyd. Ak. Ekon. we Wrocławiu. Krystyna Bieńkowska-Lipińska, Dominik Jagiełło, Rafał Maj, Rachunek prawdopodobieństwa i statystyka, http://www.ibuk.pl.
Dane statystyczne Statystyka opisowa zajmuje się opracowaniem danych statystycznych. Pozwala przedstawić dane w sposób uporzadkowany, dajacy możliwość ich analizy. Populacja statystyczna nazywamy zbiór wszystkich możliwych elementów (jednostek), które podlegaja badaniu. Próba losowa- część elementów populacji. Cechy statystyczne: niemierzalne (np. płeć, kolor oczu, rozmieszczenie przestrzenne,...) mierzalne dyskretne ciagłe
szeregi statystyczne Szeregiem statystycznym nazywamy ciag wielkości statystycznych uporzadkowany według określonych kryteriów. szeregi szczegółowe; Załóżmy, że zmienna X przyjmuje skończona ilość wartości (przedmiotem badania jest niewielka liczba jednostek), możemy je uporzadkować rosnaco, lub malejaco. szeregi rozdzielcze; zbiorowość statystyczna dzielimy na klasy wedłu określonej cechy jakościowej lub ilościowej z podaniem liczebności każdej z wyodrębnionych klas. punktowo przedziałowo
szereg punktowy i x i n i n sk i 1 x 1 n 1 n sk 1 2 x 2 n 2 n sk 2 3 x 3 n 3 n3 sk............ k x k n k nk sk Σ n x i jest i-ta wartościa badanej cechy n i liczebnościa cechy x i w badanej próbce ni sk to liczebności skumulowane, tzn. ni sk = n 1 + n 2 +... + n i. Można podać też częstości: ω i = n i n.
przykład numer klasy liczba usterek liczba wyrobów i x i n i ni sk ω i 1 0 30 30 0, 60 2 1 8 38 0, 16 3 2 6 44 0, 12 4 3 4 48 0, 08 5 4 2 50 0, 04 Σ 50
Szereg rozdzielczy przedziałowy i x i ẋ i n i n sk i 1 x 01 x 11 ẋ 1 n 1 n sk 1 2 x 02 x 12 ẋ 2 n 2 n sk 2 3 x 03 x 13 ẋ 3 n 3 n3 sk............ k x 0k x 1k ẋ k n k n sk k Σ n Oznaczenia: x 0i - poczatek i-tego przedziału klasowego, x 1i - jego koniec; ẋ i środek i- tego przedziału.
Przykład.
Histogram i diagram Histogram jest to zbiór prostokatów, których podstawy, wyznaczone na osi odciętych, stanowia rozpiętości poszczególnych przedziałów klasowych, a wysokości sa określone na osi rzędnych przez liczebności (częstości) odpowiadajace poszczególnym przedziałom klasowym lub przez gęstości liczebności (częstości) w przypadku nierównych przedziałów klasowych. Gęstość liczebności: f ni = n i h i, gdzie h i jest rozpiętościa (szerokościa) przedziału klasowego, czyli h i = x 1i x 0i. Gęstość częstości to f ωi = ω i h i. Diagram (wielobok liczebności) jest łamana powstała przez połaczenie punktów, których współrzędnymi sa środki przedziałów klasowych i odpowiadajace im liczebności (częstości lub gęstości).
Jak ustalić liczbę klas w szeregu rozdzielczym przedziałowym Liczba obserwacji Liczba zalecanych klas n k 40-60 6-8 60-100 7-10 100-200 9-12 200-500 11-17 Można też użyć przybliżenia: k n.
Parametry statystyczne Stosowane w analizach parametry dzieli się na miary położenia klasyczne średnia arytmetyczna, geometryczna, harmoniczna, inne pozycyjne modalna (moda, dominanta) kwantyle kwartyl pierwszy, drugi (mediana), trzeci, decyle miary zmienności (rozproszenia, dyspersji) klasyczne (np. odchylenie standardowe) pozycyjne (rozstęp, odchylenie ćwiartkowe) miary asymetrii miary koncentracji
Średnie klasyczne. Arytmetyczna Dla szeregu szczegółowego: n i=1 x = x i. n Dla szeregu rozdzielczego przedziałowego: k i=1 x = ẋi n i. n Dla szeregu rozdzielczego szczegółowego: x = k i=1 x i n i. n
Średnie klasyczne. Geometryczna x G = n x 1 x 2... x n. Zastosowanie przy badaniu średniego tempa zmian zjawisk.
Średnie klasyczne. Harmoniczna Dla szeregu szczegółowego: x H = n n i=1 1 x i. Dla szeregu rozdzielczego (przedziałowego): x = n k i=1. n i ẋ i Zastosowanie: gdy wartości cechy podane sa w przeliczeniu a stała jednostkę innej zmiennej, wagi natomiast w jednostkach liczników tych cech. Na przykład prędkość pojazdu w km/godz (wagi- km).
Przykłady Z danych o ludności pewnego miasta wynika, że w trzech kolejnych okresech liczba ludności wynosiła odpowiednio 5000, 7500, 8250. Oblicz średni przyrost względny ludności. Rozwiazanie. x 1 = 7500 5000 = 1, 5, x 2 = 8250 7500 = 1, 1. Średni przyrost względny to x G = 1, 5 1, 1 = 1, 2845.
Oblicz średnia prędkość samochodu jeżeli wiadomo, że a) samochód jechał 30 min z prędkościa 100km/h i 45 min z prędkoscia 60 km/h. b) samochód przejechał 50 km z prędkościa 100 km/h i 45 km z prędkościa 60 km/h. Rozwiazanie. a) x 1 = 100, n 1 = 0, 5, x 2 = 60, n 2 = 0, 75; n = n 1 + n 2 = 1, 25. x = 100 0, 5 + 60 0, 75 1, 25 = 76. b) x 1 = 100, n 1 = 50, x 2 = 60, n 2 = 45; n = 95. x = 95 50 100 + 45 60 = 76.
Spośród pięciu robotników jeden potrzebuje 6 min na wytworzenie pewnego produktu, dwóch kolejnych- 7 min, dwóch ostatnich 10 min. Jaki jest średni czas potrzebny tym robotnikom na wyprodukowanie tego wyrobu. Rozwiazanie. x 1 = 6, n 1 = 1, x 2 = 7, n 2 = 2, x 3 = 10, n 3 = 2; n = 5. 5 x = 1 6 + 2 7 + 2 = 7, 664. 10
Miary położenia pozycyjne. Modalna. Moda (dominanta, modalna, wartość najczęstsz), oznaczamy ja D lub Mo. W szergach szczegółowych lub rozdzielczych punktowych jest to ta wartość, która odpowiada największa liczebność (częstość). W szeregach rozdzielczych z przedziałami klasowymi wyznaczamy modę ze wzoru Mo = x 0m + 1 ( 1 ) + ( +1 ) h m, gdzie m to numer klasy, w której występuje modalna.
graficzna metoda wyznaczania modalnej
Miary położenia pozycyjne. Kwantyle Kwantyle definiujemy jako wartości cechy badanej, które dziela zbiorowość na określone części pod względem liczby jenostek. Najczęściej stosowane to kwartyle: Kwartyl pierwszy Q 1 dzieli zbiorowość na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości cechy mniejsze lub równe Q 1, a 75% większe lub równe Q 1. Kwartyl drugi (mediana) Q 2 (Me) dzieli zbiorowość na dwie części w ten sposób, że połowa jednostek zbiorowości ma wartości cechy mniejsze lub równe Me, a połowa większe lub równe Me. Kwartyl trzeci Q 3 dzieli zbiorowość na dwie części w ten sposób, że 75% jednostek zbiorowości ma wartości cechy mniejsze lub równe Q 3, a 25% większe lub równe Q 3.
Wyznaczanie kwartyli W szeregach szczegółowych medianę wyznacza się ze wzoru gdy n jest nieparzyste i Me = x n+1, 2 Me = x n/2 + x n/2+1, 2 gdy n jest parzyste. W szeregach rozdzielczych przedziałowych Me = x 0m + N Me m 1 h m, gdzie m to numer przedziału, w którym występuje mediana, N Me = n 2- pozycja mediany.
Wyznaczanie kwartyli Q 1 = x 0m + N Q 1 m 1 h m, gdzie m to numer przedziału, w którym występuje Q 1, N Q1 = n 4. Q 3 = x 0m + N Q 3 m 1 h m, gdzie m to numer przedziału, w którym występuje Q 3, N Q3 = 3n 4.
graficzna metoda wyznaczania kwartyli
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano liczbę dzieci w 50 rodzinach. liczba dzieci, x i 0 1 2 3 4 5 liczba rodzin, n i 7 17 15 6 3 2 ni sk 7 24 39 45 48 50 Me = (x 25 + x 26 )/2 = 2 Q 1 = x 13 = 1, Q 38 = 2.
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie kwartyli. Przykład Wyznacz kwartyle. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 Me = x 0m + N Me m 1 h m = = 45 + 60 (8 + 10 + 15) 39 10 = 52. Q 1 = x 0m + N Q 1 m 1 h m = 30 (8 + 10) = 35 + 10 = 43. 15 90 72 Q 3 = 55 + 10 = 60. 37
Wyznaczanie modalnej. Przykład Wyznacz modę. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 1 Mo = x 0m + ( 1 ) + ( +1 ) h m = = 45 + 39 15 10 = 54. (39 15) + (39 37)
Wyznaczanie modalnej. Przykład Wyznacz modę. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 1 Mo = x 0m + ( 1 ) + ( +1 ) h m = = 45 + 39 15 10 = 54. (39 15) + (39 37)
Wyznaczanie modalnej. Przykład Wyznacz modę. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 1 Mo = x 0m + ( 1 ) + ( +1 ) h m = = 45 + 39 15 10 = 54. (39 15) + (39 37)
Wyznaczanie modalnej. Przykład Wyznacz modę. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 1 Mo = x 0m + ( 1 ) + ( +1 ) h m = = 45 + 39 15 10 = 54. (39 15) + (39 37)
Wyznaczanie modalnej. Przykład Wyznacz modę. Badano wiek czytelników w pewnej bibliotece. wiek x i 15-25 25-35 35-45 45-55 55-65 65-75 liczba czytel. n i 8 10 15 39 37 11 ni sk 8 18 33 72 109 120 1 Mo = x 0m + ( 1 ) + ( +1 ) h m = = 45 + 39 15 10 = 54. (39 15) + (39 37)
Miary zmienności. Klasyczne. Wariancja i odchylenie standardowe. Wariancja: dla szeregu szczegółowego s 2 = 1 n n (x i x) 2 = 1 n i=1 dla szeregu rozdzielczego punktowego s 2 = 1 n k (x i x) 2 n i = 1 n i=1 n i=1 n i=1 dla szeregu rozdzielczego przedziałowego s 2 = 1 n k (ẋ i x) 2 n i = 1 n i=1 Odchylenie standardowe to s. n i=1 x 2 i x 2 ; x 2 i n i x 2 ; ẋ 2 i n i x 2.
Typowy obszar zmienności (dla parametrów klasycznych): Współczynnik zmienności x s < x typ < x + s. V = s x 100%.
Miary zmienności. Pozycyjne. Odchylenie ćwiartkowe Odchylenie ćwiartkowe Q = Q 3 Q 1. 2 Typowy obszar zmienności cechy (dla parametrów pozycyjnych): Me Q < x typ < Me + Q.
Przykład Obliczymy x, s, x typ, Me, Q, x typ dla szeregu rozdzielczego
Obliczamy średnia arytmetyczna x = 312, 7 49 = 6, 381.
Obliczamy odchylenie standardowe i typowy obszar zmienności.
Obliczenie kwartyli Me = 4, 7 + 24, 5 14 12 1, 6 = 6, 1;
Obliczenie kwartyli Q 1 = 3, 1 + 12, 25 1 13 1, 6 = 4, 485;
Obliczenie kwartyli Q 3 = 7, 9 + 36, 75 36 8 1, 6 = 8, 05.
Obliczenie odchylenia ćwiartkowego i typowego obszaru zmienności Q = 8, 05 4, 485 2 = 1, 78 6, 1 1, 78 < x typ < 6, 1 + 1, 78 4, 32 < x typ < 7, 88
Miary zmienności. Rozstęp Rozstęp R = x max x min.
Miary asymetrii