Statystyczy opis daych - parametry Ozaczeia żółty owe pojęcie czerwoy, podkreśleie uwaga * materiał adobowiązkowy
Zagadieia. Idea opisu parametryczego. Parametry a. położeia b. rozrzutu c. asymetrii
Statystyczy opis daych Rozkład empiryczy wartości cechy w formie tabeli (szereg rozdzielczy) w formie wykresu (histogram, wielobok, dystrybuata empirycza) Opis parametryczy (parametry to charakterystyki liczbowe) 3
Typy rozkładów empiryczych 4
Kometarz Zastosowaie Czym mogą różić się dwa rozkłady dzwoowate? 5
Przykład masa owocu (g) Odmiaa O:,,, 60 9, 93,5 90,0 95,3 97, 99,5 89,8 97, 93,0 94,5 97,7 93, 94, 00,5 93,5 85,3 95, 96, 95,8 96,9 00,6 89,0 9,6 0,5 84,3 86,9 95, 98,0 0, 03,5 95,3 00, 97,6 9,5 88,6 9, 94,6 88,8 93,3 96,8 00,8 9, 95,6 99,8 93,8 89,9 97,0 87,0 94, 90,8 93,9 96,3 98, 94, 99,6 96,5 98,7 05,8 98,9 90,8 93,8 93,0 94,3 95,4 89,5 98,4 99,5 97,7 89,3 97,8 9,5 94,7 00, 97,0 99,9 9,0 89,8 88,3 93,7 93,3 96,7 96,9 00, 97,3 0,8 89,4 06,3 9,6 0,7 93, 93, 9,6 89,7 94, 88, 93, 89,6 93, 99,5 93, 94,7 93,7 93,6 97, 97, 96,0 96,7 94,6 98, 98,0 99,9 89, 00, 9,3 9,0 9,9 9, 93, 95,4 9,3 94,6 97,0 93,4 99,4 98,3 0,4 98,5 0,7 95,5 99,4 90, 00,7 0,6 90,0 96, 94, 96,7 97,3 94,6 95,6 98,6 97,8 97,3 93,4 94,8 97, 96, 9,6 0,4 9,7 00,7 89, 94,3 90,7 96,5 94,6 97,6 9, 90,9 98,8 Odmiaa O: y, y,, y60 0, 03,5 00,0 05,3 07, 09,5 99,8 07, 03,0 04,5 07,7 03, 04, 0,5 03,5 95,3 05, 06, 05,8 06,9 0,6 99,0 0,6,5 94,3 96,9 05, 08,0, 3,5 05,3 0, 07,6 0,5 98,6 0, 04,6 98,8 03,3 06,8 0,8 0, 05,6 09,8 03,8 99,9 07,0 97,0 04, 00,8 03,9 06,3 08, 04, 09,6 06,5 08,7 5,8 08,9 00,8 03,8 03,0 04,3 05,4 99,5 08,4 09,5 07,7 99,3 07,8 0,5 04,7 0, 07,0 09,9 0,0 99,8 98,3 03,7 03,3 06,7 06,9 0, 07,3,8 99,4 6,3 0,6,7 03, 03, 0,6 99,7 04, 98, 03, 99,6 03, 09,5 03, 04,7 03,7 03,6 07, 07, 06,0 06,7 04,6 08, 08,0 09,9 99, 0, 0,3 0,0 0,9 0, 03, 05,4 0,3 04,6 07,0 03,4 09,4 08,3,4 08,5,7 05,5 09,4 00, 0,7,6 00,0 06, 04, 06,7 07,3 04,6 05,6 08,6 07,8 07,3 03,4 04,8 07, 06, 0,6,4 0,7 0,7 99, 04,3 00,7 06,5 04,6 07,6 0, 00,9 08,8 6
Przykład szereg rozdzielczy Odmiaa O 60 długość klasy d,5 Numer Graice Środek przedziału przedziału przedz. i Liczebość i. <84,05; 86,55) 85,3. <86,55;89,05) 87,8 7 3. <89,05;9,55) 90,3 3 4. <9,55;94,05) 9,8 3 5. <94,05;96,55) 95,3 33 6. <96,55;99,05) 97,8 34 7. <99,05;0,55) 00,3 0 8. <0,55;04,05) 0,8 7 9. <04,05;06,55> 05,3 Razem 60 7
Liczebość i 40 35 Przykład histogramy Rozkład wartości cechy dla odmiay O 3 33 34 30 5 3 0 0 5 0 7 7 Rozkład wartości cechy w próbie P 5 Liczebość i 0 40 85,3 87,8 90,3 9,8 95,3 97,8 00,3 0,8 05,3 35 30 5 0 wartości cechy 3 33 34 3 0 5 0 5 7 7 0 95,3 97,8 00,3 0,8 05,3 07,8 0,3,8 5,3 wartości cechy 8
Przykład wieloboki Rozkład wartości cechy dla odmia O i O P P Liczebość i 40 35 30 5 0 5 0 5 0 80,0 90,0 00,0 0,0 0,0 wartości cechy 9
Przykład wieloboki Liczebość i Rozkład wartości cechy dla odmia O i O3 P P3 40 35 3 33 34 30 5 0 5 3 0 0 7 7 5 0 75,0 85,0 95,0 05,0 5,0 wartości cechy 0
Do czego potrzebujemy parametrów?
Do czego potrzebujemy parametrów? Parametry opisują własości całego zespołu daych liczbowych: Rys. położeie (a osi liczbowej)
Do czego potrzebujemy parametrów? Parametry opisują własości całego zespołu daych liczbowych: Rys. rozrzut (względem średiej) 3
Do czego potrzebujemy parametrów? Parametry opisują własości całego zespołu daych liczbowych: Rys. 3 asymetrię (względem średiej) 4
Co opisują parametry rozkładu? Parametry rozkładu (charakterystyki rozkładu) opisują oceę własości: położeie (przecięty poziom) rozrzut (rozproszeie, dyspersja) asymetria (skośość) Rodzaje parametrów Parametry klasycze obliczae a podstawie wszystkich wyików. Parametry pozycyje - wyzaczae a podstawie pozycji wyików w szeregu statystyczym lub częstości ich występowaia. 5
Parametry położeia wartość średia (p. arytmetycza, harmoicza, geometrycza) wartość typowa ajczęściej występująca (domiata) wartość o ustaloej pozycji w rozkładzie (p. wartość w środku rozkładu - mediaa, wartość w jedej czwartej rozkładu - kwartyl pierwszy, wartość w jedej dziesiątej rozkładu decyl pierwszy) 6
7 Średia arytmetycza Dla daych,,..., : + + + i i... *Dla szeregu rozdzielczego; k - liczba klas, i - liczebość w i-tej klasie: + + + + + + k i i k i i i k k k sz......
Przykład Średia masa owocu odmiay O (g) + +... + 3 4,7 60 95,5 Obliczeia dla tych samych daych zagregowaych w szereg rozdzielczy: Numer przedziału Graice przedziału Środek przedz. i Liczebość i i i. <84,05; 86,55) 85,3 370,6. <86,55;89,05) 87,8 7 34,6 3. <89,05;9,55) 90,3 3 4376,9 4. <9,55;94,05) 9,8 3 669,6 5. <94,05;96,55) 95,3 33 6444,9 6. <96,55;99,05) 97,8 34 675, 7. <99,05;0,55) 00,3 0 4006,0 8. <0,55;04,05) 0,8 7 49,6 9. <04,05;06,55> 05,3 40,6 Razem 60 338,0 8
Przykład cd. sz + 3 38,0 k k + +... + +... + k 60 95,4 Kometarz: 95,5 95, 4 sz 9
Własości średiej arytmetyczej () jest wyliczaa a podstawie wszystkich wyików z próby (parametr klasyczy), przyjmuje wartości z przedziału: mi ma suma odchyleń wartości cechy od średiej arytmetyczej jest rówa zeru: i ( ) i 0 dla owych daych y i i + c, gdzie c - stała y + c dla owych daych z i k i, gdzie k stała, k > 0 z k 0
* Domiata Domiata wartość występująca ajczęściej w próbie (domiująca, wartość modala, moda). Przykład. Studeci pewej uczeli według liczby rodzeństwa. Liczba rodzeństwa % badaych studetów 0 3,4 5,5 3, 3 i więcej,0 Ogółem 00,0 D ; ajczęściej moża spotkać studeta (spośród zbadaych), który ma jedego brata lub jedą siostrę.
* Domiata przykład Pracowicy pewego zakładu według czasu dojazdu do pracy Czas dojazdu Liczba w miutach pracowików 5-5 3 5-5 5 5-35 5 35-45 5 45-55 5 55-65 Ogółem 55
Liczba pracowików * Domiata przykład Graficze wyzaczeie domiaty: 5 0 5 0 5 0 5 5 5 35 45 55 65 75 D() Czas dojazdu w mi 3
* Domiata przykład Rachukowe wyzaczeie domiaty: D( ) D 0 + ( ) ( ) D + D D D D D D+ h Dla wartości z przykładu: 5 5 D( ) 5 + 0 + ( 5 5) ( 5 5) 3,6 miuty Najczęściej spotykaym czasem dojazdu do pracy jest czas około 3,6 miuty (przy średiej arytmetyczej 33,6 miuty). 4
* Mediaa Mediaa (wartość środkowa) średia pozycyja Przykład. Obliczaie mediay dla daych: 35 40 36 35 39 37 38 36 38 Liczebość daychy 9 Po uporządkowaiu: 35 35 36 36 37 38 38 39 40; 5
* Mediaa Dla daych zagregowaych w szereg rozdzielczy przy wyzaczaiu mediay moża wykorzystać szereg liczebości skumulowaych. Mediaa zajduje się w klasie, w której skumulowae liczebości przekraczają lub co ajmiej osiągają umer kolejej jedostki środkowej. 6
* Mediaa - przykład Pracowicy pewego zakładu według czasu dojazdu do pracy. Czas dojazdu (mi.) Liczba pracowików Skumulowaa liczba pracowików 5-5 3 3 5-5 5 8 5-35 5 33 35-45 5 48 45-55 5 53 55-65 55 Ogółem 55 Jedostka środkowa ma umer (55+)/8 i ależy do przedziału <5;35). Zatem mediaa ależy do tego przedziału. 7
Liczba pracowików * Mediaa przykład cd. Wyzaczaie mediay metodą graficzą: 60 Na wykresie dystrybuaty 50 empiryczej, a osi pioowej 40 zajdujemy (+)/ i przez te 30 pukt prowadzimy prostą 0 prostopadłą aż do przecięcia się 0 0 z łamaą. Pukt przecięcia 5 5 5 35 45 55 65 M() rzutujemy a oś poziomą i Czas dojazdu w mi odczytujemy, mediaę czasu dojazdu wyoszącą około 33 miut. Zatem połowa badaych pracowików dojeżdża do pracy w czasie ie dłuższym, a połowa w czasie ie krótszym iż około 33 miuty. 8
Parametry rozrzutu Parametry rozrzutu (rozproszeia, dyspersji) - opisują zróżicowaie, zmieość dla daych: wariacja (miara klasycza) odchyleie stadardowe (miara klasycza) współczyik zmieości (miara klasycza) rozstęp (miara pozycyja) 9
30 Wariacja Wariacja obciążoa ( ) ( ) ( ) ( ) s i i i i obc + + +... Wariacja ieobciążoa ( ) ( ) ( ) ( )... + + + s i i i i Najmiejsza wartość wariacji wyosi zero, im większe zróżicowaie, tym większa wartość wariacji.
Odchyleie stadardowe Odchyleie stadardowe (wyrażae w takich jedostkach, w jakich mierzoa jest cecha). s s 3
Współczyik zmieości Współczyik zmieości cv s 00% Im miejszą przyjmuje wartość, tym miejsza zmieość (miej zróżicowaa cecha). 3
Rozstęp Rozstęp (obszar zmieości) R ma mi 33
* Asymetria rozkładu wartości cechy Przykład. Notowao liczbę błędów popełiaych przez operatorów komputerów w ciągu dia pracy: A po tygodiu od rozpoczęcia pracy, B po miesiącu od rozpoczęcia pracy, C - po półroczym okresie pracy. Liczba operatorów Klasa Liczba błędów A B C 0-3 3 4 5 3 5 6 4 3 4 7 8 3 5 5 9 0 5 6 3 Razem 5 5 5 34
Liczebość * Przykład cd. 6 5 4 3 A B C 0 3 4 5 6 Klasy liczby błędów A domiują osoby popełiające dużo błędów B domiują osoby popełiające średią ilość błędów C domiują osoby popełiające mało błędów 35
* Parametry asymetrii (skośości) Momet trzeci względy (miara klasycza) Dla daych,,..., : gdzie: 3 A 3 μ s 3 3 ( ) i i 3 36
* Parametry asymetrii Wzory dla szeregu rozdzielczego Momet trzeci cetraly: μ 3 k ( ) i 3 i i Momet trzeci względy: A 3 μ s 3 3 37
* Iterpretacja Iterpretacja zaku μ 3 w oceie kieruku asymetrii: μ 0 3 rozkład symetryczy μ 0 3 (asymetria prawostroa) μ 0 (asymetria lewostroa) 3 38
* Iterpretacja A3 Na podstawie badań empiryczych: ( ) A, 3 im wartość A 3 bliżej 0, tym słabsza asymetria im wartość A 3 dalej się od 0, tym większe atężeie asymetrii 39
* Przykład - rachuki pomocicze Wyzaczeie parametrów dla przykładu o błędach operatorów: Klasa Środek klasy i A liczeb. i Rachuki pomocicze: i i (i - ) (i - ) (i - ) i (i - ) 3 (i - ) 3 i 0 - -7 49 49-343 -343 3 4 3,5 3,5-4,5 0,5 0,5-9,5-9,5 5 6 5,5 -,5 6,5,5-5,65-3,5 7 8 7,5 3,5-0,5 0,5 0,75-0,5-0,375 9 0 9,5 5 47,5,5,5,5 3,375 6,875,5 3 34,5 3,5,5 36,75 4,875 8,65 Razem 5 Suma 30,5-30,5 8,00 wariacja s 8,70 odch. stad. s,95 µ3 -,35 A3-0,83 40
Liczebość * Przykład wyiki A: B: C µ 3 -,35-3,9 5,6 A 3-0,83-0,9 0,57 6 5 4 3 A B C 0 3 4 5 6 Klasy liczby błędów 4