Grupowanie i klasyfikowanie danych statystycznych Klasyfikacja danych statystycznych to procedura uporządkowania danych, polegająca na podziale zbioru wartości danych na przedziały (grupy), zwane klasami. Każdy element zbioru danych może być zaliczony tylko do jednej klasy. Liczbę klas ustala się w zależności od tego, jakie informacje chcemy uzyskać. Na przykład, jeżeli mamy wyniki egzaminu maturalnego z matematyki, możemy chcieć uzyskać odpowiedź na pytania. Ilu abiturientów zdało, a ilu nie zdało? Ilu uzyskało co najmniej 50% liczby punktów możliwych do zdobycia? Ilu uzyskało powyżej 90% liczby punktów możliwych do zdobycia? Uwzględniając wszystkie możliwe pytania, ustala się liczbę klas i ich długość tak, żeby szybko i bez skomplikowanych obliczeń móc udzielić odpowiedzi. Uwaga. Klasy, na które zostaje podzielony zbiór wartości badanej cechy, nie muszą mieć tej samej długości. Tworząc klasy, tak domykamy przedziały, by każdy element zbioru danych był zaliczany tylko do jednej z klas (klasy są rozłączne). Diagram, który ilustruje zbiór danych statystycznych pogrupowanych w klasy, nazywamy histogramem. Przykład 10. Grupę osób zapytano o czas (w godzinach) spędzony na oglądaniu programu telewizyjnego w minionym tygodniu. Otrzymano wyniki: 19, 12, 24, 15, 14, 20, 19, 11, 16, 21, 12, 22, 16, 17, 11, 13, 18, 15, 14, 17, 10, 13, 28, 16, 17, 22, 12, 26, 19, 23, 16, 15, 22, 13, 24, 20, 25, 23, 19, 21, 18, 18, 13, 17, 17. a) Pogrupuj otrzymane dane w sześć klas o jednakowej długości i podaj liczebność każdej z nich. Rozwiązanie przedstaw w postaci tabeli liczebności. b) Sporządź histogram zbioru danych. c) Oblicz środki klas. Rozwiązanie a) 1 Wśród otrzymanych wyników szukamy wartości najmniejszej x min oraz wartości największej x max, aby obliczyć rozstęp R otrzymanych wyników. Najmniejszą wśród danych liczb jest 10, więc x min = 10. Największą wśród danych liczb jest 28, więc x max = 28. Zatem R = x max - x min =28-10 = 18, czyli R = 18. 2 Ustalamy długość klasy, dzieląc rozstęp R przez liczbę klas, czyli przez 6. Klasy mają więc długość. Zauważamy, że wszystkie różne przedziały: <10; 13), <13; 16), <16; 19), <19; 22), <22; 25), <25; 28) mają długość 3. Tworząc klasy, tak domykamy przedziały, by każdy element zbioru danych był zaliczony tylko do jednej klasy. 3 Tworzymy tabelę liczebności klas. Liczba godzin spędzonych przed Grupowanie Klasa Liczebność telewizorem (od... wartości wyników n i klasy do...) 10-13 <10; 13) ///// / 6 13-16 <13; 16) ///// //// 9 16-19 <16; 19) ///// ///// // 12 19-22 <19; 22) ///// /// 8 22-25 <22; 25) ///// // 7 25-28 <25; 28} III 3
Ćwiczenie 13. Podczas badań lekarskich czterdziestu mężczyzn powołanych do odbycia służby wojskowej uzyskało następujące wyniki dotyczące ich wzrostu (w cm): 183, 171, 182, 183, 183, 179, 175, 172, 180, 173, 180, 184, 172, 176, 185, 176, 180, 186, 168, 180, 178, 179, 174, 179, 182, 177, 180, 176, 186, 181, 185, 177, 176, 179, 187, 171, 173, 190, 175, 183. a) Pogrupuj otrzymane wyniki w klasy o długości 5 cm, tak by końce klas były całkowitą wielokrotnością liczby 5, i ustal liczebność każdej z nich. b) Sporządź histogram liczebności otrzymanych wyników. c) Oblicz środki klas i na histogramie liczebności zaznacz łamaną liczebności. Ćwiczenie 14. Wykonaj 100 rzutów kostką do gry i zapisz liczby oczek uzyskane w wyniku tych rzutów. Pogrupuj uzyskane wyniki w klasy: a) 1-2; 3-4; 5-6 i sporządź histogram uzyskanych wyników, b) 1-3; 4-6 i sporządź histogram uzyskanych wyników. Zadania utrwalające 7.11. Na egzaminie dojrzałości z matematyki można było uzyskać co najwyżej 100 punktów. Do egzaminu przystąpiło 60 abiturientów, którzy uzyskali następujące wyniki: 7, 12, 15, 18, 20, 21, 23, 26, 29, 31, 32, 34, 37,37, 38, 39, 40, 41, 41, 42, 43, 44, 44, 45, 45, 45, 47, 48, 48, 48, 49, 50, 50, 51, 53, 53, 54, 54, 55, 56, 57, 58, 59, 59, 60, 63, 64, 64, 67, 67, 69, 69, 71, 74, 75, 79, 87, 87, 88, 91. a) Ustal medianę liczby uzyskanych punktów. b) Pogrupuj wyniki w klasy o długości 10 punktów. c) Egzamin uważa się za niezdany, gdy zdający otrzyma mniej niż 30% punktów możliwych do uzyskania. Podaj liczbę osób, które ten egzamin zdały.
Średnia arytmetyczna danych statystycznych 7.12. Klienci wysyłający zwykłe paczki w urzędzie pocztowym wnoszą opłatę za tę usługę w zależności od wagi wysłanej paczki. Zestawienie liczby i rodzajów wysłanych paczek oraz pobieranych opłat podano w tabeli obok. a) Zestawienie wysłanych paczek przedstaw w postaci histogramu liczebności. b) Określ częstość dla każdego rodzaju wysyłanych paczek. c) Oblicz, ile złotych łącznie zapłacili klienci w urzędzie pocztowym za wysłanie tych paczek.
Ćwiczenie 11. W pewnym technikum odzieżowym, zgodnie z regulaminem szkolnym, wynik końcowy egzaminu z nauki zawodu obliczano za pomocą średniej ważonej, uwzględniając: oceną za projekt produktu (sukni, kostiumu itp.) z wagą 3 ocenę za wykonanie produktu według projektu z wagą 2 ocenę za prezentację z wagą l. Oceny trzech uczniów: Asi, Jurka i Teresy przedstawiono w tabeli. Uczeń Ocena za Ocena za Ocena za projekt wykonanie prezentację Asia Jurek Teresa 4 5 6 5 6 5 a) Dla każdego z wymienionych uczniów oblicz średnią arytmetyczną oraz średnią ważoną ocen i ustal ocenę końcową egzaminu. b) Czy ocenianie zgodnie z regulaminem szkolnym dla wymienionych uczniów było korzystne? Ćwiczenie 15. Konkurs matematyczny składał się z dwóch etapów. Po pierwszym etapie pięciu uczestników z najwyższą liczbą punktów przeszło do drugiego etapu. Wynik ostateczny był średnią ważoną obu etapów. W tabeli poniżej podano liczbę uzyskanych punktów i wagi przyporządkowane poszczególnym etapom konkursu. Podaj, który z zawodników zajął pierwsze, który - drugie, a który - trzecie miejsce w tych zawodach. Liczba punktów: Zosi Jurka Haliny Darka Wojtka 1 etap (waga 0,3) 12 15 16 14 15 II etap (waga 0,7) 20 18 18 19 16 4 3 2 Przykład 13. Słuchacze kursu języka angielskiego na egzaminie końcowym otrzymali następujące oceny: 4, 3, 4, 4, 5, 6, 5, 3, 3, 4, 2, 3, 5, 2, 4. a) Oblicz średnią arytmetyczną wszystkich ocen. b) Sporządź tabelę liczebności i oblicz średnią arytmetyczną ważoną tych ocen, przyjmując, że wagami są ich liczebności. Ćwiczenie 16. W pewnym punkcie sieci elektrycznej co godzinę w ciągu doby mierzono istniejące napięcie w woltach. Otrzymano następujące wyniki: 225, 227, 231, 230, 232, 226, 220, 224, 227, 235, 223, 229, 230, 230, 233, 232, 228, 228, 227, 232, 225, 229, 231, 228. a) Sporządź tabelę liczebności otrzymanych wyników. b) Oblicz średnie napięcie prądu w tym punkcie sieci. c) Wskaż dominantę i oblicz medianę uzyskanych wyników. d) Porównaj średnie napięcie z dominantą i medianą. Zapisz swoje spostrzeżenia.
Przykład 14. W jednej z klas trzecich pewnej szkoły wychowawca przeprowadził ankietę. Każdy uczeń odpowiadał na pytanie: Ile godzin dziennie po zajęciach szkolnych poświęcasz na dokształcanie (w tym również odrabianie pracy domowej)?". Wyniki ankiety (z podziałem na dziewczęta i chłopców) przedstawiono na diagramach. Oblicz średnią arytmetyczną liczby godzin przeznaczonych na dokształcanie: a) w grupie dziewcząt, b) w grupie chłopców, c) w całej klasie.
Zadania utrwalające 7.13. Oblicz średnią arytmetyczną, medianę i dominantę zestawu danych statystycznych: a) 5, 5, 7, 8, 9, 10, 10, 11, 13, 14, 14, 15, 16, 17, 18, 20, b) 5,4,1,3,3,4,5,6,5, c) 9,8,9,8,8,9,9,8. 7.14. W roku 2002 przeciętna długość życia kobiet w Rwandzie była równa 39,6 lat, w Stanach Zjednoczonych - 80 lat, w Rosji - 72,7, a w Japonii - 84. Czy można powiedzieć, że w roku 2002 przeciętna długość życia kobiet na Ziemi była równa średniej arytmetycznej przeciętnych długości życia kobiet wymienionych krajów? Odpowiedź uzasadnij.
7.17. Grupę liczącą 45 osób zapytano: Ile razy w ciągu minionego roku skorzystałeś(aś) z porady lekarza?" Wyniki badań podano w tabeli. Liczba porad 0 1 2 4 5 6 8 9 10 Liczba osób 12 3 5 3 7 5 3 4 3 a) Oblicz średnią arytmetyczną liczby porad lekarskich przypadających na jednego ankietowanego. b) Podaj dominantę liczby porad lekarskich. c) Podaj medianę liczby porad lekarskich. d) Dane z tabeli przedstaw na diagramie słupkowym liczebności.
7.23. Zarządca budynku mieszkalnego ogłosił przetarg na wymianę rur wodno-kanaliza-cyjnych w tym budynku. Do przetargu stanęły trzy firmy. O wyborze firmy miały zdecydować trzy kryteria: cena usługi, referencje o jakości usług firmy oraz czas wykonania usługi. Każdą z tych cech dla poszczególnych firm oceniono w skali od l do 10 i dla każdej z tych cech określono wagę. Dane te
podaje tabela zamieszczona poniżej. Oblicz średnią ważoną punktów i podaj, która firma powinna wygrać przetarg.