Statystyki opisowe i szeregi rozdzielcze - ćwiczenia ĆWICZENIA Piotr Ciskowski
ramka-wąsy przykład 1. krwinki czerwone Stanisz W eksperymencie farmakologicznym analizowano oddziaływanie pewnego preparatu na zmianę średniej objętości krwinki czerwonej (MCV) Otrzymano następujące wyniki dla MCV: 86, 112, 182, 93, 94, 93, 134, 113, 95, 102 Przed przystąpieniem do dalszych analiz postanowiono sprawdzić występowanie jednostek nietypowych Znaleźć je na wykresie ramka-wąsy
ramka-wąsy uwagi Stanisz wartości odstające i ekstremalne:
przykład 2. chorzy Stanisz W pewnym doświadczeniu medycznym przebadano 25 osób chorych na pewną chorobę Zebrane dane dotyczące cech (płci, wzrostu, wagi, poziomu cukru) przedstawiono w tabeli, w której ostatnia kolumna przedstawia umowną skalę natężenia choroby Płeć Wyznaczyć podstawowe statystyki opisowe poszczególnych zmiennych (wzrost, waga, poziom cukru) wraz z medianą, współczynnikiem asymetrii, kurtozą oraz współczynnikiem zmienności Wzrost Waga Poziom cukru Skala nasilenia choroby 1 175 51,5 6,0 M 2 2 169 56,0 6,6 M 3 3 169 81,0 5,6 K 2 4 156 52,0 5,2 M 1 5 164 61,0 6,2 K 1 6 165 56,0 5,8 M 1 7 172 82,0 6,8 K 3 8 170 82,0 6,4 K 3 9 156 48,5 5,7 K 1 10 160 73,0 5,6 M 2 11 168 54,0 5,4 M 1 12 166 51,0 5,8 K 2 13 165 54,0 6,0 K 2 14 168 84,0 5,8 K 2 15 172 86,0 6,6 M 3 16 170 47,5 4,9 K 1 17 169 64,0 5,6 M 1 18 170 52,0 5,9 M 2 19 180 54,5 5,8 M 1 20 177 52,0 5,7 K 1 21 172 90,0 4,6 K 1 22 164 86,0 6,0 K 2 23 172 52,0 5,3 M 1 24 163 51,0 6,5 M 3 25 176 53,0 5,8 M 2
przykład 3. kraje Słaby Dla 18 krajów Europy oraz Chin, Japonii i USA sporządzono prognozy krótkookresowe (na 2000 rok) w zakresie PKB, liczby ludności oraz inflacji Obliczyć statystyki opisowe: - N ważnych - średnia - mediana - minimum - maksimum - kwartyle - rozstępy - odchylenie standardowe - współczynniki zmienności - skośność - kurtozę Narysować, co się da: - histogramy - ramka-wąsy Wyciągnąć wnioski
przykład 3. kraje Słaby Dla 18 krajów Europy oraz Chin, Japonii i USA sporządzono prognozy krótkookresowe (na 2000 rok) w zakresie PKB, liczby ludności oraz inflacji Obliczyć statystyki opisowe: Narysować, co się da: Wyciągnąć wnioski Podziel tę zbiorowość na 3 bardziej jednorodne podzbiory - niech zmienna LUDNOŚĆ będzie podstawą podziału na trzy grupy: * do 10 mln - A * do 100 mln B * pow. 100 mln C Przekoduj zmienną ludność i użyj jej jako zmiennej grupującej w histogramach i wykresach skategoryzowanych
przykład 3. kraje Słaby Dla 18 krajów Europy oraz Chin, Japonii i USA sporządzono prognozy krótkookresowe (na 2000 rok) w zakresie PKB, liczby ludności oraz inflacji Obliczyć statystyki opisowe: Narysować, co się da: Wyciągnąć wnioski Podziel tę zbiorowość nie ze względu na LUDNOŚĆ, a na prognozowaną INFLACJĘ * grupa A - poniżej 3% (3% to mediana inflacji) * grupa B powyżej 3% Przeprowadź analizy w tych dwóch grupach
przykład 4. najbogatsi w USA Słaby Kapitał (w mld USD) 20 najbogatszych Amerykanów w końcu listopada 1999 roku według Forbesa ilustrują następujące dane Wyciągnąć wnioski Czy pozycyjna miara skośności rozkładu kapitału wskazuje na ten sam kierunek asymetrii i na tę samą siłę, co klasyczna miara skośności?
przykład 5. najbogatsi w Wwie Słaby Dysponujemy fragmentem wydruku statystyk opisowych empirycznego rozkładu wartości rynkowej (w mln zł) posiadanych akcji grupy 25 władców warszawskiej giełdy w końcu 1999 roku Wiedząc ponadto, że suma kwadratów odchyleń wartości rynkowej akcji od ich wartości średniej wynosi 771733.92 (mln zł) 2 określić stopień względnego zróżnicowania badanej zmiennej: a) 36.91% b) 10.29% c) 73.85% d) 125.54% Statystyki opisowe (WŁADCY) N ważnych Mediana Suma Skośność zmienna WARTRYNK 25 73,4 3570,7 3,01
przykład 6. plany budżetowe Słaby Dane empiryczne dotyczące planów budżetowych na 2000 rok 19 największych polskich miast w zakresie dochodów (X) oraz wydatków (Y) tys. zł zostały przedstawione (numerycznie i graficznie) następująco vide tabelka i wykres: zmienna Statystyki opisowe (BUDŻETY) N ważnych Średnia Mediana Dolny Kwartyl Górny Kwartyl Odch.Std. Skośność DOCHODY 19 786760,4 604209,0 327432,0 1335657 533890,5 0,767 Na podstawie danych z wydruku oraz z wykresu ramkowego stwierdzić wyznaczając odpowiednie miary względne, czy zróżnicowanie rozkładów obu cech (dochodów i wydatków) jest: a) takie samo b) większe dla dochodów c) większe dla wydatków d) nie można dokonać porównania na wykresie widać, że: mediana: 625995 kwartyle 25%-75%: (341980,1461621) zakres nieodstających: (218760,2162000)
przykład 7. tłok Słaby Poniższe dane dotyczą zatłoczenia (liczby pieszych) w słynnych alejach handlowych w 13 wybranych miastach w dzień powszedni (wtorek) oraz dzień weekendowy (sobota) Czy pozycyjna asymetria rozkładu zatłoczenia w badanych miastach była w dzień powszedni i w sobotę taka sama? Czy była dodatnia?
przykład 8. koszyk dóbr Luszniewicz Tygodnik Polityka porównał w 2001r. płace oraz koszyk wybranych ;-) dóbr konsumpcyjnych. Wyniki obserwacji zostały przedstawione w tabeli Która z obserwowanych zmiennych losowych charakteryzuje się najwyższym względnym stopniem zróżnicowania? Czy skośność i kurtoza są w analizowanych rozkładach podobne? Wykonaj histogramy (oddzielny dla płac oraz wielokrotny dla pozostałych zmiennych) oraz wykresy ramka-wąsy i przeanalizuj je Dokonaj standaryzacji wszystkich zmiennych Wykonaj histogramy oraz wykresy ramka-wąsy danych standaryzowanych Ile wynoszą średnie oraz odchylenia standardowe? Czy uległy zmianie liczbowe oceny współczynników skośności i kurtozy?
przykład 9. firmy Luszniewicz, Słaby W 2001r. sporządzono ranking 50 największych firm Europy Wschodniej największych ze względu na kapitalizację rynkową (obroty w mln USD). Dane indywidualne w postaci szeregu rozdzielczego zamieszczone są w tabeli Przedstaw je w postaci: przedziałowego szeregu rozdzielczego, czyli tabeli liczności histogramu i wykresu ramka-wąsy Oblicz podstawowe statystyki opisowe, czyli: średnią, medianę, min, max, dolny i górny kwartyl, odchylenie standardowe, skośność, kurtozę oraz klasyczny i pozycyjny wskaźnik zmienności, wyciągnij wnioski
przykład 9. firmy Luszniewicz, Słaby Załóżmy, że nie posiadamy danych indywidualnych dla poszczególnych krajów, a jedynie informacje o przedziałowym szeregu rozdzielczym tych 50 firm - ich obroty przedstawiono w postaci k=8 przedziałów klasowych. Przedziałom odpowiadają wagi naturalne i udziałowe Dla każdego przedziału wyznacz jego środek Wyznacz statystyki opisowe dla danych zapisanych przedziałowo dla środków przedziałów (średnią, medianę, max, min, kwartyle, odchylenie standardowe, współczynniki zmienności, skośność, kurtozę) i porównaj je ze statystykami otrzymanymi poprzednio dla pełnych danych
przykłady 10, 11, 12. auta, mieszkania, uczelnie smarterlanet W kolejnych arkuszach excelowych znajdują się dane dotyczące: samochodów sprzedawanych za pośrednictwem serwisu otomoto w dniu 1.10.2011 mieszkań sprzedawanych w Warszawie, Wrocławiu i Krakowie w latach 2006-2011 rankingu uczelni przeprowadzonym przez Politykę w 2011r. Przeanalizuj te dane i wyciągnij ciekawe wnioski