STATYSTYKA OPISOWA LABORATORIUM KOMPUTEROWE DLA I ROKU KIERUNKU ZARZĄDZANIE ZESTAWY ZADAŃ Opracowała: Milena
STATYSTYKA OPISOWA LAB.1. Zadanie 1 Następujące dane są liczbami pasażerów korzystających z rejsów Delta Air Lines między San Francisco a Seattle w ciągu 33 dni kwietnia i maja: 128, 121, 134, 136, 118, 123, 109, 120, 116, 125, 128, 121, 129, 130, 131, 127, 119, 114, 134, 110, 136, 134, 125, 128, 123, 128, 133, 132, 136, 134, 129, 132, 133. Znajdź dominantę, medianę, dolny, środkowy i górny kwartyl dla tego zbioru danych. Jaki jest odstęp międzykwartylowy? Oblicz średnią i odchylenie standardowe. Zadanie 2 Plik termin1-2012 zawiera dane dotyczące wyników z 1 terminu egzaminu ze statystyki opisowej w 2012 roku. Zbuduj szereg rozdzielczy dla tych danych, a następnie wyznacz i zinterpretuj następujące miary statystyczne: a) średnią arytmetyczną ocen b) medianę c) dolny i górny kwartyl d) dominantę e) wariancję i odchylenie standardowe z próby, f) współczynnik asymetrii i współczynniki skośności. Zadanie 3 Porównaj wyniki z 1 terminu egzaminu ze statystyki z wynikami z 2 terminu zawartymi w pliku 2termin-2012. Czy na ich podstawie można przypuszczać, że zadania na 2 terminie są łatwiejsze? Zadanie 4 Zapytano grupę 120 losowo wybranych studentów o ilość godzin spędzanych dziennie przed komputerem i otrzymano następujący rozkład: Ilość godzin Liczba osób 0-2h 5 2-4h 20 4-6h 44 6-8h 42 8-10h 9 SUMA 120 1. Wyznacz i zinterpretuj następujące miary statystyczne: a) średnią i odchylenie standardowe z próby, b) dominantę c) medianę, d) współczynnik zmienności, e) współczynnik asymetrii i kurtozę.
STATYSTYKA OPISOWA LAB.2 Zadanie 1 Czasopismo Fortune z 12 października 1987r. podaje listę najbogatszych ludzi na świecie i wartość ich majątku. Według szacunku czasopisma wartości te (w miliardach $) przedstawiają się następująco: 9,0 8,7 8,7 7,5 7,4 6,1 5,7 5,5 5,0 5,0 4,4 4,0 4,0 3,6 3,1 3,0 3,0 2,9 2,8 2,8 2,5 2,5 2,5 2,4 2,4 2,4 2,2 2,0 2,0 1,9 1,8 1,7 1,6 1,5 1,5 1,5 1,5 1,4 1,3 1,3 1,3 1,3 1,2 1,2 1,2 1,1 1,1 1,1 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 a) Dla powyższych danych zbuduj odpowiedni szereg rozdzielczy b) Znajdź medianę i dominantę najpierw korzystając z niepogrupowanych danych, a następnie przy wykorzystaniu szeregu rozdzielczego. Czy różnice są duże? Z czego wynikają? c) Korzystając z szeregu rozdzielczego oblicz średnią, wariancję, odchylenie standardowe d) Sporządź dla tych danych histogram liczebności i łamaną liczebności. Zad.2. Następujące dane podają, z jaką liczbą stron (w milionach) równoważny jest zasób informacji, który można przechowywać na dysku optycznym firmy Kodak: 2,01 2,32 2,45 2,00 2,22 2,67 2,03 2,08 2,09 2,55 2,33 2,31 2,22 2,10 2,15 2,17 2,43 2,22 2,18 2,19 2,30 2,42 2,00 2,03 2,04 2,05 2,11 2,16 2,19 2,00 2,06 2,07 2,05 2,00 2,27 2,40 2,05 2,03 2,02 2,35 2,39 2,07 2,08 2,11 2,34 2,37 2,09 2,15 2,33 2,25 2,16 2,13 2,20 2,11 2,06 2,41 2,03 Podziel te dane na klasy o jednakowej rozpiętości i wykreśl histogram liczebności. Policz względne częstości dla poszczególnych klas oraz częstości skumulowane. Narysuj histogram częstości oraz łamaną częstości skumulowanych. Średnią i wariancję policz najpierw dla danych nie pogrupowanych, a następnie dla danych pogrupowanych. Czy różnice są duże? Postaraj się je wyjaśnić. Zad.3. Podane niżej liczby są szacunkowymi wartościami sprzedaży sprzętu (w mln $) przez wymienionych producentów. Skonstruuj dla tych danych wykres strukturalny ( tortowy ): Electrolux 5100 General Electric 4350 Matsushita Electric 4180 Whirlpool 3950 Bosch-Siemens 2200 Philips 2000 Maytag 1580 Zad.4. Sporządź wykres słupkowy (poziomy i pionowy) dla danych z zadania 3. Czy któryś z tych trzech rodzajów wykresów jest właściwszy od innych? Jeżeli tak, to dlaczego?
STATYSTYKA OPISOWA LAB.3 Zad.1. Podane niżej liczby są szacunkowymi wartościami sprzedaży sprzętu (w mln $) przez wymienionych 7 producentów. Electrolux 5100 General Electric 4350 Matsushita Electric 4180 Whirlpool 3950 Bosch-Siemens 2200 Philips 2000 Maytag 1580 Zbadaj koncentrację wartości cechy jaką jest dochód firmy. W tym celu narysuj krzywą Lorenza i wyznacz współczynnik Herfindahla-Hirschmana. UWAGA: Przypomnijmy, że krzywa Lorenza powstaje poprzez połączenie punktów, których współrzędnymi są: skumulowane częstości względne podmiotów uszeregowanych wedle rosnącego udziału i skumulowane udziały w badanej cesze danego podmiotu i wszystkich jednostek go poprzedzających. Symbolicznie zatem możemy zapisać współrzędne punktu reprezentującego n-ty podmiot spośród grupy N podmiotów na krzywej Lorenza w następujący sposób: wynosi 1/n. Zad.2., ponieważ przy danych indywidualnych częstość względna każdego podmiotu Poniższa tabela obrazuje strukturę wynagrodzeń pracowników pewnej firmy: wynagrodzenie (zł) ilość osób 1000-2000 10 2000-3000 15 3000-4000 12 4000-5000 18 5000-6000 20 6000-7000 12 7000-8000 8 8000-9000 3 9000-10000 2 Zbadaj koncentrację wartości cechy jaką jest wynagrodzenie. W tym celu narysuj krzywą Lorenza i wyznacz współczynnik Giniego. Zad.3. Dla danych z zadania 1 narysuj krzywą koncentracji i wyznacz wskaźnik Rosenblutha.
STATYSTYKA OPISOWA LAB.4 Zad.1. Plik szeregi czasowe lab.4. zawiera arkusz o nazwie miedź. W arkuszu tym zamieszczone są dane dotyczące cen miedzi w USA w latach 1800-1997 (w $). Skonstruuj jednopodstawowy indeks cen przyjmując za rok bazowy 1960r. Następnie za nową podstawę przyjmij rok 1980. Dokonaj porównania dwóch otrzymanych indeksów na wykresie. Jak skonstruować indeks z rokiem bazowym 1980 mając do dyspozycji WYŁĄCZNIE indeks z rokiem bazowym 1960? Skonstruuj ciąg indeksów łańcuchowych. Podaj interpretację. W którym roku procentowa zmiana wydobycia w odniesieniu do roku wcześniejszego była największa? Zad. 2. Arkusz węgiel zawiera dane dotyczące rocznej produkcji węgla bitumicznego w USA w latach 1920-1968 w mln ton netto. Skonstruuj ciąg indeksów jednopodstawowych z rokiem bazowym 1940. Otrzymane indeksy przelicz na indeksy łańcuchowe. Zad.3. Arkusz strajki zawiera indeksy jednopodstawowe z rokiem bazowym 1951 informujące o ilości strajków w USA w latach 1951-1980. Otrzymane indeksy przelicz na indeksy łańcuchowe. Zad.4. W którym roku było najwięcej, a w którym najmniej strajków? Wiedząc, że w 1980 r. miało miejsce 3885 strajków wyznacz ilości strajków w poprzednich latach. Korzystając wyłącznie z indeksów łańcuchowych skonstruuj indeksy jednopodstawowe z rokiem bazowym 1970. W przedsiębiorstwie P produkującym sprzęt AGD porównano wartość sprzedaży wyprodukowanych towarów w 2011r. w stosunku do roku 2010. Dane liczbowe dotyczące zmian cen oraz rozmiarów sprzedaży prezentuje poniższa tabela: Lp. Nazwa towaru Cena (w tys. zł) Sprzedaż ( w tys. sztuk) 2010 2011 2010 2011 1 pralka automatyczna 1,18 1,34 3,5 2,9 2 lodówka 2,38 2,67 2,9 2,2 3 zamrażarka 1,1 1,2 1,2 1,6 4 zmywarka 1,75 1,41 2,2 3,1 kuchenka 5 mikrofalowa 0,21 0,17 1,7 2,2 6 kuchnia gazowa 1,36 1,22 0,9 1,1 Wyznacz agregatowy indeks wartości oraz agregatowe indeksy cen i ilości: Laspeyresa, Paaschego i Fishera.
STATYSTYKA OPISOWA LAB.5 Zad.1. Ze strony www.gpwinfostrefa.pl pobierz dane dotyczące dziennych cen zamknięcia akcji BANKBPH w okresie od 7.08.2006 do 27.10.2006 a) Usuń tygodnie w których brakuje notowań tak, aby pozostały dane z tych tygodni, w których mamy 5 notowań (od pon. do pt.). b) Otrzymany szereg czasowy przedstaw na wykresie. Na podstawie wykresu dokonaj wstępnej analizy składników szeregu. c) Z jakiego rodzaju wahaniami okresowymi możemy mieć tutaj do czynienia? Wyrównaj szereg stosując odpowiednie średnie ruchome. d) Wyrównaj wyjściowy szereg stosując wygładzanie wykładnicze przyjmując stałą wyrównywania: α= 0,5 α= 0,1 Porównaj na wykresie otrzymane szeregi. e) Dopasuj do danych liniową funkcję trendu stosując wyrównywanie szeregu za pomocą regresji liniowej. f) Zakładając addytywny charakter wahań okresowych (stała amplituda wahań) wyznacz wskaźniki wahań okresowych dla poszczególnych dni tygodnia. Zinterpretuj otrzymane wyniki. g) Wyeliminuj wahania okresowe za pomocą otrzymanych wskaźników. Zad.2. W zamieszczonej poniżej tabeli podany jest szereg czasowy kwartalnej wielkości produkcji opakowań szklanych (w mln sztuk) w pewnej hucie szkła w latach 1985-1989. Przyjmując multiplikatywny charakter wahań sezonowych wyznacz wskaźniki wahań okresowych dla poszczególnych kwartałów. Za ich pomocą wyrównaj wyjściowy szereg oraz znajdź prognozę wielkości produkcji w poszczególnych kwartałach roku 1990. Lata kwartały produkcja 1985 1 11,4 2 11,7 3 10,5 4 11,4 1986 1 11,8 2 12 3 10,7 4 11,8 1987 1 12,3 2 12,7 3 10,9 4 12,1 1988 1 12,8 2 13,3 3 11,2 4 12,9 1989 1 13,6 2 14,4 3 11,8 4 13,8
STATYSTYKA OPISOWA LAB. 6-7 Zad.1. Grupę studentów zarządzania badano jednocześnie pod względem dwóch cech: X i Y. Niech X oznacza ocenę z matematyki na świadectwie maturalnym, Y ocenę z zaliczenia z matematyki na I semestrze studiów. Wyniki prezentuje poniższa tabela: X Y 3 3,5 4 4,5 5 4,5 6 5 4 3,5 5 4 3 3 3 4 4 4,5 5 4,5 3 4 4 3,5 Wyznacz i zinterpretuj współczynnik korelacji Pearsona cech X i Y. Zad.2. Dwóch studentów zostało poproszonych o uszeregowanie 10 klubów piłkarskich w kolejności od najlepszego do najgorszego ( w ich opinii). Wyniki przedstawia poniższa tabela. Klub piłkarski S1 S2 Cracovia 6 1 Wisła Kraków 1 6 Jagiellonia Białystok 7 7 Korona Kielce 2 5 Lech Poznań 3 2 Legia Warszawa 8 3 ŁKS Łódź 4 8 Podbeskidzie Bielsko-Biała 9 9 Polonia Warszawa 5 10 Ruch Chorzów 10 4 Za pomocą współczynnika korelacji rangowej Spearmana zbadaj zgodność upodobań studentów. Zad.3. Poniższa tabela przedstawia dane dotyczące ilości rozwodów orzeczonych w poszczególnych województwach w 2008 roku oraz dane na temat wielkości procentowe dotyczące małżeństw wiejskich istniejących w 2007 roku. Zbadaj istnienie liniowej zależności pomiędzy ilością małżeństw wiejskich a ilością rozwodów.
X2 -ist.wsie Y-rozwody Dolnośląskie 29,91 6250 Kujawsko-pomorskie 38,96 3606 Lubelskie 53,40 1939 Lubuskie 35,95 2232 Łódzkie 36,85 4298 Małopolskie 50,84 4362 Mazowieckie 36,06 9165 Opolskie 48,95 1694 Podkarpackie 59,81 2290 Podlaskie 41,33 1837 Pomorskie 32,59 4096 Śląskie 22,32 9711 Świętokrzyskie 54,01 1259 Warmińskomazurskie 39,16 2805 Wielkopolskie 43,56 5677 Zachodniopomorskie 30,66 3784 Zad.4. W pewnym badaniu ankietowym przeprowadzonym wśród studentów uczelni krakowskich zanotowano m.in. wysokość miesięcznych wydatków na utrzymanie i miejsce pochodzenia studenta. Dla wylosowanej grupy 1000 studentów otrzymano dane przedstawione w poniższej tablicy: Pochodzenia Miejsce (Y) wieś Miasta do 50 tys. mieszkańców Miasta powyżej 50 tys. mieszkańców Miesięczne wydatki (X) 200-400 400-600 600-800 800-1000 40 90 100 20 120 250 120 30 20 30 150 50 Sprawdź, czy występuje zależność wysokości wydatków na utrzymanie (X) od miejsca pochodzenia (Y).