Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA Zadanie 1 (Plik danych: Transport w Polsce (1990-2015)) Na podstawie danych z lat 1990-2015, dotyczących funkcjonowania transportu w Polsce proszę sporządzić prognozę liczby zarejestrowanych ciągników rolniczych na rok 2017 i 2018. Proszę wykorzystać model liniowy i model kwadratowy. W tabeli proszę podać wartość prognoz oraz współczynnik determinacji R 2 dla obu modeli. Prognozę proszę podać w formie prognozy punktowej oraz prognozy przedziałowej przy 99% poziomie ufności. Rok 2017 2018 Prognoza liczby zarejestrowanych ciągników rolniczych [tys. sztuk] Model liniowy Model kwadratowy Prognoza Prognoza R 2 Prognoza Prognoza punktowa przedziałowa punktowa przedziałowa R 2 Zadanie 2 (Plik danych: Wypadki w Polsce od 1998 roku (M)) Dane liczby i skutków wypadków drogowych w Polsce w latach 1998-2016 w układzie miesięcznym. Proszę dokonać agregacji danych miesięcznych dotyczących liczby wypadków do rocznych (poprzez zsumowanie wartości w poszczególnych miesiącach). Dane te należy umieścić w nowym arkuszu a następnie sporządzić prognozę liczby wypadków na rok 2017 i 2018 za pomocą modelu trendu liniowego. prognoza liczby wypadków na 2017 rok prognoza liczby wypadków na 2018 rok. wartość współczynnika determinacji dopasowania modelu do danych %
Zagadnienie 2: Prognozowanie za pomocą metody wyrównywania wykładniczego Zadanie 3 (Plik danych: Krajowe przewozy lotnicze w UE (dane kwartalne)) Dane dotyczą liczby pasażerów w ruchu krajowym w transporcie lotniczym w wybranych krajach Europy. Dane mają układ kwartalny. Stosując wskazane w tabeli metody wyrównywania wykładniczego proszę skonstruować prognozę liczby pasażerów w Hiszpanii na poszczególne kwartały 2017 roku. Proszę podać także bezwzględny błąd procentowy (MAPE) dla obu modeli. Rok 2017 Kwartał I Kwartał II Kwartał III Kwartał IV Prognoza liczby pasażerów w ruchu lotniczym w Hiszpanii za pomocą wyrównywania wykładniczego Model z trendem liniowym i addytywnymi wahaniami sezonowymi Model z trendem wykładniczym i addytywnymi wahaniami sezonowymi MAPE Który model należy uznać za lepszy z punktu widzenia jakości dopasowania do danych...... Zadanie 4 (Plik danych: Wypadki w Polsce od 1998 roku (M)) Dane dotyczą liczby wypadków drogowych i ich skutków. Dane mają układ miesięczny i obejmują okres od początku 1998 do końca 2016 roku. Stosując wskazane modele wyrównywania wykładniczego proszę skonstruować prognozę liczby osób rannych w wypadkach drogowych na wszystkie miesiące 2017 i 2018 roku. Proszę podać także średni bezwzględny błąd procentowy (MAPE) dla obu modeli. Okres sierpień 2017 październik 2017 sierpień 2018 październik 2018 Model z trendem liniowym i addytywnymi wahaniami sezonowymi Prognoza liczby osób rannych Model z trendem liniowym i multiplikatywnymi wahaniami sezonowymi MAPE Który model należy uznać za lepszy z punktu widzenia jakości dopasowania do danych:......
Zagadnienie 3: Prognozowanie za pomocą modelu liniowego lub kwadratowego dla jednoimiennych okresów Zadanie 5 (Plik danych: Wypadki w Polsce od 1998 roku (M)) Wykorzystując metodę trendów liniowych dla jednoimiennych okresów, proszę sporządzić prognozę punktową i przedziałową na 2018 rok liczby osób rannych w wypadkach drogowych w poszczególnych miesiącach. Proszę podać wartość prognozy punktowej oraz przedziałowej na 90% poziomie ufności oraz współczynnik determinacji dla wyszczególnionych w tabeli miesięcy. Prognozowany okres styczeń 2018 lipiec 2018 sierpień 2018 październik 2018 Prognoza liczby rannych w Polsce przedziałowa na 90% punktowa poziomie ufności Współczynnik determinacji modelu liniowego (%) Zadanie 6 (Plik danych: Krajowe przewozy lotnicze w UE (dane kwartalne)) Wykorzystując model kwadratowy dla jednoimiennych okresów, proszę sporządzić prognozę punktową i przedziałową na poszczególne kwartały 2016 roku liczby pasażerów w Hiszpanii. Proszę podać wartość prognozy punktowej oraz przedziałowej na 90% poziomie ufności oraz współczynnik determinacji modeli dla poszczególnych kwartałów. Prognozowany okres I kwartał 2016 II kwartał 2016 III kwartał 2016 IV kwartał 2016 Prognoza liczby pasażerów w Hiszpanii przedziałowa na 90% punktowa poziomie ufności Współczynnik determinacji modelu liniowego (%) Wskazówka: W arkuszu należy dodać dwie zmienne (X i X 2 ). Wartości zmiennej X należy wyliczyć za pomocą formuły =trunc((v0-1)/4)+1. Po wyliczeniu wartości zmiennych sterujących prognozą (X i X 2 ) należy usunąć formuły, bowiem przy wyodrębnianiu danych dla każdego kwartału straciłyby one sens.
Zagadnienie 4: Prognozowanie danych wykazujących sezonowość z wykorzystaniem zmiennych wskaźnikowych Zadanie 7 (Plik danych: Krajowe przewozy lotnicze w UE (dane kwartalne)) Wykorzystując model kwadratowy ze zmiennych wskaźnikowymi, proszę sporządzić prognozę punktową i przedziałową na poszczególne kwartały 2016 roku liczby pasażerów w Hiszpanii. Jako bazową zmienną wskaźnikową proszę przyjąć kwartał 1 (zmiennej tej nie uwzględniamy w analizie regresji). Proszę podać wartość prognozy punktowej oraz przedziałowej na 90% poziomie ufności oraz współczynnik determinacji modelu. Prognozowany okres I kwartał 2016 II kwartał 2016 III kwartał 2016 IV kwartał 2016 Prognoza liczby pasażerów w Hiszpanii przedziałowa na 90% punktowa poziomie ufności Współczynnik determinacji (%) Zadanie 8 (Plik danych: Krajowe przewozy lotnicze w UE (dane miesięczne)) Wykorzystując model liniowy ze zmiennych wskaźnikowymi, proszę sporządzić prognozę punktową i przedziałową na wskazane miesiące 2016 roku liczby pasażerów we Francji. Jako bazową zmienną wskaźnikową należy przyjąć styczeń (zmiennej tej nie uwzględniamy w analizie regresji). W modelu proszę uwzględnić pozostałe zmienne wskaźnikowe, nawet jeśli są nieistotne statystycznie. Proszę podać wartość prognozy punktowej oraz przedziałowej na 97% poziomie ufności oraz współczynnik determinacji modelu. Prognozowany okres styczeń 2016 luty 2016 lipiec 2016 sierpień 2016 Prognoza liczby pasażerów we Francji przedziałowa na 97% punktowa poziomie ufności Współczynnik determinacji (%)
Zagadnienie 5: Prognozowanie zmiennej dychotomicznej z wykorzystaniem modeli regresji logistycznej Zadanie 9 (Plik danych: Efekty rehabilitacji) W bazie danych znajdują się informacje o efektach rehabilitacji pacjentów po udarze mózgu. Efekt rehabilitacji został oceniony na skali punktowej, a następnie sklasyfikowany jako znaczny albo nieznaczny (zmienna 6). Celem analizy jest prognozowanie efektu rehabilitacji na podstawie informacji o wyjściowej sprawności chorych (zmienna 4) i ich wieku. W tym celu proszę wykorzystać model regresji logistycznej. Na podstawie uzyskanego modelu proszę oszacować prawdopodobieństwo uzyskania znacznego efektu rehabilitacji i podać ostateczną prognozę dla następujących hipotetycznych pacjentów: Sprawność przed rehabilitacją Wiek 14 pkt 35 lat 3 pkt 84 lata 3 pkt 31 lat Prawdopodobieństwo znacznego efektu rehabilitacji Decyzja prognosty przewidywany efekt rehabilitacji
Zagadnienie 6: Analiza sezonowości danych czasowych Zadanie 10 (Plik danych: Krajowe przewozy lotnicze w UE (dane kwartalne)) Celem analizy jest ocena sezonowości przewozów pasażerów transportem lotniczym we Włoszech. Proszę podać wartości multiplikatywnych i addytywnych wskaźników sezonowości dla poszczególnych kwartałów a następnie udzielić odpowiedzi na dodatkowe pytania. Kwartał I II III IV Addytywne wskaźniki sezonowości Liczba pasażerów we Włoszech Multiplikatywne wskaźniki sezonowości na podstawie wartości wskaźników multiplikatywnych proszę podać, w którym kwartale liczba pasażerów w transporcie lotniczym jest najwyższa i o ile procent przewyższa ona poziom średnioroczny ; na podstawie wartości wskaźników addytywnych proszę podać o ile więcej pasażerów korzysta z linii lotniczych w kwartale III w porównaniu do kwartału IV ;
Zagadnienie 7: Wyznaczanie indeksów dynamiki i ich interpretacja Zadanie 11 (Plik danych: Przewozy kolejowe w OECD (1970-2015)) Dane dotyczą przewozów pasażerów koleją w wybranych państwach świata w latach 1970-2015. Analiza dotyczy jednak tylko danych z lat 2000-2015. 1) Wykorzystując formuły arkusza Excel proszę wyznaczyć indeksy dynamiki o stałej podstawie (względem 2000 roku) dla poziomu przewozów pasażerów koleją w Polsce, w Czechach, Słowacji i na Węgrzech. Następnie proszę udzielić odpowiedzi na następujące pytania: w którym z czterech analizowanych krajów poziom przewozów koleją najbardziej spadł w roku 2015 w stosunku do roku 2000 i ile procent wynosił ten spadek? jak i o ile procent zmienił się poziom przewozów pasażerów koleją w roku 2010 w stosunku do roku 2000 w Polsce.., a jak i o ile procent w Czechach..? 2) Proszę wyznaczyć indeksy dynamiki o zmiennej podstawie (rok do roku) i odpowiedzieć na następujące pytania: w którym roku w latach 2000-2015 przewozy pasażerów koleją w Polsce wzrosły najbardziej i o ile procent? w którym kraju w latach 2012-2013 nastąpił największy wzrost liczby pasażerów przewożonych koleją i ile wynosił procent?
Zagadnienie 8: Prezentacja danych czasowych w postaci różnych wersji wykresu liniowego Zadanie 12 (Plik danych: Wskaźniki demograficzne w Polsce 1950-2016) Dane dotyczą sytuacji demograficznej w Polsce w latach 1950-2016. Celem analizy jest przedstawienie w formie graficznej dwóch wielkości (na jednym wykresie liniowym wykorzystując ODPOWIEDNI podtyp tego wykresu): liczby mieszkańców w Polsce (2); liczby rozwodów w Polsce (4). Wykres proszę starannie sformatować, zapisać pod nazwą Imię i nazwisko (prawy przycisk myszki, polecenie Zapisz wykres) a następnie wysłać jako załącznik mailem na adres: msobolew@prz.edu.pl w tytule maila proszę wpisać Wykres z egzaminu.