Ćwiczenia 10. Analiza regresji. Część I. Zadania obowiązkowe UWAGA! Elementy zadań oznaczone kolorem czerwonym należy przygotować lub wypełnić. Zadanie 10.1. (R/STATISTICA) Twoim zadaniem jest możliwie dokładne oszacowanie kosztów zużycia energii elektrycznej, jakie poniesie twój zakład w przyszłym miesiącu. Koszt 1 kwh wynosi (bez opłat stałych 0,46 zł za 1 kwh, a planowana w przyszłym miesiącu wielkość produkcji, to 8 tys. sztuk. Kalkulację oprzyj na wynikach z poprzednich miesięcy: Wybór modelu regresji: Wielkość produkcji (w tys. sztuk) Zużycie energii (w tys. kwh) 2,1 22,35 6,3 57,19 9,7 81,12 4,8 46,32 10,1 82,39 6,1 53,70 5,8 56,93 7,5 63,91 4,6 44,35 9,7 84,27 Przedstaw wyniki obserwacji wykorzystując diagram korelacyjny.
Wybieramy model liniowy funkcji regresji postaci: y = a + bx, gdzie x oznacza wielkość produkcji, y zużycie energii, a i b są parametrami. Analiza modelu regresji: a) Oszacuj parametry funkcji regresji. Podaj postać dopasowanej funkcji regresji. b) Opisz stopień dopasowania funkcji regresji do danych empirycznych przy pomocy współczynnika determinacji. R 2 = c) Oszacuj prognozowane zużycie energii elektrycznej oraz jej koszty zakładając wielkość produkcji na poziomie 8 tys. sztuk wyrobów. Prognoza zużycia energii elektrycznej Prognoza kosztów. d) Sprawdź założenie normalności rozkładu reszt (założenie to jest potrzebne do prawidłowego wyznaczenia przedziału ufności dla prognozy) - Nazwa testu... - Hipoteza zerowa... - Hipoteza alternatywna... - Wartość statystyki testowej... - p-wartość... - Decyzja...
e) Jeśli nie ma podstaw do odrzucenia założenia o normalności reszt, to wyznacz 95% przedziały ufności dla prognozowanego zużycia energii elektrycznej oraz dla prognozowanych kosztów. 95% przedział ufności dla prognozowanego zużycia energii elektrycznej. 95% przedział ufności dla prognozowanych kosztów.. f) Zrób wykres funkcji regresji (wraz z danymi oraz 95% przedziałem ufności dla prognozy).
Zadanie 10.2. (STATISTICA/R) Dane w pliku Boston.sta zebrane zostały w 1978 roku po to, aby zbadać wpływ różnych czynników na ceny nieruchomości na przedmieściach Bostonu. Zmienne objaśniające: crim wskaźnik przestępstw, zn odsetek terenów zamieszkałych, indus odsetek terenów nieprzeznaczonych do celów handlowych, chas dostęp do rzeki Charles River, nox koncentracja tlenku azotu, rm średnia liczba pokoi w domu, age procent budynków zbudowanych przed rokiem 1940, dis ważona odległość od 5 centrów zatrudnienia w Bostonie, rad dostęp do autostrady, tax wielkość podatku od nieruchomości, ptratio wskaźnik uczniów przypadających na jednego nauczyciela, black procent ludności murzyńskiej, lstat procent populacji o niskim statusie społecznym. Zmienna objaśniana: medv mediana wartości domów w tys. dolarów. Wybór modelu regresji: Wybieramy model liniowy funkcji regresji postaci: y = a + a x + L + a x m 0 1 1 m gdzie x, K 1, x oznaczają zmienne objaśniające, y medianę wartości domów, m a, a, 0 1 K, am są parametrami. Analiza modelu regresji: a) Wykonaj test analizy wariancji w regresji przyjmując założenie normalności błędów oraz poziom istotności 0,05. - Hipoteza zerowa... - Hipoteza alternatywna... - Tabela analizy wariancji:, Źródło zmienności Suma kwadratów Liczba stopni swobody Średnie kwadraty Statystyka testowa Całość - Decyzja...
b) Oszacuj parametry funkcji regresji. Podaj które zmienne objaśniające to stymulanty, a które to destymulanty. Stymulanty: Destymulanty: c) Opisz stopień dopasowania funkcji regresji do danych empirycznych przy pomocy współczynnika determinacji (poprawionego). R 2 =. d) Analizując parametry funkcji regresji odpowiedz na pytania: Jeśli liczba pokoi wzrośnie o jeden, to prognozowana wartość nieruchomości wzrośnie o tys. dolarów. Jeśli liczba osób o niskim statusie społecznym wzrośnie o 1%, to prognozowana wartość nieruchomości zmaleje o tys. dolarów.
Zadanie 10.3. (R/STATISTICA) Budujemy model zależności pomiędzy wielkością produkcji (w tys. sztuk), a jednostkowym kosztem produkcji (w tys. zł. na 1000 sztuk). Dane w pliku Koszty.RData. Wybór modelu regresji: Przedstaw wyniki obserwacji wykorzystując diagram korelacyjny. Wybieramy model funkcji regresji postaci (model Cobba-Douglasa): b y = ax, gdzie x oznacza wielkość produkcji, y jednostkowy koszt produkcji, a i b są parametrami. Analiza modelu regresji: a) Dokonaj linearyzacji powyższego modelu poprzez odpowiednią transformację. Oszacuj parametry powyższej funkcji regresji. Podaj postać oszacowanej funkcji regresji..
b) Zrób wykres funkcji regresji. c) Dokonaj prognozy jednostkowych kosztów produkcji przyjmując wielkość produkcji, równą 5,5 tys. sztuk. Prognozowane koszty produkcji =