Janusz Górczyński. Moduł 3. Estymacja modeli krzywoliniowych dwóch zmiennych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Janusz Górczyński. Moduł 3. Estymacja modeli krzywoliniowych dwóch zmiennych"

Transkrypt

1 Materiały pomocnicze do e-learningu Prognozowanie i symulacje Janusz Górczyński Moduł 3. Estymacja modeli krzywoliniowych dwóch zmiennych Wyższa Szkoła Zarządzania i Marketingu Sochaczew 2012

2 2 Od Autora Treści zawarte w tym materiale były pierwotnie opublikowane w serii wydawniczej Wykłady ze statystyki i ekonometrii, a obecne ich wydanie zostało dostosowane do potrzeb kursu e-learningowego Prognozowanie i symulacje przygotowanego dla studentów kierunku zarządzanie. Prace nad wykorzystaniem komputerów i Internetu w dydaktyce zostały uruchomione w naszej Uczelni praktycznie od momentu jej utworzenia. Początkowo było to realizowane głównie poprzez przygotowywanie przez wykładowców różnego rodzaju materiałów dydaktycznych w wersji cyfrowej (pokazy PowerPoint, dokumenty Worda czy Excela), które były i są udostępniane w zakładce download. Kolejny krok to przygotowanie autorskiej platformy testów internetowych (zakładka Testy). Od 2011 roku została uruchomiona w pełni profesjonalna platforma e- learningowa, w której do weryfikacji wiedzy przekazywanej w kolejnych modułach zaadaptowane zostały wspomniane wcześniej testy internetowe. Treści zawarte w tym materiale zostały tak przygotowane, aby ułatwić tym z Was, którzy z różnych powodów mają problemy z matematyką, statystyką i ekonometrią, przypomnienie i zrozumienie materiału z zakresu wykorzystania wybranych fragmentów tej wiedzy do zastosowań praktycznych związanych z budowaniem modeli prognostycznych. Jak korzystać z tych materiałów? Sądzę, że dobrym rozwiązaniem będzie spokojne przeczytanie poszczególnych tematów, prześledzenie przykładowych zadań, a następnie trzeba je samemu rozwiązać. Weryfikatorem przyswojonej wiedzy jest w pewnym stopniu interaktywny test komputerowy. W ramach każdego modułu użytkownik dostaje pewną liczbę pytań pokrywających materiał modułu. W pierwszym podejściu próg zaliczenia ustawiany jest z reguły na 50% pozytywnych odpowiedzi, a w przypadku niezaliczenia testu próg jest podnoszony o 5% w każdej kolejnej próbie. Janusz Górczyński

3 3 Spis treści 1 MODEL KRZYWOLINIOWY LINEARYZACJA MODELU PRZYKŁAD Z WYDAJNOŚCIĄ PRACY ESTYMACJA MODELU LINIOWEGO = b b x ESTYMACJA MODELU = b b x ESTYMACJA MODELU y = b + b ln( ) x Prognozowanie w modelu logarytmicznym WYDAJNOŚĆ PRACY, MODEL POTĘGOWY 1 y = b x Prognozowanie w modelu potęgowym LITERATURA b

4 4 1 Model krzywoliniowy Powiedzmy, że interesuje nas problem określenia, czy między wydajnością pracy pracowników a stażem pracy istnieje związek funkcyjny. Dla rozwiązania tego problemu w pewnej firmie pobrano próbę losową pracowników produkcyjnych ustalając dla każdego z nich dwie cechy: wydajność pracy (zmienna objaśniana, zmienna Y) oraz staż pracy (zmienna objaśniająca, zmienna X). Poniżej widok arkusza kalkulacyjnego Excel z wynikami naszej próby. Zakładamy, że modelem dla zmiennej objaśnianej Y może być zmienna losowa normalna o wartości oczekiwanej będącej funkcją zmiennej objaśniającej X i stałej wariancji. Istotnym problemem do rozwiązania jest ustalenie, czy m ( x) = a + bx, czy też musimy wyjść poza klasyczny model liniowy. Ponieważ dane empiryczne zapisane są w Excelu, to w łatwy sposób można przygotować wykres rozrzutu punktów empirycznych XY. Dane empiryczne są tak ustawione, że pierwszy wiersz opisuje oś x-ów, dzięki temu kreator wykresów pozwala na przygotowanie wykresu bez specjalnych działań z naszej strony. Wystarczy wybór typu i dalej klik przycisku Zakończ. Utworzony wykres wymaga elementarnego formatowania obejmującego usunięcie legendy (nic nowego nie wnosi) oraz zmiana skali opisu osi y-ek. Element wykresu formatujemy po jego wcześniejszym zaznaczeniu, z reguły z pomocniczego menu uruchamianego prawym przyciskiem myszy. Poniżej widok wykresu po formatowaniu, dzięki wprowadzonym zmianom charakter związku między badanymi cechami jest bardziej wyraźny. Wydajnosc ,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0

5 5 Analiza rozkładu punktów empirycznych sugeruje, że jednym z rozpatrywanych modeli może być klasyczny model liniowy y = b0 + b1 x, z kolei biorąc pod uwagę charakter zjawiska dość trudno jest przyjąć założenie, że wydajność pracy będzie rosła w tym samym tempie w całym zakresie możliwych wartości stażu pracy. Być może lepszym modelem do opisu badanej zależności będzie model pierwiastkowy = b b x lub logarytmiczny y = b0 + b1 ln( x). Cechą charakterystyczną obu modeli jest wykres wypukły, a więc taki, który charakteryzuje funkcję rosnącą coraz wolniej. Reasumując powinniśmy sprawdzić, który z trzech poniższych modeli najlepiej opisuje zależność wydajności pracy od staży pracy pracownika: 1. = b b x 2. = b b x 3. y = b + b ln( ) 0 1 x Do estymacji tych modeli jak i weryfikacji założeń metody najmniejszych kwadratów można wykorzystać dowolne narzędzie, między innymi można wykorzystać procedury statystyczne dostarczane przez skoroszyt StatystykaJG.xlsm. Przy otwieraniu tego skoroszytu obowiązkowo musimy włączyć makra, jest to niezbędne, jeżeli chcemy korzystać z procedur statystycznych tego skoroszytu. Formalnie metoda najmniejszych kwadratów pozwala na estymację parametrów modelu liniowego, czyli takiego, w którym argument funkcji jest w pierwszej potędze. Ten warunek spełnia wyłącznie pierwszy z trzech wymienionych wyżej modeli. W przypadku dwóch pozostałych modeli musimy podjąć pewne działania, które pozwolą nam na użycie metody najmniejszych kwadratów. 2 Linearyzacja modelu Powiedzmy, że interesuje nas estymacja modelu regresyjnego postaci y = b0 + b1 x. Estymacja parametrów tego modelu wymaga jego sprowadzenia do postaci liniowej, czyli takiej, w której argument funkcji będzie w pierwszej potędze. W przypadku modelu formalny model liniowy postaci y kwadratów. = b + b1 = b b x wystarczy wprowadzenie nowej zmiennej z = x, aby otrzymać 0 z, którego parametry mogą już być estymowane metodą najmniejszych Przekształcenie, które sprowadza model nieliniowy do formalnie modelu liniowego nazywamy linearyzacją modelu. Przekształcenie może dotyczyć zarówno zmiennej niezależnej jak i zmiennej zależnej. Poniżej kilka przykładów linearyzacji modeli krzywoliniowych: Model krzywoliniowy Przekształcenie Model zlinearyzowany p p y b + b x z = x y = b0 + b1 z = 0 1 y = b + b ln( ) dla x > 0 z = ln(x) y b + b z 0 1 x b1 x y b0 a = gdzie R { 1} 1 y b0 + b1 x = dla x 0 a log y b b x + a = loga w log y B0 = log b = a a 0 y = b + b x + b ln( ) dla x > 0 ) x y = b + b x b k x 0 1 k w = 0 1 = B0 + b1 x 1 z = x y = b0 + b1 z z 1 = x; z2 = ln( x y = b0 + b1 z1 + b2z2 z = x;... z k = x 1 k y = b + b z b k z k

6 6 Przed rozpoczęciem estymacji parametrów modelu krzywoliniowego musimy wyznaczyć wartości zmiennych pomocniczych i wszelkie dalsze obliczenia wykonujemy już na nowym (przekształconym) zestawie danych. Sprowadzenie modelu nieliniowego do liniowego może też prowadzić do pewnych ograniczeń związanych zarówno ze skorelowaniem zmiennych przekształconych (konsekwencją mogą być trudności z rozwiązaniem układu równań) jak i z interpretacją parametrów modelu. Wrócimy do tych ograniczeń w przyszłości. 3 Przykład z wydajnością pracy Procedury tego skoroszytu wymagają, aby dane do obliczeń były ustawione pionowo, stąd przed wywołaniem procedury Liniowa z menu Regresja dane zostały tak ustawione zaczynając od komórki A Estymacja modelu liniowego = b b x W pokazanej sytuacji w obszarze A1:B21 mamy dane empiryczne pozwalające na estymację modelu liniowego = b b x. Po wywołaniu polecenia Liniowa z menu Regresja wprowadzamy informacje o położeniu danych wyjściowych oraz miejscu zwrócenia wyników (zakładka Dane wejściowe).

7 7 Po przejściu do zakładki Grafika i badanie założeń uaktywniamy te pola wyboru, które odpowiadają oczekiwanym przez nas wykresom oraz badaniom założeń. W poniższej sytuacji wybrane zostały wszystkie oferowane wykresy oraz zlecenie przeprowadzenia trzech testów dotyczących poprawności modelu, braku autokorelacji oraz normalności reszt losowych. Po kliku przycisku OK procedura zwraca wyniki estymacji modelu oraz wykresy i wyniki weryfikacji założeń, jeżeli takie były zadysponowane. Poniżej pokazany fragment arkusza z wynikami estymacji obejmujący weryfikację trzech założeń. W obszarze J1:M6 mamy wyniki weryfikacji hipotezy zerowej zakładającej, że zależność między wydajnością pracy a stażem pracy pracowników może być opisana modelem liniowym. Do weryfikacji wykorzystano test serii, wniosek końcowy jest taki, że nie mamy podstaw do odrzucenia hipotezy zerowej. Oznacza to, że badana zależność może być opisana modelem liniowym.

8 8 W obszarze J10:M14 mamy wyniki weryfikacji hipotezy zerowej zakładającej, że reszty losowe są normalne ze średnią 0 i odchyleniem 5,17 wobec alternatywy, że to nie jest taki rozkład. Wyniki weryfikacji testem w Shapiro-Wilka są takie, że hipotezę zerową musimy odrzucić, tym samym nie jest spełnione jedno z ważnych założeń metody najmniejszych kwadratów. Odrzucenie tej hipotezy (o normalności reszt losowych) może wynikać z wielu przyczyn, jedną z nich może być problem doboru modelu. Wprawdzie testem serii potwierdziliśmy, że model liniowy jest poprawny, ale to nie oznacza, że nie istnieje lepszy model, zwłaszcza wtedy, gdy nie jest spełnione założenie o normalności reszt. Proszę zwrócić uwagę, że weryfikowana była hipoteza zerowa o tym, że reszty są losowe ze średnią 0 i odchyleniem standardowym 5,17, być może one są losowe, ale z innym odchyleniem? Jeżeli istnieje lepszy model (niż liniowy), dokładniej opisujący badaną zależność, to będziemy uzyskiwać mniejszą ocenę odchylenia standardowego od modelu, tym samym zmieni się postać hipotezy zerowej zakładającej normalność reszt. Za taką sugestią przemawia wykres rozkładu reszt pokazany poniżej. Dość wyraźnie widać, że w modelu pominięto jakiś składnik krzywoliniowy. Reszty nie są rozłożone losowo wokół prostej y = 0, lecz są funkcją (wypukłą) stażu pracy. Wykres reszt w funkcji x-a Reasumując, model liniowy nie może być wykorzystany do poprawnego opisu badanej przez nas zależności, pozostaje nam sprawdzenie poprawności dwóch kolejnych modeli. 3.2 Estymacja modelu = b b x Przed estymacją tego modelu musimy zauważyć, że nie jest to model liniowy, stąd przed estymacją musimy dokonać jego linearyzacji. postaci Wprowadzając nową zmienną = b b z. z = x sprowadzamy model = b b x do (formalnie) modelu liniowego Przed wywołaniem procedury Liniowa musimy przygotować dane empiryczne pozwalające na estymację modelu = b b z, w naszym przypadku będziemy musieli dodać nową kolumnę danych odpowiadającą podstawieniu z = x. Do arkusza DanePierwiastkowe zostały przekopiowane dane wyjściowe, a następnie w C1 wpisana etykieta SQR(x), a w C2 formuła =PIERWIASTEK(A2). Formuła z C2 została następnie skopiowana na obszar C3:C21. Kolejny zrzut ekranowy pokazuje arkusz DanePierwiastkowe z tak przygotowanymi danymi, tym razem po wywołaniu procedury Liniowa jako obszar danych dla zmiennej X wskażemy C1:C21, a jako obszar danych dla zmiennej Y-ek zakres komórek B1:B21.

9 9 Poniżej widok obszaru danych i widok formularza procedury Liniowa z zakładką Dane wyjściowe, w której wskazano obszary niezbędne dla estymacji modelu = b b x, gdzie z = x. Podobnie jak w przypadku estymacji modelu liniowego w zakładce Grafika i badanie założeń zaznaczamy oba wykresy i weryfikację trzech założeń. Klik przycisku OK uruchamia działanie procedury, a wyniki estymacji zostają zwrócone do nowego arkusza (później nazwanego WynikiPierwiastkowy). Poniższy zrzut ekranowy tego arkusza pokazuje wyniki weryfikacji założeń, jak widzimy model pierwiastkowy nie może być wykorzystany do opisu badanej zależności. Spośród trzech badanych założeń nie jest spełnione założenie o poprawności doboru modelu, niejako jego konsekwencją jest także odrzucenie hipotezy o normalności reszt losowych. Pozostaje nam sprawdzenie, czy do opisu badanej zależności można wykorzystać model logarytmiczny.

10 Estymacja modelu y = b + b ln( ) 0 1 x Podobnie jak w modelu pierwiastkowym wprowadzamy podstawienie z = ln(x), co formalnie sprowadza model logarytmiczny do postaci = b b z, a jego parametry możemy już estymować metodą najmniejszych kwadratów. Przed wywołaniem procedury Liniowa musimy przygotować dane empiryczne pozwalające na estymację modelu = b b z, w naszym przypadku będziemy musieli dodać nową kolumnę danych odpowiadającą podstawieniu z = ln(x). Zostało to zrobione w arkuszu o nazwie DaneLogarytmiczny, gdzie przekopiowano dane oryginalne, a następnie dodano etykietę Ln(x) w komórce C1 i formułę =LN(A2) w komórce C2. Formuła z C2 została następnie skopiowana na obszar C3:C21. Mając przygotowane dane możemy wywołać procedurę Liniowa z menu Regresja wskazując odpowiednie obszary danych. Podobnie jak w poprzednich estymacjach w zakładce Grafika i badanie założeń zaznaczamy oba wykresy i weryfikację założeń o poprawności doboru modelu i normalności reszt losowych. Klik przycisku OK uruchamia działanie procedury, a wyniki estymacji zostają zwrócone do nowego arkusza (nazwanego WynikiLogarytmiczny).

11 11 Analizując wyniki weryfikacji założeń z obszaru J1:M6 oraz J10:M14 widzimy, że wybór modelu logarytmicznego jest uzasadniony statystycznie. Reasumując, model logarytmiczny może być dalej wykorzystywany do wyznaczania teoretycznej wydajności pracy przy zadanym stażu pracy. Przed wykonaniem prognozy powinniśmy przeanalizować wyniki estymacji parametrów modelu logarytmicznego procedura Liniowa zwróciła te wyniki zaczynając od komórki A1. W obszarze A2:E4 mamy oceny parametrów modelu i błędy standardowe tych ocen oraz dolne i górne granice przedziałów ufności dla prawdziwych wartości tych parametrów w populacji generalnej. Ocena stałej regresji jest równa 83,08 i jest wyznaczona z błędem ± 2,27, podobnie ocena współczynnika regresji jest równa 14,07 i jest wyznaczona z błędem ± 1,30 (jeżeli przyjmiemy, że prawdziwa wartość parametru b jest równa 14,07, to popełnimy błąd rzędu ± 1,30). Dla obu parametrów oszacowane są dolne i górne granice 95% przedziałów ufności, przykładowo dla współczynnika regresji mamy przedział b 1 < 11,34; 16, 80 >, który możemy zinterpretować następująco: z p-stwem 0,95 mamy prawo oczekiwać, że współczynnik regresji jest nie mniejszy niż 11,34, ale nie większy niż 16,80. Jak wiemy współczynnik regresji ma następującą interpretację merytoryczną: jeżeli logarytm stażu pracy wzrośnie o jedną jednostkę, to wydajność pracy średnio wzrośnie o 14,07 jednostek (logarytm stażu pracy a nie staż pracy, bo argumentem funkcji był nie staż pracy a jego logarytm naturalny). Do interpretacji możemy wykorzystać także przedział ufności dla współczynnika regresji: z p-stwem 0,95 mamy prawo oczekiwać, że przy wzroście logarytmu stażu pracy o jedną jednostkę wydajność pracy średnio wzrośnie nie mniej niż o 11,34 jednostek, ale nie więcej niż o 16,8 jednostek.

12 12 Przedział ufności dla współczynnika regresji (parametru b 1 w modelu y = b0 + b1 x) pozwala także na weryfikację hipotezy o nieistotności regresji H 0 : b 1 = 0 wobec alternatywy H 1 : b 1 0. Gdyby do wyznaczonego przedziału ufności należało zero, to wtedy nie mamy podstaw do odrzucenia hipotezy zerowej, w innym przypadku hipotezę zerową odrzucamy na założonym poziomie istotności. Dokładnie taką sytuację mamy w naszym przykładzie, przedział <11,34; 16,80> nie zawiera zera, tym samym odrzucamy H 0 : b 1 = 0 na korzyść H 1 : b 1 0. Inaczej mówiąc statystycznie wykazaliśmy, że istnieje istotny związek funkcyjny między wydajnością pracy a logarytmem stażu pracy. Hipoteza o nieistotności regresji H 0 : b 1 = 0, może być także weryfikowana testem F Fishera-Snedecora, stosowne wyniki mamy w obszarze A6:E8. Jak widzimy wartość empiryczna statystyki F jest bardzo duża, z kolei p-value jest mniejsze od domyślnego α = 0, 05, tym samym hipotezę zerową odrzucamy na korzyść alternatywy H 1 : b 1 0. W tych sytuacjach, gdy (liniowy) model regresji będzie zawierał więcej niż jedną zmienną objaśniającą test F będzie jedynym testem, który możemy wykorzystać do weryfikacji hipotezy o nieistotności regresji. 2 W komórce B11 mamy zwróconą wartość współczynnika determinacji R, w naszym przypadku jest to 86,7% - liczbie tej możemy nadać następującą interpretację: zmienność wydajności pracy w 86,7% jest wyjaśniona logarytmem naturalnym stażu pracy. W komórce E11 została wypisana wartość odchylenia standardowego reszt losowych. Wynik ten mówi o przeciętnym odchyleniu wartości empirycznych i teoretycznych wydajności pracy Prognozowanie w modelu logarytmicznym Model y = b0 + b1 z, gdzie z = ln(x) jest istotny statystycznie i są spełnione dwa istotne założenia MNK, tym samym możemy wykorzystać wyestymowany model do estymacji teoretycznych wartości wydajności pracy dla ustalonych wartości stażu pracy. Powiedzmy, że będziemy chcieli wyznaczyć te wartości dla x 01=10 oraz dla x 02 = 12. Do wykonania tej prognozy będziemy mogli skorzystać z procedur skoroszytu StatystykaJG.xlsm, ale wcześniej musimy przygotować potrzebne dane. Poniżej widok skoroszytu obliczeniowego (WydajnoscPracy) przy otwartym oknie dialogowym polecenia Prognozowanie z menu Regresja. W obszarze B45:B47 mamy wpisaną etykietę zmiennych niezależnych (x0), oraz obie interesujące nas wartości stażu pracy. Z uwagi na postać modelu (logarytmiczny, a nie liniowy) w obszarze C45:C47 wprowadzono etykietę i wartości zmiennej z = ln(x). Obszar ten został wskazany w polu kontrolki Wskaż obszar zmiennych niezależnych okna dialogowego procedury Prognozowanie.

13 13 Wcześniejsze trzy kontrolki wymagały wskazania: - obszaru oszacowań parametrów modelu (B2:B4); - obszaru stopni swobody i średniego kwadratu odchyleń (A8:C8); - obszaru macierzy odwrotnej do V 0 (A13:B15). Po kliknięciu przycisku OK na prawo od obszaru C45:C47 zwracane są wyniki prognozy. Kolejno mamy wyznaczoną wartość regresyjną (dla x=10 jest to 115,46), wynik ten można zinterpretować następująco: średnia wydajność pracowników z dziesięcioletnim stażem pracy będzie równa 115,46 jednostek. Wniosek ten obarczony jest błędem ± 1,48. W obszarze F46:G46 mamy dolny i górny przedział ufności dla wartości regresyjnej wyznaczony przy α = 0, 05, możemy nadać mu następującą interpretację: z p-stwem 0,95 mamy prawo oczekiwać, że średnia wydajność pracy pracowników z 10-letnim stażem będzie nie mniejsza niż 112,35 jednostek, ale nie większa niż jednostek. A jakiej wydajności można spodziewać się po zatrudnieniu konkretnego pracownika z dziesięcioletnim stażem? Okazuje się, że najlepszą oceną oczekiwanej wydajności będzie wartość regresyjna, czyli 115,46 jednostek, ale błąd tej oceny jest znacznie większy i wynosi ± 5,09. W obszarze I46:J46 mamy wyznaczoną dolną i górną granicę przedziału ufności dla prawdziwej (w populacji) wydajności pracy przy stażu 10-letnim (są to tzw. granice predykcji). Przedział ten można zinterpretować następująco: z p-stem 0,95 mamy prawo oczekiwać, że wydajność pracy pracownika z 10-cio letnim stażem pracy będzie nie mniejsza niż 104,77 jednostek, ale nie większa niż 126,16 jednostek. Ostatnia kolumna zawiera względne wartości błędów prognozy ex ante. W przypadku prognozowania wydajności pracy dla x = 10 błąd ten jest równy 4,41% i określa jak duży błąd popełniamy przyjmując, że prognozowana wydajność pracy będzie równa prognozie punktowej, czyli 115,46. Procedura Linowa może także przygotować dwa interesujące wykresy. Pierwszy z nich pokazuje rozrzut punktów empirycznych w funkcji zmiennej niezależnej, wartości teoretyczne wynikające z modelu, dolne i górne granice przedziałów ufności dla wartości regresyjnej (średniej) oraz dolne i górne granice przedziałów predykcji (dla realizacji pojedynczych wartości zmiennej losowej y-ek) Yi Yi (teor.) dolny p.u górny p.u dolny p.p górny p.p 60-0,7-0,1 0,6 1,2 1,9 2,5

14 14 Kolejny wykres pokazuje rozkład reszt w funkcji zmiennej niezależnej, wykres ten jest uzupełnieniem do weryfikacji hipotezy o poprawności doboru modelu funkcji regresji. 11 Wykres reszt w funkcji x-a 7 3-0,7-2 -0,1 0,6 1,2 1,9 2, Szczegółowa analiza rozkładu reszt losowych modelu y = a + b ln(x) sugeruje, że być może znajdziemy jeszcze inny model opisujący badane zjawisko równie dobrze, a może nawet lepiej niż model logarytmiczny. 3.4 Wydajność pracy, model potęgowy y = b 0 x b 1 W poprzednim rozdziale zostało zasugerowane, że być może istnieje inny jeszcze model niż logarytmiczny do opisania zależności między wydajnością pracy a stażem pracy pracownika. Wydaje się, że możemy rozważyć b 1 zastosowanie modelu potęgowego postaci y = b0 x, którego wykres spełnia nasze oczekiwania (wypukły, a więc funkcja będzie rosła coraz wolniej). Estymacja tego modelu wymaga jego wcześniejszej linearyzacji polegającej na obustronnym logarytmowaniu. b Mamy ln( y) = ln( a) + ln( x ) = ln( a) + b ln( x). Model ten możemy formalnie zapisać jako liniowy: = B B z, gdzie w = ln(y), a z = ln(x). w Przed wykorzystaniem procedury Liniowa musimy przygotować dane, które wykorzystamy do estymacji modelu. W naszym przypadku zostało to zrobione w arkuszu DanePotegowy skoroszytu WydajnoscPracy, gdzie w C1 i D1 wpisano etykiety nowych zmiennych, a w C2 formułę =LN(A2), która została skopiowana najpierw do D2, a następnie formuły z C2:D2 na obszar C2:D21.

15 15 Po przygotowaniu danych możemy już uruchomić procedurę Liniowa z menu Regresja skoroszytu StatystykaJG.xls, jako obszar danych dla zmiennej x wskażemy tym razem C1:C21, a jako obszar dla zmiennej y-ek odpowiednio D1:D21. Podobnie jak przy wcześniejszych estymacjach w zakładce Grafika i badanie założeń zaznaczamy wszystkie pola wyboru. Po kliknięciu przycisku OK procedura zwraca wyniki estymacji do nowego arkusza, po zakończeniu jej pracy nazwa tego arkusza została zmieniona na WynikiPotegowy. Poniżej widok fragmentu arkusza WynikiPotegowy, jak widzimy wszystkie założenia MNK są spełnione. Analiza wyników estymacji z obszaru A1:F11 pokazuje, że ocena współczynnika regresji jest równa 0,14 i jest wyznaczona z błędem ± 0,01, z uwagi na wprowadzoną transformację (obu zmiennych) wielkości tej można nadać następującą interpretację: jeżeli logarytm naturalny stażu pracy wzrośnie o jedną jednostkę, to logarytm naturalny wydajności pracy średnio wzrośnie o 0,14 jednostek.

16 16 Z faktu, że obie granice przedziału ufności dla współczynnika regresji są tego samego znaku wnioskujemy, że hipotezę o nieistotności regresji H 0 : B1 = 0 musimy odrzucić na korzyść alternatywy H 1 : B1 0, co oznacza, że istnieje istotny związek liniowy między logarytmem wydajności pracy a logarytmem stażu pracy. Warto jeszcze zwrócić uwagę na wielkość współczynnika determinacji (komórka B11). Uzyskany wynik ma taką interpretację: zmienność logarytmu naturalnego wydajności pracy jest w 88,1% wyjaśniona wpływem logarytmu stażu pracy (pamiętamy o dokonanej linearyzacji) Prognozowanie w modelu potęgowym Przed uruchomieniem procedury Prognozowanie z menu Regresja musimy odpowiednio przygotować obszar argumentów, dla których chcemy wykonać prognozę. W pokazanej sytuacji argumenty te zostały wpisane w obszarze B43:B45, ale do wykonania prognozy musimy je przekształcić wg formuły z 0 = ln( x 0 ), co zostało zrobione w obszarze C43:C45. Poniżej widok okna dialogowego procedury Prognozowanie z zaznaczonymi obszarami danych wykorzystywanymi do prognozy. Klik przycisku OK zwraca wyniki prognozy na prawo od obszaru C43:C45, tak jak to pokazano poniżej.

17 17 Musimy jednak pamiętać, że zwrócone dane nie odnoszą się do wydajności pracy, lecz do jej logarytmu naturalnego! Jeżeli chcemy wiedzieć, jakiej teoretycznie wydajności pracy możemy oczekiwać dla zadanego stażu, to musimy dokonać retransformacji uzyskanych wartości wg wzoru: y = EXP(w). Stosowne formuły musimy wpisać sami, w efekcie uzyskamy wyniki takie, jak pokazane niżej (obszar B48:K50). Błąd standardowy oraz błąd predykcji nie mogą być retransformowane wg tej samej formuły, w pokazanym niżej przykładzie retransformowane błędy predykcji zostały wyznaczone z definicji przedziału ufności wg formuły zapisanej w komórce H49 (liczba 2,1 widoczna w tej formule to wartość testu t-studenta dla 18 stopni swobody i alfa = 0,05). Retransformowany błąd predykcji był potrzebny dla wyznaczenia względnego błędu prognozy ex ante. Wyniki te interpretujemy analogicznie, jak w poprzednich przykładach. Na zakończenie jeszcze wykres reszt badanego modelu, ich rozkład potwierdza wyniki weryfikacji założeń modelu potęgowego. Wykres reszt w funkcji x-a 0,2 0,1 0,1 0,0-0,7 0,0-0,1 0,6 1,2 1,9 2,5-0,1

18 18 4 Literatura 1. Aczel A. D., Statystyka w zarządzaniu, Wydawnictwo Naukowe PWN, Warszawa Borkowski B., Dudek H., Szczęsny W., Ekonometria. Wybrane zagadnienia. Wydawnictwo Naukowe PWN, Warszawa Nowak E., (red.), Prognozowanie gospodarcze. Metody, modele, zastosowania, przykłady. Agencja Wydawnicza PLACET, Warszawa, Górczyński J,. Wybrane wzory i tablice statystyczne, Wyd. III poprawione i uzupełnione. Wyższa Szkoła Zarządzania i Marketingu, Sochaczew, Górczyński J., Podstawy statystyki, Wyd. II poprawione i uzupełnione. Wyższa Szkoła Zarządzania i Marketingu, Sochaczew, Górczyński J., Podstawy ekonometrii. Wyższa Szkoła Zarządzania i Marketingu, Sochaczew, Górczyński J., Procedury VBA i Microsoft Excel w badaniach statystycznych. Wyższa Szkoła Zarządzania i Marketingu, Sochaczew, Pawełek B., Wanat ST., Zeliaś A., Prognozowanie ekonomiczne. Teoria, przykłady, zadania. Wydawnictwo Naukowe PWN, Warszawa Welfe A., Ekonometria, Polskie Wydawnictwo Ekonomiczne, Warszawa 2003

Prognozowanie i symulacje w zadaniach

Prognozowanie i symulacje w zadaniach Wykłady ze statystyki i ekonometrii Janusz Górczyński Prognozowanie i symulacje w zadaniach Wyższa Szkoła Zarządzania i Marketingu Sochaczew 2009 Publikacja ta jest czwartą pozycją w serii wydawniczej

Bardziej szczegółowo

Janusz Górczyński. Moduł 4. Badanie, czy trend zjawiska jest liniowy lub wykładniczy.

Janusz Górczyński. Moduł 4. Badanie, czy trend zjawiska jest liniowy lub wykładniczy. Materiały pomocnicze do e-learningu Prognozowanie i symulacje Janusz Górczyński Moduł 4. Badanie, czy trend zjawiska jest liniowy lub wykładniczy. Wyższa Szkoła Zarządzania i Marketingu Sochaczew 2012

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Metody Ilościowe w Socjologii

Metody Ilościowe w Socjologii Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007 Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Regresja linearyzowalna

Regresja linearyzowalna 1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Paweł Cibis pawel@cibis.pl 23 lutego 2007 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa

Bardziej szczegółowo

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015 Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015 Nr indeksu... Imię i Nazwisko... Nr grupy ćwiczeniowej... Imię i Nazwisko prowadzącego... 1. Specyfikacja modelu

Bardziej szczegółowo

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018 Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018 Nr indeksu... Imię i Nazwisko... Nr grupy ćwiczeniowej... Imię i Nazwisko prowadzącego... 1. Specyfikacja modelu

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

Ekonometria. Zajęcia

Ekonometria. Zajęcia Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

4. Średnia i autoregresja zmiennej prognozowanej

4. Średnia i autoregresja zmiennej prognozowanej 4. Średnia i autoregresja zmiennej prognozowanej 1. Średnia w próbie uczącej Własności: y = y = 1 N y = y t = 1, 2, T s = s = 1 N 1 y y R = 0 v = s 1 +, 2. Przykład. Miesięczna sprzedaż żelazek (szt.)

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas: ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Badanie normalności rozkładu

Badanie normalności rozkładu Temat: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej: Metoda analizy macierzy współczynników korelacji Idea metody sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i równocześnie słabo skorelowane

Bardziej szczegółowo

7.4 Automatyczne stawianie prognoz

7.4 Automatyczne stawianie prognoz szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu

Bardziej szczegółowo

WYKŁAD 8 ANALIZA REGRESJI

WYKŁAD 8 ANALIZA REGRESJI WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Ekonometria i prognozowanie Econometrics and prediction

Ekonometria i prognozowanie Econometrics and prediction KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2013/2014 Ekonometria i prognozowanie Econometrics and prediction A. USYTUOWANIE

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

KARTA PRZEDMIOTU. 12. PRZEDMIOTOWE EFEKTY KSZTAŁCENIA Odniesienie do kierunkowych efektów kształcenia (symbol)

KARTA PRZEDMIOTU. 12. PRZEDMIOTOWE EFEKTY KSZTAŁCENIA Odniesienie do kierunkowych efektów kształcenia (symbol) KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: Ekonometria 2. KIERUNEK: MATEMATYKA 3. POZIOM STUDIÓW: I stopnia 4. ROK/ SEMESTR STUDIÓW: III/6 5. LICZBA PUNKTÓW ECTS: 5 6. LICZBA GODZIN: 30 / 30 7. TYP PRZEDMIOTU

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

5. Model sezonowości i autoregresji zmiennej prognozowanej

5. Model sezonowości i autoregresji zmiennej prognozowanej 5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =

Bardziej szczegółowo

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji Ćwiczenie: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Stanisza r xy = 0 zmienne nie są skorelowane 0 < r xy 0,1

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji, współczynnik korelacji wielorakiej. Paweł Cibis

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji, współczynnik korelacji wielorakiej. Paweł Cibis Regresja liniowa, współczynnik zmienności, współczynnik korelacji, współczynnik korelacji wielorakiej Paweł Cibis pcibis@o2.pl 9 marca 2006 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa wzory

Bardziej szczegółowo

POLITECHNIKA OPOLSKA

POLITECHNIKA OPOLSKA POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31 Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Korelacja krzywoliniowa i współzależność cech niemierzalnych Korelacja krzywoliniowa i współzależność cech niemierzalnych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Ekonometria. Regresja liniowa, dobór postaci analitycznej, transformacja liniowa. Paweł Cibis 24 marca 2007

Ekonometria. Regresja liniowa, dobór postaci analitycznej, transformacja liniowa. Paweł Cibis 24 marca 2007 Regresja liniowa, dobór postaci analitycznej, transformacja liniowa Paweł Cibis pawel@cibis.pl 24 marca 2007 1 Regresja liniowa 2 Metoda aprioryczna Metoda heurystyczna Metoda oceny wzrokowej rozrzutu

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Kilka uwag o testowaniu istotności współczynnika korelacji

Kilka uwag o testowaniu istotności współczynnika korelacji 341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności

Bardziej szczegółowo

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1 Temat: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00 0,20) Słaba

Bardziej szczegółowo

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych) Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych) Funkcja uwikłana (równanie nieliniowe) jest to funkcja, która nie jest przedstawiona jawnym przepisem, wzorem wyrażającym zależność wartości

Bardziej szczegółowo

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Jak sprawdzić normalność rozkładu w teście dla prób zależnych? Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu

Bardziej szczegółowo

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Estymacja parametrów w modelu normalnym

Estymacja parametrów w modelu normalnym Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia

Bardziej szczegółowo

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład

Bardziej szczegółowo

Własności statystyczne regresji liniowej. Wykład 4

Własności statystyczne regresji liniowej. Wykład 4 Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK

PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK 1 PROGNOZOWANIE I SYMULACJE 2 http://www.outcome-seo.pl/excel1.xls DODATEK SOLVER WERSJE EXCELA 5.0, 95, 97, 2000, 2002/XP i 2003. 3 Dodatek Solver jest dostępny w menu Narzędzia. Jeżeli Solver nie jest

Bardziej szczegółowo

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34 Statystyka Wykład 9 Magdalena Alama-Bućko 24 kwietnia 2017 Magdalena Alama-Bućko Statystyka 24 kwietnia 2017 1 / 34 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Wprowadzenie do analizy dyskryminacyjnej

Wprowadzenie do analizy dyskryminacyjnej Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela

Bardziej szczegółowo

Ekonometria Ćwiczenia 19/01/05

Ekonometria Ćwiczenia 19/01/05 Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych

Bardziej szczegółowo

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku. Zajęcia 4. Estymacja i weryfikacja modelu model potęgowy Wersja rozszerzona W pliku Funkcja produkcji.xls zostały przygotowane przykładowe dane o produkcji, kapitale i zatrudnieniu dla 27 przedsiębiorstw

Bardziej szczegółowo