ANALIZA SZEREGÓW CZASOWYCH I PROGNOZOWANIE

Wielkość: px
Rozpocząć pokaz od strony:

Download "ANALIZA SZEREGÓW CZASOWYCH I PROGNOZOWANIE"

Transkrypt

1 ANALIZA SZEREGÓW CZASOWYCH I PROGNOZOWANIE Andrzej Sokołowski, Uniwersytet Ekonomiczny w Krakowie, StatSoft Polska Sp. z o.o. Wprowadzenie Analiza szeregów czasowych to jedna z części statystyki najczęściej stosowanych w praktyce gospodarczej. Zazwyczaj jej podstawowym celem jest uzyskanie możliwości prognozowania przebiegu zjawisk. Nie należy jednak nie doceniać dwóch innych celów analizy (czyli próby odpowiedzi na pytanie, jakie mechanizmy powodowały, że zjawisko przebiegało tak, a nie inaczej) oraz możliwości symulacji (to wymaga zbudowania modeli zawierających zmienne sterowalne; zmieniając ich poziom obserwujemy efekt). Szeregi czasowe, które obserwujemy w praktyce, są realizacjami pewnych procesów stochastycznych. Istnieje tu analogia do relacji pomiędzy populacją (zbiorowością generalną a próbą). Szereg czasowy jest próbą z procesu stochastycznego. Podobnie jak w klasycznym badaniu statystycznym chcemy poznać własności populacji na podstawie informacji z próby, tak tutaj na podstawie szeregu czasowego chcemy poznać właściwości mechanizmu, który go wygenerował, czyli procesu stochastycznego. Wybór metody analizy szeregu czasowego jest w dużej części zdeterminowany jednostką czasu, według której mierzono zjawisko. Mamy więc dane roczne, kwartalne, miesięczne, dekadowe, tygodniowe, dzienne, godzinowe, dane o wysokiej częstotliwości próbkowania, czy wreszcie dane ciągłe. Typowe elementy składowe procesu generującego szereg to trend, wahania okresowe (koniunkturalne, długookresowe, sezonowe, krótkookresowe), interwencje w proces (nagłe zmiany spowodowane czynnikami zewnętrznymi) oraz zawsze obecne wahania losowe. W większości analiz zakłada się, że wahania losowe są generowane przez rozkład normalny o wartości przeciętnej zero i stałej wariancji. Jeżeli składowe szeregu łączą się ze sobą poprzez dodawanie, to mamy do czynienia z modelem addytywnym, jeżeli łączą się poprzez mnożenie, to mamy model multiplikatywny. Poprzez logarytmowanie możemy go łatwo sprowadzić do postaci addytywnej. Oczywiście konkretny szereg czasowy nie musi mieć wszystkich tych elementów. Tak naprawdę to konieczny jest tylko jeden składnik losowy. Pewne składowe są naturalnie eliminowane z pola zainteresowań w zależności od jednostki miary czasu. W danych rocznych nie będziemy przecież poszukiwali wahań sezonowych czy dobowych. W toku budowy modelu możemy traktować szereg czasowy całościowo i próbować od razu modelować wszystkie jego składowe przykładem takiego podejścia jest wyrównywanie wykładnicze. Inne podejście przewiduje najpierw analizę trendu, ewentualnych Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 81

2 interwencji, potem wahań okresowych i na końcu reszt modelu całościowego, które są realizacją składnika losowego. Etapy analizy składników szeregu czasowego obejmują: identyfikację, pomiar, modelowanie, eliminowanie, prognozowanie. Dla każdego składnika szeregu czasowego mamy odpowiednie metody realizacji wymienionych etapów analizy. Zostaną one bliżej przedstawione w trakcie prezentacji dwóch przykładów. Przykład 1 Ten przykład poświęcony jest analizie danych rocznych. Mamy informacje dotyczące spożycia piwa w Polsce, średnio na głowę mieszkańca, w latach Jednostką miary są litry. Ze względu na charakter danych jest oczywiste, że w tym szeregu czasowym mogą występować co najwyżej trzy składniki: trend, interwencje, składnik losowy. Praktycznie każdą analizę konkretnego szeregu rozpoczynamy od analizy wykresu ilustrującego przebieg zjawiska. Z menu Wykresy wybieramy Wykresy 2W, a następnie Wykresy liniowe (Zmienne). Po określeniu kolumny arkusza danych zawierającego badany szereg czasowy (u nas jest to Piwo) otrzymujemy następujący rysunek Piwo Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

3 Najprostsza metoda identyfikacji trendu to ocena wykresu. Tutaj nie podlega dyskusji, że w latach występował w naszym kraju wyraźny, rosnący trend spożycia piwa. Stale zdobywało ono popularność. Jako pierwszy rozpatrzmy model, w którym występuje tylko trend i wahania losowe. Taki model ma postać f(.) to analityczna postać funkcji trendu. Jej wstępnego wyboru możemy dokonać już na wykresie. Przy definiowaniu Wykresu liniowego (Zmienne), na karcie Więcej wybieramy funkcję liniową. 100 Liniowy Piwo Piwo 6v*16c Piwo = 36,5385+4,2264*x Piwo Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 83

4 Na pierwszy rzut oka wydaje się, że funkcja liniowa dobrze oddaje ogólny kierunek rozwoju zjawiska. Na tym etapie warto ocenić liczbę serii odchyleń. Seria to ciąg odchyleń o jednakowym znaku. W latach szereg empiryczny jest pod trendem (odchylenia są ujemne) i to jest pierwsza seria, potem w latach wykres empiryczny jest ponad funkcją trendu i to jest druga seria itd. Zwracamy uwagę na właściwe określenia pojęcia seria na pewno nie jest nim używane w MS Excel niewłaściwe tłumaczenie angielskiego series. Series to nie seria, tylko szereg. Polska seria, to w języku angielskim run. Wracając do serii odchyleń w naszym szeregu czasowym mamy ich 6. Nie jest to liczba zachwycająca na 13 obserwacji (najmniejsza możliwa liczba serii przy używaniu Metody Najmniejszych Kwadratów to 3). Formalnie nie można odrzucić hipotezy o losowości reszt, bo lewa wartość krytyczna w teście serii dla tego układu ma wartość 4. W tytule ostatniego wykresu mamy oszacowaną liniową funkcję trendu. To nie jest wystarczające do pełniej analizy. Trend liniowy o postaci oszacujemy w module Regresja wieloraka. Wykorzystamy w tym celu zmienną czasową t, która przyjmuje wartości kolejnych liczb naturalnych, począwszy od jedynki dla 1995 r. Po naciśnięciu kolejno OK oraz Podsumowanie: Wyniki regresji otrzymujemy 84 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

5 Zwracamy uwagę przede wszystkim na poziom p przy współczynniku kierunkowym trendu. Jeżeli jest on mniejszy od przyjętego poziomu istotności (0,05), to jest to statystyczny dowód na występowanie istotnego trendu. Nasz trend liniowy ma postać: Stwierdzamy, że w latach średnioroczny przyrost spożycia piwa na jednego mieszkańca w Polsce wynosił 4,23 litra. Liniowa funkcja trendu w 98% opisuje zmiany, jakie zachodziły w spożyciu piwa. Średni błąd dopasowania (tu zwany błędem standardowym estymacji) wynosi 2,27 litra. O tyle przeciętnie różnią się wskazania funkcji trendu od rzeczywistego spożycia. W module Regresja wieloraka mamy szerokie możliwości analizy reszt. Na karcie Podstawowe widocznej po użyciu opcji Wykonaj analizę reszt (z karty Reszty, założenia predykcja) mamy Wykres normalności reszt. Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 85

6 2,0 Wykres normalności reszt 1,5 1,0 Wartość normalna 0,5 0,0-0,5-1,0-1,5-2, Reszty Punkty na tym wykresie wydają się nie wykazywać większych, ukierunkowanych odchyleń od prostej. Formalnie hipotezę normalności rozkładu reszt możemy zweryfikować, wyświetlając reszty klawiszem Podsumowanie: Reszty i przewidywane. W kolumnie Reszty usuwamy wartości minimum, maksimum, średniej i mediany. Następnie w menu Dane ustalamy powyższy arkusz jako Arkusz wejściowy. Teraz z menu Statystyka wybieramy kolejno Statystyki podstawowe i tabele, Tabele liczności i kartę Normalność. Wybieramy test Shapiro-Wilka. 86 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

7 Wartość p jest bardzo duża i oczywiście nie ma podstaw do odrzucenia hipotezy o normalności rozkładu reszt. Wracamy do Analizy reszt. Na karcie Więcej znajdujemy Statystykę Durbina-Watsona. Dla n=13 i liniowej funkcji trendu wartości krytyczne dla testu na dodatnią autokorelację wynoszą 1,010 oraz 1,340. Ponieważ nasza empiryczna wartość statystyki testowej leży między tymi wartościami, więc test nie pozwala na rozstrzygnięcie, czy korelacja dodatnia występuje czy nie. Zbudujmy teraz prognozę spożycia piwa na lata W Wynikach regresji wielorakiej na ostatniej karcie mamy możliwość wyliczenia prognozy punktowej wraz z przedziałem prognozy. W pojawiające się okno wpisujemy kolejne wartości zmiennej czasowej t dla roku 2009 jest to 14. Jeżeli nie zadowala nas mała liczba serii w odchyleniach od funkcji trendu, to możemy spróbować dopasować tzw. trend łamany. Koncepcja ta robi ostatnio karierę w epidemiologii pod nazwą joint-point regression (albo joinpoint regression). Oprogramowanie przygotowane w amerykańskim National Cancer Institute w ramach programu SEER (Surveillance Epidemiology and End Results) samo wyszukuje ewentualne punkty zwrotne trendu. My możemy oszacować trend łamany wprowadzając dwie interwencje do funkcji trendu. Na rysunku prezentującym szereg empiryczny widzimy, że w latach 2001 oraz 2004 nastąpiło dwukrotne przyhamowanie trendu obserwowanego w latach poprzednich. Te dwie interwencje oznaczamy dwiema zmiennymi zerojedynkowymi. Pierwsza I1 przyjmuje wartość zero do 2000 roku, a wartość 1 od 2001 roku do końca analizowanego Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 87

8 okresu. Druga zmienna I2 przyjmuje wartości zero do 2003 roku, a jeden od Tak więc zmienne te są równe zero na lewo od punktu zwrotnego, który wyznaczają, zaś jeden na prawo od punktu zwrotnego i w tym punkcie. Te dwie zmienne pozwalają nam założyć, że parametry funkcji trendu (wyraz wolny i współczynnik kierunkowy) mogą (choć nie muszą) ulegać zmianie w punktach zwrotnych. Równanie trendu liniowego łamanego w dwóch punktach ma teraz postać: Prosta idea tego wzoru jest taka, że w pierwszym punkcie zwrotnym wyjściowy wyraz wolny a 0 jest modyfikowany o a 1, zaś współczynnik kierunkowy b 0 jest modyfikowany o b 1. Podobna modyfikacja następuje w drugim punkcie zwrotnym. Powyższy wzór doprowadzamy do postaci Widać, że parametry tego modelu możemy oszacować jako parametry równania regresji z pięcioma zmiennymi objaśniającymi: I1, I2, t, I1t, I2t. Co bardzo ważne, poprzez weryfikację istotności takiego modelu możemy stwierdzić, czy parametry funkcji trendu naprawdę uległy korekcie w punktach, które podejrzewamy, że są punktami zwrotnymi funkcji trendu. Wyniki oszacowania modelu, o którym mówimy, są następujące Wartość p przy zmiennej I1 jest zbyt duża. Oznacza to, że w pierwszym punkcie zwrotnym nie uległ istotnej zmianie wyraz wolny trendu. Zgodnie z zasadami regresji krokowej zstępującej usuwamy tę zmienną z modelu. Ostateczny model trendu łamanego ma więc postać: 88 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

9 Zauważmy, że ten model ma niemal czterokrotnie mniejszy średni błąd dopasowania (0,6 litra) i rewelacyjny współczynnik determinacji (0,9987). 2,0 Wykres normalności reszt 1,5 1,0 Wartość normalna 0,5 0,0-0,5-1,0-1,5-2,0-1,2-1,0-0,8-0,6-0,4-0,2 0,0 0,2 0,4 0,6 0,8 Reszty Wykres nie ma już widocznych serii reszt, a na osi poziomej są błędy z przedziału tylko [-1;+0,8] litra. Wartość statystyki Durbina-Watsona wynosi Ponieważ współczynnik autokorelacji rzędu pierwszego jest ujemny, więc testujemy istotność autokorelacji ujemnej. Statystyką testową jest w takim przypadku wielkość 4-d, co w naszym przypadku wynosi 0,967. Liczba ta jest mniejsza od lewej wartości krytycznej przytoczonej uprzednio (1,010), co oznacza, że w szeregu reszt obserwujemy istotną autokorelację ujemną. Pozwala nam to zbudować model autokorelacji reszt. Najpierw jednak zinterpretujmy równanie trendu łamanego. Interesująca jest oczywiście tylko interpretacja współczynnika kierunkowego trendu. W latach spożycie piwa na 1 mieszkańca przyrastało w Polsce średnio o 5,48 litra rocznie; w roku 2001 spadło o prawie pół litra, a potem do roku 2003 wzrastało już wolniej, bo o średnio 4,69 litra rocznie. W 2004 znów nastąpiło przyhamowanie trendu. Spożycie wzrosło tylko o niecałe pół litra, ale potem w kolejnych latach wzrastało średnio o 6,19 litra. Opisywany model tak dobrze pasuje do danych empirycznych, że obydwa wykresy niemal się pokrywają. Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 89

10 Piwo Model TŁ Trudno uwierzyć, że dobroć dopasowania można jeszcze poprawić. Otóż możemy wykorzystać ujemną autokorelację składnika resztowego (jest to autokorelacja rzędu pierwszego) i oszacować następujący model: Model ten nie zawiera wyrazu wolnego, gdyż model wyjściowy był szacowany metodą najmniejszych kwadratów, co zapewnia, że średnia reszt jest równa zeru. W arkuszu danych trzeba wyliczyć wartości teoretyczne modelu trendu z interwencjami, następnie reszty oraz utworzyć kolumnę z resztami opóźnionymi o jeden rok. Przy szacowaniu tego modelu trzeba pamiętać o wybraniu opcji braku wyrazu wolnego. Otrzymujemy następujący wynik 90 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

11 Równanie autoregresji reszt ma więc postać Po dodaniu wartości teoretycznych powyższego modelu do trendu segmentowego otrzymujemy model ostateczny. Jego średni błąd dopasowania wynosi 0,48 litra, czyli tylko nieco mniej niż standardowa puszka. Na koniec porównajmy prognozy trendu liniowego z prognozami trendu segmentowego z uwzględnieniem autokorelacji reszt. Rok Prognoza z trendu liniowego Prognoza z trendu segmentowego ,7 99, ,0 105, ,2 112,0 Różnice w prognozach odzwierciedlają różne koncepcje leżące u podstaw obu modeli. W modelu trendu liniowego najważniejsza jest tendencja długookresowa, jej pewien średni efekt będący wypadkową trendów krótkookresowych i nagłych zahamowań. Drugi model próbuje te składowe opisać. W jego prognozie tkwi założenie, że utrzyma się trend zaobserwowany po 2004 roku. Niewątpliwie ciekawe byłoby też poszukiwanie przyczyn dwóch punktów zwrotnych, w latach 2001 i Tu ewentualnej odpowiedzi mogą udzielić tylko specjaliści z branży znający uwarunkowania i historię rynku piwa w Polsce. Przykład 2 Ten przykład to szereg czasowy danych dziennych. Jest to liczba wejść na stronę pewnego serwisu randkowego. Dane obejmują okres od 14 marca do 10 sierpnia 2005 roku. Najpierw odcinamy dane sierpniowe jako zbiór testowy. Okres uczący daje następujący wykres szeregu czasowego. Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 91

12 Liczba logowań Na wykresie zwracają uwagę przede wszystkim wyraźne wahanie okresowe jak łatwo zauważyć o okresie 7, czyli tygodniowe. Jeżeli chodzi o trend, to można by próbować podobnie jak w poprzednim przykładzie dopasować trend składający się z trzech segmentów liniowych. Pierwszy podokres do 56 wartości (8 maja), drugi do obserwacji 98 (19 czerwca) i trzeci potem. Jednak zastosujemy tu inne podejście, dopasowując trend paraboliczny. Jest on istotny statystycznie, ale ma niewielkie znaczenie w szeregu. Ten trend jest odpowiedzialny tylko za około 8 i pół procenta obserwowanej zmienności. To niewielkie znaczenie trendu w pewnym sensie usprawiedliwia policzenie funkcji autokorelacji na danych oryginalnych, bez eliminowania trendu. Większość zaawansowanych metod analizy szeregów czasowych znajduje się w części Szeregi czasowe i prognozowane (można ją znaleźć w Zaawansowanych modelach liniowych i nieliniowych). 92 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

13 Po zdefiniowaniu analizowanej zmiennej i naciśnięciu klawisza OK odnajdujemy kartę z Autokorelacją. Funkcja autokorelacji Liczba logowań: =v2-v4 (Błędy standardowe to oceny białego szumu) Opóźn Kor. S.E Q p 1 +,639, ,01, ,015, ,04, ,463, ,90 0, ,476, ,8 0, ,040, ,0 0, ,571, ,0 0, ,848, ,9 0, ,524, ,9 0, ,096, ,2 0, ,527, ,5 0, ,531, ,7 0, ,118, ,9 0, ,472, ,4 0, ,741, ,5 0, ,423, ,9 0, ,0-0,5 0,0 0,5 1,0 Funkcja autokorelacji potwierdza występowanie cyklu tygodniowego. Jeżeli w procesie jest istotny cykl o stałym okresie, wówczas taki sam cykl obserwujemy w funkcji autokorelacji stąd duży współczynnik korelacji dla opóźnienia 14. Relatywnie duży współczynnik autokorelacji dla opóźnienia 1 to pokłosie niewyeliminowanego trendu. Dobrą ilustracją struktury cyklu tygodniowego jest rysunek średnich z przedziałami ufności. Z menu Wykresy wybieramy Wykresy średnia i błędy. Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 93

14 Liczba logowań Średnia Średnia±0,95 Przedz. ufn Dzień tyg Widać, że internauci najintensywniej poszukują potencjalnego kandydata/kandydatki na randkę od środy do piątku. Sobota to raczej dni realizacji tych randek, a poniedziałek to zdecydowanie dzień odpoczynku po weekendzie. Podejmiemy teraz próbę budowy trzech modeli prognostycznych. 94 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

15 Model ze zmiennymi zerojedynkowymi Z poprzedniej analizy wiemy, że w analizowanym szeregu występuje trend paraboliczny oraz cykl tygodniowy. Cykl ten opiszemy przy pomocy zmiennych zerojedynkowych. Ponieważ najmniej logowań było w poniedziałek, dlatego ten dzień przyjmiemy jako punkt odniesienia. Sześć zmiennych zerojedynkowych odpowiada następnym dniom tygodnia. Wydaje się rozsądnym przypuszczenie, że w dni świąteczne przypadające w środku tygodnia oraz w Wielkim Tygodniu ten bardzo wyrazisty i gładki model cyklu tygodniowego może ulegać zakłóceniu. Dlatego wprowadzamy zmienne zerojedynkowe oznaczające takie dni. W module Regresja wieloraka szacujemy model liniowy zawierający te wszystkie zmienne zerojedynkowe, zmienną czasową oraz jej kwadrat. W modelu wstępnym tylko 1 maja wydaje się obniżać zwyczajową liczbę logowań przypadających w typową niedzielę (w 2005 roku 1 maja przypadał w niedzielę). Stosując zasady regresji krokowej, dochodzimy do następującego modelu ostatecznego (zob. rys. poniżej). Po wyeliminowaniu zmiennych nieistotnych znaczenie 1 maja spadło. Nie udało się więc udowodnić, jakoby specjalne dni wywierały istotny wpływ na zakłócenie cyklu tygodniowego. W naszym modelu zostawimy jednak zmienną 1 maja, ponieważ bardzo niewiele brakuje jej do istotności statystycznej na poziomie 0,05 (p=0,0543). Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 95

16 Wyrównywanie wykładnicze Podstawową metodę wyrównywania wykładniczego zapisuje się przy pomocy równania: y P t 1 y 1 t P y gdzie: jest prognozą szeregu na okres t, - stałą wygładzania z przedziału (0,1). Przedstawione równanie pokazuje, że aby wyznaczyć prognozę na kolejny okres, należy wziąć kombinację liniową ostatniej obserwacji oraz poprzedniej prognozy. W programie STATISTICA uwzględniono również bardziej skomplikowane modele uwzględniające trend i wahania okresowe. t 96 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

17 Wybór odpowiedniego modelu oznaczamy kropką i wybieramy Automatyczne poszukiwanie. Pokazujące się wyniki wyrównywania wykładniczego są bardzo rozbudowane. Szereg wygładzony dobrze pasuje do danych empirycznych. Średni absolutny błąd procentowy wynosi 4,4%. Model ARIMA Metodologia budowy modeli ARIMA została spopularyzowana przez Boxa i Jenkinsa w ich książce Time series analysis: Forecasting and control wydanej w 1970 roku (tłumaczenie w języku polskim ukazało się w 1983 roku: Analiza szeregów czasowych. Prognozowanie i sterowanie). W najbardziej ogólnym opisie: analizowany szereg należy najpierw sprowadzić do stacjonarności pod względem wartości przeciętnej i wariancji. W odniesieniu do wartości przeciętnej to doprowadzenie do stacjonarności uzyskuje się poprzez wyeliminowanie ewentualnego trendu na drodze różnicowania niesezonowego (jego krotność jest równa stopniowi trendu) oraz wahań okresowych poprzez dwukrotne różnicowanie sezonowe z opóźnieniem równym długości okresu. Po tych transformacjach staramy się opisać wartości szeregu w zależności od swoich poprzednich wartości (część autoregresyjna) oraz w zależności od historii błędów (część średniej ruchomej). W analizowanym przykładzie wybieramy dwukrotne różnicowanie niesezonowe oraz różnicowanie sezonowe (jednokrotne) z okresem 7. Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 97

18 Na wstępie koncentrujemy się na niesezonowej części modelu. Poprzez kolejne podwyższanie rzędu autokorelacji i średniej ruchomej znajdujemy najbardziej skomplikowany model ARIMA (0,2,1). Funkcja autokorelacji reszt wskazuje, że komponenta okresowa nie została skutecznie wyeliminowana i trzeba podjąć próbę jej opisania modelem, który ma aktywną część sezonową (stąd niekiedy używana nazwa SARIMA). Funkcja autokorelacji Liczba logowań: ARIMA (0,2,1)(0,2,0) reszty ; (Błędy standardowe to oceny białego szumu) Opóźn Kor. S.E Q p 1 -,168,0891 3,54, ,167,0887 7,09, ,246, ,83, ,203, ,14, ,216, ,20, ,183, ,60, ,681, ,01, ,153, ,14, ,198, ,4, ,129, ,7, ,233, ,1, ,136, ,7, ,059, ,2, ,353, ,7 0, ,064, ,3 0, ,0-0,5 0,0 0,5 1,0 98 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

19 Znów poprzez stopniowe zwiększanie rzędu parametrów sezonowych znajdujemy optymalny model ARIMA(0,2,1)(1,2,1). Teraz funkcja autokorelacji reszt jest zadowalająca. Funkcja autokorelacji Liczba logowań: ARIMA (0,2,1)(1,2,1) reszty ; (Błędy standardowe to oceny białego szumu) Opóźn Kor. S.E Q p 1 -,182,0891 4,16, ,110,0887 5,71, ,150,0883 8,58, ,003,0880 8,58, ,044,0876 8,83, ,126, ,93, ,038, ,12, ,036, ,30, ,067, ,89, ,034, ,05, ,166, ,83, ,069, ,48, ,108, ,11, ,048, ,43, ,051, ,80, ,0-0,5 0,0 0,5 1,0 Sprawdzamy jeszcze rozkład reszt. Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 99

20 35 Histogram; zmienna: Liczba logowań ARIMA (0,2,1)(1,2,1) reszty ; Oczekiwana normalna Liczba ob Górna granica (x<=granica) Teoretyczna krzywa normalna nieźle pasuje do rozkładu empirycznego. Teraz możemy wreszcie przystąpić do prognozowania. Na karcie Więcej określamy horyzont prognozy. Model dość zaskakująco przewiduje spadek liczby logowań w okresie prognozowanym. 100 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

21 Prognoza; Model: (0,2,1)(1,2,1) Opóź. sezon.: 7 Dane: Liczba logowań Obserw. Prognozuj Na zakończenie przykładu porównamy, jak spisują się trzy modele prognostyczne w okresie testowym. Na poniższym wykresie porównano prognozy z danymi rzeczywistymi Dane rzeczywiste Model 0/1 Wyrównywanie wykładnicze ARIMA Prognozy modelu ARIMA są praktycznie do odrzucenia. Dobre prognozy dał tylko dla pierwszych trzech dni. W drugim prognozowanym tygodniu błąd już rośnie bardzo wyraźnie. Z oglądu rysunku najlepiej wygląda prognoza przygotowana z wykorzystaniem modelu wyrównywania wykładniczego. To spostrzeżenie potwierdzają wartości średniego absolutnego błędu procentowego (MAPE) wyliczonego dla okresu prognozowanego. Dla modelu ze zmiennymi zerojedynkowymi wyniósł on 3,79%, a dla modelu wyrównywania wykładniczego 2,96%. Copyright StatSoft Polska 2010, info@danewiedzasukces.pl 101

22 Metody przedstawione w obydwu przykładach nie są oczywiście jedynymi metodami analizy szeregów czasowych dostępnymi w środowisku STATISTICA. Program STATISTICA Data Miner oferuje szereg nowoczesnych metod możliwych do zastosowania przy analizie i prognozowaniu długich szeregów czasowych. Są to na przykład sieci neuronowe, metoda MARS, czy metoda SVM. Ponadto nawet te relatywnie proste metody można zautomatyzować, tworząc odpowiedni projekt w programie STATISTICA Data Miner. Takie rozwiązanie jest bezcenne, gdy prognozy mają być aktualizowane na bieżąco wraz z napływaniem nowych danych. Struktura modeli prognostycznych pozostaje taka sama, natomiast parametry modeli są aktualizowane na bieżąco. Oczywiście sama struktura modeli też niekiedy wymaga aktualizacji, ale ewentualną konieczność takiej aktualizacji można stwierdzić poprzez analizowanie długich ciągów błędów prognoz ex post. 102 Copyright StatSoft Polska 2010, info@danewiedzasukces.pl

PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU

PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU prof. dr hab. Andrzej Sokołowski 2 W tym opracowaniu przedstawiony zostanie przebieg procesu poszukiwania modelu prognostycznego wykorzystującego jedynie przeszłe

Bardziej szczegółowo

4. Średnia i autoregresja zmiennej prognozowanej

4. Średnia i autoregresja zmiennej prognozowanej 4. Średnia i autoregresja zmiennej prognozowanej 1. Średnia w próbie uczącej Własności: y = y = 1 N y = y t = 1, 2, T s = s = 1 N 1 y y R = 0 v = s 1 +, 2. Przykład. Miesięczna sprzedaż żelazek (szt.)

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

5. Model sezonowości i autoregresji zmiennej prognozowanej

5. Model sezonowości i autoregresji zmiennej prognozowanej 5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =

Bardziej szczegółowo

3. Analiza własności szeregu czasowego i wybór typu modelu

3. Analiza własności szeregu czasowego i wybór typu modelu 3. Analiza własności szeregu czasowego i wybór typu modelu 1. Metody analizy własności szeregu czasowego obserwacji 1.1. Analiza wykresu szeregu czasowego 1.2. Analiza statystyk opisowych zmiennej prognozowanej

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

7.4 Automatyczne stawianie prognoz

7.4 Automatyczne stawianie prognoz szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Dopasowywanie modelu do danych

Dopasowywanie modelu do danych Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;

Bardziej szczegółowo

Analiza autokorelacji

Analiza autokorelacji Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.

Bardziej szczegółowo

Przykład 2. Stopa bezrobocia

Przykład 2. Stopa bezrobocia Przykład 2 Stopa bezrobocia Stopa bezrobocia. Komentarz: model ekonometryczny stopy bezrobocia w Polsce jest modelem nieliniowym autoregresyjnym. Podobnie jak model podaŝy pieniądza zbudowany został w

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Jak sprawdzić normalność rozkładu w teście dla prób zależnych? Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny Analiza sezonowości Wiele zjawisk charakteryzuje się nie tylko trendem i wahaniami przypadkowymi, lecz także pewną sezonowością. Występowanie wahań sezonowych może mieć charakter kwartalny, miesięczny,

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Regresja linearyzowalna

Regresja linearyzowalna 1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018 Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018 Nr indeksu... Imię i Nazwisko... Nr grupy ćwiczeniowej... Imię i Nazwisko prowadzącego... 1. Specyfikacja modelu

Bardziej szczegółowo

Co to jest analiza regresji?

Co to jest analiza regresji? Co to jest analiza regresji? Celem analizy regresji jest badanie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą), która musi mieć charakter liczbowy. W

Bardziej szczegółowo

Ekonometria. Zajęcia

Ekonometria. Zajęcia Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)

Bardziej szczegółowo

Metody Ilościowe w Socjologii

Metody Ilościowe w Socjologii Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych

Bardziej szczegółowo

Ćwiczenia IV

Ćwiczenia IV Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie

Bardziej szczegółowo

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015 Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015 Nr indeksu... Imię i Nazwisko... Nr grupy ćwiczeniowej... Imię i Nazwisko prowadzącego... 1. Specyfikacja modelu

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Prognozowanie liczby pacjentów poradni ortopedycznej

Prognozowanie liczby pacjentów poradni ortopedycznej Zeszyty Naukowe Metody analizy danych Uniwersytet Ekonomiczny w Krakowie 876 Kraków 2011 Studia Doktoranckie Wydziału Zarządzania Prognozowanie liczby pacjentów poradni ortopedycznej 1. Wprowadzenie W

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa

Bardziej szczegółowo

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA Zadanie 1 (Plik danych: Transport w Polsce (1990-2015)) Na

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31 Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE ZADANIE 1 Oszacowano zależność między luką popytowa a stopą inflacji dla gospodarki niemieckiej. Wyniki estymacji są następujące: Estymacja KMNK,

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ Korelacja oznacza fakt współzależności zmiennych, czyli istnienie powiązania pomiędzy nimi. Siłę i kierunek powiązania określa się za pomocą współczynnika korelacji

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność

Bardziej szczegółowo

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna

Bardziej szczegółowo

Wykład 4: Statystyki opisowe (część 1)

Wykład 4: Statystyki opisowe (część 1) Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można

Bardziej szczegółowo

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania

Bardziej szczegółowo

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Jednym z elementów walidacji metod pomiarowych jest sprawdzenie liniowości

Bardziej szczegółowo

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34 Statystyka Wykład 9 Magdalena Alama-Bućko 24 kwietnia 2017 Magdalena Alama-Bućko Statystyka 24 kwietnia 2017 1 / 34 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006 Modele dynamiczne Paweł Cibis pcibis@o2.pl 27 kwietnia 2006 1 Wyodrębnianie tendencji rozwojowej 2 Etap I Wyodrębnienie tendencji rozwojowej Etap II Uwolnienie wyrazów szeregu empirycznego od trendu Etap

Bardziej szczegółowo

Wprowadzenie do teorii prognozowania

Wprowadzenie do teorii prognozowania Wprowadzenie do teorii prognozowania I Pojęcia: 1. Prognoza i zmienna prognozowana (przedmiot prognozy). Prognoza punktowa i przedziałowa. 2. Okres prognozy i horyzont prognozy. Prognozy krótkoterminowe

Bardziej szczegółowo

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13 Stanisław Cichocki Natalia Neherbecka Zajęcia 13 1 1. Kryteria informacyjne 2. Testowanie autokorelacji 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Metody Prognozowania

Metody Prognozowania Wprowadzenie Ewa Bielińska 3 października 2007 Plan 1 Wprowadzenie Czym jest prognozowanie Historia 2 Ciągi czasowe Postępowanie prognostyczne i prognozowanie Predykcja długo- i krótko-terminowa Rodzaje

Bardziej szczegółowo

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska D syst D śr m 1 3 5 2 4 6 śr j D 1

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Estymacja parametrów w modelu normalnym

Estymacja parametrów w modelu normalnym Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Analiza współzależności zjawisk

Analiza współzależności zjawisk Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.

Bardziej szczegółowo

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007 Weryfikacja modelu Paweł Cibis pawel@cibis.pl 12 maja 2007 1 Badanie normalności rozkładu elementu losowego Test Hellwiga dla małej próby Test Kołmogorowa dla dużej próby 2 Testy Pakiet Analiza Danych

Bardziej szczegółowo

Analiza zależności liniowych

Analiza zależności liniowych Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala

Bardziej szczegółowo

Regresja i Korelacja

Regresja i Korelacja Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane

Bardziej szczegółowo

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30 Statystyka Wykład 13 Magdalena Alama-Bućko 12 czerwca 2017 Magdalena Alama-Bućko Statystyka 12 czerwca 2017 1 / 30 Co wpływa na zmiany wartości danej cechy w czasie? W najbardziej ogólnym przypadku, na

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE

Bardziej szczegółowo

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND Finanse i Rachunkowość rok 2 Analiza dynamiki Szereg czasowy: y 1 y 2... y n 1 y n. y t poziom (wartość) badanego zjawiska w

Bardziej szczegółowo

Analiza współzależności dwóch cech I

Analiza współzależności dwóch cech I Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych

Bardziej szczegółowo

Grupowanie materiału statystycznego

Grupowanie materiału statystycznego Grupowanie materiału statystycznego Materiał liczbowy, otrzymany w wyniku przeprowadzonej obserwacji statystycznej lub pomiaru, należy odpowiednio usystematyzować i pogrupować. Doskonale nadają się do

Bardziej szczegółowo

POLITECHNIKA OPOLSKA

POLITECHNIKA OPOLSKA POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych

Bardziej szczegółowo

Arkadiusz Manikowski Zbigniew Tarapata. Prognozowanie i symulacja rozwoju przedsiębiorstw

Arkadiusz Manikowski Zbigniew Tarapata. Prognozowanie i symulacja rozwoju przedsiębiorstw Arkadiusz Manikowski Zbigniew Tarapata Prognozowanie i symulacja rozwoju przedsiębiorstw Warszawa 2002 Recenzenci doc. dr. inż. Ryszard Mizera skład i Łamanie mgr. inż Ignacy Nyka PROJEKT OKŁADKI GrafComp,

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY

PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY Joanna Chrabołowska Joanicjusz Nazarko PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY NA PRZYKŁADZIE PRZEDSIĘBIORSTWA HANDLOWEGO TYPU CASH & CARRY Wprowadzenie Wśród wielu prognoz szczególną rolę w zarządzaniu

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

Ćwiczenie 5 PROGNOZOWANIE

Ćwiczenie 5 PROGNOZOWANIE Ćwiczenie 5 PROGNOZOWANIE Prognozowanie jest procesem przewidywania przyszłych zdarzeń. Obszary zastosowań prognozowania obejmują np. analizę danych giełdowych, przewidywanie zapotrzebowania na pracowników,

Bardziej szczegółowo

Wykład 5: Analiza dynamiki szeregów czasowych

Wykład 5: Analiza dynamiki szeregów czasowych Wykład 5: Analiza dynamiki szeregów czasowych ... poczynając od XIV wieku zegar czynił nas najpierw stróżów czasu, następnie ciułaczy czasu, i wreszcie obecnie - niewolników czasu. W trakcie tego procesu

Bardziej szczegółowo

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007 Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

Wprowadzenie do analizy dyskryminacyjnej

Wprowadzenie do analizy dyskryminacyjnej Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela

Bardziej szczegółowo

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada Stanisław Cichocki Natalia Nehrebecka Katarzyna Rosiak-Lada 1. Sprawy organizacyjne Zasady zaliczenia 2. Czym zajmuje się ekonometria? 3. Formy danych statystycznych 4. Model ekonometryczny 2 1. Sprawy

Bardziej szczegółowo

ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO

ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO Wprowadzenie Zmienność koniunktury gospodarczej jest kształtowana przez wiele różnych czynników ekonomicznych i pozaekonomicznych. Znajomość zmienności poszczególnych

Bardziej szczegółowo