Dopasowywanie modelu do danych

Podobne dokumenty
Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Co to jest analiza regresji?

Indeksy dynamiki (o stałej i zmiennej podstawie)

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA

3. Modele tendencji czasowej w prognozowaniu

Wykład 4: Statystyki opisowe (część 1)

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

TP1 - TABELE PRZESTAWNE od A do Z

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Regresja linearyzowalna

5. Model sezonowości i autoregresji zmiennej prognozowanej

Rozdział 8. Regresja. Definiowanie modelu

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Wykład 5: Analiza dynamiki szeregów czasowych

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

B3.5 Koncentracja. Raport pochodzi z portalu

Wykład 6: Analiza danych czasowych Wykresy, indeksy dynamiki

2) R stosuje w obliczeniach wzór na logarytm potęgi oraz wzór na zamianę podstawy logarytmu.

Aproksymacja funkcji a regresja symboliczna

ECDL zaawansowany, moduł EXCEL

7.4 Automatyczne stawianie prognoz

Wprowadzenie do analizy korelacji i regresji

KORELACJE I REGRESJA LINIOWA

Przykład wykorzystania Arkusza Kalkulacyjnego Excel

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:


Ćwiczenie 5 PROGNOZOWANIE

Wymagania edukacyjne z matematyki

Wykład 2: Arkusz danych w programie STATISTICA

Temat (rozumiany jako lekcja) Propozycje środków dydaktycznych. Liczba godzin. Uwagi

Wykład 5: Statystyki opisowe (część 2)

Technikum Nr 2 im. gen. Mieczysława Smorawińskiego w Zespole Szkół Ekonomicznych w Kaliszu

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Klasa 1 technikum. Poniżej przedstawiony został podział wymagań na poszczególne oceny szkolne:

SCENARIUSZ LEKCJI. Autorzy scenariusza: Krzysztof Sauter (informatyka), Marzena Wierzchowska (matematyka)

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS

Analiza regresji - weryfikacja założeń

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Ekonometria. Regresja liniowa, dobór postaci analitycznej, transformacja liniowa. Paweł Cibis 24 marca 2007

ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL. sin x2 (1)

Program szkolenia EXCEL OD PODSTAW POPOŁUDNIOWY (WIECZOROWY)

Wymagania edukacyjne matematyka klasa 1 zakres podstawowy 1. LICZBY RZECZYWISTE

PROGRAM SZKOLENIA. Excel w Analizach danych.

Zagadnienia do małej matury z matematyki klasa II Poziom podstawowy i rozszerzony

MATeMAtyka 1. Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych. Zakres podstawowy i rozszerzony Klasa pierwsza

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

ARKUSZ KALKULACYJNY komórka

Instrukcja użytkownika programu

PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU

Analiza metod prognozowania kursów akcji

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

PROGRAM SZKOLENIA. Excel Średniozaawansowany z wprowadzeniem do tabel przestawnych i makr.

WYMAGANIA EDUKACYJNE Z MATEMATYKI dla klasy I ba Rok szk. 2012/2013

Ćwiczenie 2 arkusze kalkulacyjne użycie funkcji logicznych

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Analiza szeregów czasowych

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Przy dokonywaniu analiz ekonomicznych, np. sprzedażowych, bardzo

ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.

Program szkolenia EXCEL ŚREDNIOZAAWANSOWANY.

1. Sporządzić tabele z wynikami pomiarów oraz wyznaczonymi błędami pomiarów dotyczących przetwornika napięcia zgodnie z poniższym przykładem

Zaokrąglanie liczb Adresowanie względne i bezwzględne Automatyczne podejmowanie decyzji Porządkowanie tabeli danych

SCENARIUSZ LEKCJI. Wielomiany komputerowe wykresy funkcji wielomianowych

Program szkolenia EXCEL W ANALIZACH DANYCH.

WYMAGANIA EDUKACYJNE - matematyka - poziom rozszerzony Dariusz Drabczyk

Ćwiczenia IV

Program szkolenia EXCEL ZAAWANSOWANY Z WPROWADZENIEM DO VBA.

Wprowadzenie do teorii prognozowania

Prognozowanie cen surowców w rolnych na podstawie szeregów w czasowych - uwarunkowania i metody. Sylwia Grudkowska NBP Mariusz Hamulczuk IERIGś-PIB

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Przenoszenie, kopiowanie formuł

Imię, nazwisko i tytuł/stopień KOORDYNATORA przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, dr

Program szkoleniowy. 16 h dydaktycznych (12 h zegarowych) NAZWA SZCZEGÓŁY CZAS. Skróty dostępu do narzędzi

MATEMATYKA WYKAZ UMIEJĘTNOŚCI WYMAGANYCH NA POSZCZEGÓLNE OCENY DLA KLASY PIERWSZEJ

WYMAGANIA EDUKACYJNE KLASA I Pogrubieniem oznaczono wymagania, które wykraczają poza podstawę programową dla zakresu podstawowego.

WYMAGANIE EDUKACYJNE Z MATEMATYKI W KLASIE II GIMNAZJUM. dopuszczającą dostateczną dobrą bardzo dobrą celującą

Obliczenia inżynierskie arkusz kalkulacyjny. Technologie informacyjne

PROGRAM SZKOLENIA. Excel w logistyce.

Funkcje IV. Wymagania egzaminacyjne:

Jak korzystać z Excela?

SPIS TREŚCI WSTĘP LICZBY RZECZYWISTE 2. WYRAŻENIA ALGEBRAICZNE 3. RÓWNANIA I NIERÓWNOŚCI

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Zad.2. Korelacja - szukanie zależności.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

MATeMAtyka cz.1. Zakres podstawowy

Uczelnia Łazarskiego. Sylabus. 1. Nazwa przedmiotu EKONOMETRIA 2. Kod przedmiotu

W pustym arkuszu utwórz automatycznie tabliczkę mnożenia w zakresie od 1*1 do 25*25.

Analiza Współzależności

52 NAJLEPSZE TRIKI W EXCELU, CZYLI JAK SZYBCIEJ WYKONAĆ OBLICZENIA

Transkrypt:

Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA; wyznaczanie prognoz w arkuszu danych programu; propozycja prezentacji graficznych; dodatkowe własności narzędzia Dopasowanie w programie STATISTICA.

Dopasowywanie modelu do danych Intuicyjnie, stwierdzenie dopasować model do danych jest oczywiste. Chodzi o narysowanie pewnej funkcji (na przykład liniowej), tak aby pasowała ona do pewnego zbioru punktów. Ale takie podejście jest zbyt intuicyjne, bowiem wyników byłoby zapewne tyle, ilu badaczy danego zjawiska. Dlatego też należy ściśle określić pojęcie dopasowania funkcji do danych i bazować na pewnych algorytmach, które takie dopasowanie realizują. W modelowaniu największą popularność zdobyła metoda najmniejszych kwadratów (MNK), które polega na znalezieniu takiej postaci funkcji, aby kwadraty różnic pomiędzy wartościami rzeczywistymi i dopasowanymi były jak najmniejsze. Nie jest to jednak jedyny algorytm w przypadku metody wyrównywania wykładniczego minimalizacji będzie najczęściej podlegała błąd procentowy zaś narzędzia dostępne w module Estymacji nieliniowej pozwalają użytkownikowi określić dowolnie sposób mierzenia różnicy pomiędzy danymi rzeczywistymi a ich modelem.

Podstawowe rodzaje modeli trendów Bez wątpienia najczęściej stosowanym rodzaj modelu szeregów czasowych jest trend liniowy: Y t = b 0 + b 1 t W modelu trendu liniowego zakłada się stałość różnic pomiędzy kolejnymi obserwowanymi wartościami (a więc stały trend spadkowy bądź rosnący). Model w postaci funkcji kwadratowej pozwala na prognozowanie zjawisk, które charakteryzują się zmiennymi przyrostami kolejnych obserwowanych wartości, przy czym przyrosty te rosną bądź spadają liniowo: Y t = b 0 + b 1 t + b 2 t 2 Funkcja wykładnicza może dobrze oddawać przebieg zjawiska charakteryzującego się stałymi zmianami względnymi (a więc zmianą procentową): Y t = b 0 b 1 t

Dopasowanie trendu liniowego Najprostszym sposobem dopasowania modelu liniowego do danych jest zastosowanie narzędzi graficznych programu STATISTICA np. wykresu liniowego. W zakładce więcej wskazujemy rodzaj dopasowywanej funkcji i uzyskujemy zarówno graficzną prezentację jej przebiegu, jak i wzór modelu. Poniżej zaprezentowano liczbę zarejestrowanych w Polsce samochodów z dopasowanym modelem trendu liniowego.

Konstrukcja prognozy za pomocą formuł arkusza danych Aby skonstruować prognozę, wykorzystamy wzór znajdujący się w nagłówku wykresu liniowego. W arkuszu danych dodajemy kolumnę zawierającą numery okresów czasowych (X) i wypełniamy ją kolejnymi wartościami oraz zmienną Prognoza liniowa liczby samochodów, której wartości wyliczamy za pomocą formuły. Następnie dodajemy tyle przypadków, ile wynosi horyzont czasowy prognozy (przypadki warto przy tym nazwać kolejnymi latami, datami, miesiącami, etc.). Jeżeli z jakichś powodów wyliczenie formuły nie powiodło się (w programie STATISTICA można je wyłączyć) należy wznowić automatyczne przeliczanie formuł za pomocą klawisza F9.

Propozycja wizualizacji danych i prognozy Jeżeli w arkuszu mamy kolumny z oryginalnymi danymi oraz prognozowanymi wartościami, to poprzez zastosowanie wykresu liniowego w postaci wielokrotnej możemy zobrazować przebieg analizowanego szeregu i prognozę. Oto dwie propozycje takiego wykresu.

Model kwadratowy Aby zastosować model kwadratowy w zakładce więcej wybieramy dopasowanie w postaci wielomianu. Domyślnie jest on stopnia drugiego, natomiast można skomplikować postać funkcji aż do postaci wielomianu piątego stopnia. Na poniższym wykresie przedstawiono przebieg modelu kwadratowego dla danych dotyczących przewozu pasażerów koleją w latach 1990-2012. Aby zmienić dokładność wyświetlania współczynników we wzorze należy w zakładce Dopasowanie ustawić odpowiednio ich format. Dla estetyki warto zmniejszyć dokładność wyświetlania, ale w przypadku złożonych wzorów większa liczba miejsc po przecinku do dokładniejsze wyniki prognoz.

Prognoza za pomocą modelu kwadratowego Na poniższym wykresie zaprezentowano prognozę wykonaną za pomocą modelu kwadratowego dla liczby pasażerów przewiezionych kolejami na lata 2013-2016.

Model wykładniczy W analogiczny sposób można do danych dopasować model wykładniczy, który jak to przypomniano wcześniej, jest formułą, w której zakłada się stałe tempo wzrostu (spadku) względnego badanej wielkości. Sposób zapisu równania modelu wykładniczego nie jest może zbyt szczęśliwy, dlatego do interpretacji zalecamy podniesienie liczby e do odpowiedniej potęgi (można to uczynić za pomocą formuły Excela lub funkcji Exp kalkulatora. Powyższy wzór przybierze wtedy postać: Y = 5372,7 * 1,057 x Oznacza to, że z każdym rokiem, liczba samochodów przyrastała średnio o 5,7%. Prognoza wykonana za pomocą modelu wykładniczego zakłada, że to stałe tempo zmian procentowych będzie zachowane.

Modele oparte na części danych Nie zawsze wszystkie obserwacje danego zjawiska w czasie są istotne dla wychwycenia trendu i sporządzenia prognozy. Można pominąć dane odległe w czasie, czasem z uzasadnionych powodów można pominąć pewne obserwacje odstające. Oczywiście można dokonać takiego ucięcia modelowanych danych za pomocą odpowiednio skonstruowanego warunku selekcji, jednak istnieją też inne, bardziej intuicyjne sposoby. Poniżej przedstawiono dwie takie propozycje: wykorzystanie możliwości dopasowania modelu do pewnego przedziału (opcje narzędzia dopasowanie); interaktywną eksplorację wykresu za pomocą narzędzia wyróżniania.

Zmienianie zakresu danych za pomocą narzędzie dopasowanie Po sporządzeniu wykresu liniowego (i nie tylko) istnieje możliwość modyfikacji postaci sposobu dopasowania modelu do danych. W szczególności można ustalić zakres danych (numery przypadków od do ), który będzie uwzględniany podczas wyznaczania modelu. Można także do istniejącego już wykresu dodawać nowe modele, co umożliwia ich bezpośrednie porównanie.

Prognoza liczby autobusów przy wykorzystaniu części szeregu czasowego Zauważono, że począwszy od 2005 roku, liczba autobusów zmienia się liniowo. Postanowiono skonstruować prognozę, wykorzystując obserwacje z tego okresu.

Eliminowanie obserwacji odstających Wykorzystując narzędzie wyróżniania możemy usunąć interaktywnie z analizy dowolne obserwacje. Oczywiście, muszą za tym iść odpowiednie przesłanki merytoryczne, gdyż usuwając kolejne nie pasujące do modelu obserwacje, doprowadzilibyśmy do tego, że do każdych danych pasowałby w końcu model liniowy (czy innego dowolnego typu).

Podsumowanie 1) Na podstawie wartości obserwowanych i modelowanych znajdujących się w arkuszu po wyliczeniu prognoz można obliczyć reszty modelu i różne rodzaje miar błędów ex post. Należy tu zastosować odpowiednie formuły arkusza danych, analogicznie do tego, co było omawiane na wykładzie nr 3. 2) Aby wyznaczyć prognozy dla modeli wykorzystujących dane ucięte i pominięte za pomocą metod tabelarycznych (na przykład tych, które będą omawiane na kolejnym wykładzie) należy w arkuszu danych w pomocniczej kolumnie X pominąć odpowiednie wartości.

Inne funkcje W programie STATISTICA można znacznie rozszerzyć klasę funkcji, spośród których poszukuje się modelu szeregów czasowych. Dowolną, ogólną postać funkcji można podać w modele Estymacja nieliniowa i w zupełnie podobny sposób jak to było w przypadku pracy z wykresami, wykorzystać znaleziony wzór do sporządzenia prognozy. Opis wykorzystania modułu Estymacja nieliniowa do prognozowania będzie tematem jednego z kolejnych wykładów.