istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

Wielkość: px
Rozpocząć pokaz od strony:

Download "istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy"

Transkrypt

1 MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze odzwierciedla tę zależność. Takiego badania dokonujemy na podstawie przeprowadzenia doświadczeń i analizy ich wyników. Przykłady: zależność wydajności ziemi od różnych nawozów mineralnych; zależność poziomu zysku banku od liczby klientów, wysokości inwestycji, wielkości wydanych kredytów itd. Warto zaznaczyć, że słowo regresja w tłumaczeniu z łaciny oznacza cofanie. Stosowanie w nazwie tej dziedziny słowa regresja jest historyczne i raczej niefortunne. Nazwa ta została, prawdopodobnie, po raz pierwszy użyta w 1885 r. przez angielskiego naukowca Sir F. Galtona (ucznia K. Darwina) pod czas badania zależności wzrostu potomstwa od wzrostu rodziców. Wykazał on bowiem, że niezwykle wysocy rodzice (znacznie wyżsi od przeciętności), mają dzieci niższego wzrostu, natomiast rodzice o wzroście znacznie niższym, niż przeciętny, mają dzieci wyższe od nich. Galton nazwał to zjawisko cofaniem w kierunku przeciętności. Ale w 1

2 istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy francuscy (szczególnie P.-S. Laplace) w XVIII wieku przeprowadzały analizy, które nazwalibyśmy regresją. Niech więc interesuje nas zależność zmiennej Y od zmiennych X (1),..., X (m), m 1. Zmienna Y jest nazywana zmienną zależną, zaś zmienne X (1),..., X (m) zmiennymi niezależnymi. Pytanie, na które chcielibyśmy dostać odpowiedź, to: czy ta zależność istnieje, i jeżeli tak, to chcielibyśmy wyrazić ją za pomocą pewnego modelu (równania). Warto zaznaczyć, iż zmienne mogą być powiązane między sobą zależnością funkcyjną lub statystyczną. Związek funkcyjny Y = f(x (1),..., X (m) ) odznacza się tym, że każdemu naboru wartości zmiennych X (1),..., X (m) odpowiada tylko jedna, jednoznacznie określona wartość zmiennej Y (np. pole kwadratu jest funkcją jego boku). Bardzo rzadko jednak mamy do czynienia z danymi, które dokładnie opisują się podobną zależnością. Częściej mamy do czynienia z tzw. zależnością statystyczną. Związek statystyczny polega na tym, że określonemu naboru wartości zmiennych X (1),..., X (m) odpowiadają ściśle określone średnie wartości zmien- 2

3 nej Y. W przypadku zależności statystycznej naturalnie jest zakładać, że wartości zmiennej zależnej są losowe, wartości zaś zmiennych niezależnych są nielosowe. Załóżmy, że możemy przeprowadzić n pomiarów wartości zmiennej Y w zależności od pewnych wartości zmiennych X (1),..., X (m). Wartości powyższych zmiennych, uzyskane w trakcie doświadczeń, będziemy oznaczać odpowiednimi malymi literami. Więc punktem wyjścia w naszych rozumowaniach będą obserwacje (x 1) i,..., x(m) i, y i ), i = 1,..., n. Przykład. Rozpatrzmy rezultaty kolokwium (skala od 0 do 25 punktów) i egzaminu koncowego (skala od 0 do 50 punktów) ze statystyki matematycznej. W kolokwium i egzaminie brało udział 19 studentów pewnej szkoły technicznej. Wyniki kolokwium i egzaminu: Numer stud Kolokwium Egzamin Numer stud Kolokwium Egzamin Zależność pomiędzy wynikiem egzaminu końcowego (zmienna zależna) a kolokwium (zmienna niezależna) przed- 3

4 kolokwium Rysunek 1: Wykres rozrzutu. stawiono na Rysunku 1. Rysunek taki nazywa się wykresem rozrzutu i jest użytecznym graficznym przedstawieniem zależności między zmiennymi. Tworzy się on za pomocą par punktów (x i, y i ), i = 1,..., 19. Zaznaczmy, że w przypadku, gdy mamy do czynienia z jedną zmienną niezależną, zagadnienie konstrukcji modelu należy zawsze zaczynać od sporządzenia wykresu rozrzutu. Widzimy, że istotnie mamy tutaj do czynienia z zależnością statystyczna, a nie funkcyjną, bowiem mamy studentów, których wynik kolokwium jest taki sam, ale wynik egzaminu różni się (np. studenci o numerach 5, 17 i 19 mają ten sam wynik kolokwium - 17 punktów, lecz różny wynik egzaminu - odpowiednio 35, 34 i 40 punktów). Wykres rozrzutu sugeruje istnienie prostej, wokół której koncentrują się obserwacje. 4

5 Ogólnie proces konstrukcji modelu przebiega następujące etapy. Etap 1. Specyfikacja modelu. Dokonujemy wybór typu modelu (liniowy, wielomianowy, nieliniowy itd), który będziemy rozważać. Wyboru tego dokonujemy na podstawie wykresu rozrzutu, bądź jakiejś wiedzy o możliwym charakterze zależności. Możemy też sugerować się poszukiwaniem rozwiązania jak najprostszego. Etap 2. Estymacja modelu. Stosując odpowiednie metody statystyczne i w oparciu o dane, które posiadamy, dokonujemy estymacji parametrów modelu, czyli wyboru takiej funkcji wśród rozważanych, która najlepiej pasuje do danych. Etap 3. Weryfikacja modelu. Sprawdzamy, czy skonstruowany na poprzednim etapie model dobrze pasuje do posiadanych danych oraz czy spełnione są założenia modelu. Jeśli model nie spełnia stawianych mu wymagań, formułujemy nowy model i wracamy do poprzedniego etapu. Etap 4. Używanie modelu. Jeżeli stworzony model uznajemy za poprawny, to możemy wykorzystać go, np. dla prognozowania wartości zmiennej zależnej w przypadku innych, aniżeli uzyskane dotychczas, wartości zmiennych niezależnych, lub do sterowania - czyli wyznaczenia wartości zmiennych niezależnych dla uzyskania od- 5

6 powiedniej wartości zmiennej zależnej. Zgodnie z etapem 1, zawężamy krąg rozważanych funkcji, opisujących zależność, do pewnej parametrycznej klasy funkcji H, tzn. zakładamy, że model opisuje się funkcją z klasy H = {h(x, θ), θ Θ R k, x = (x (1),..., x (m) ) R m }, gdzie h : R m R k R jest zadaną funkcją ciągłą. Funkcja h jest nazywana funkcją regresji. W tej sytuacji problem poszukiwania dobrego modelu opisującego zależność sprowadza się do poszukiwania (szacowania) wektora parametrów θ. Jeśli funkcja h jest liniowa względem θ, to regresja (i odpowiedni model) nazywa się liniową, w przeciwnym przypadku - nieliniową. Ogólna postać funkcji regresji liniowej, to: h(x, θ) = k j=1 θ jf j (x), gdzie f j : R m R są zadanymi funkcjami ciągłymi, j = 1,..., k. Rozważmy najprostszą sytuację, gdy mamy jedną zmienną niezależną, a funkcją regresji jest postaci h(x, θ 0, θ 1 ) = θ 0 + θ 1 x. Przy poszukiwaniu odpowiednich ( najlepszych ) wartości parametrów θ 0, θ 1 zazwyczaj stosujemy tzw. metodę najmniejszych kwadratów (MNK), wprowadzoną jeszcze na początku XIX wieku przez A.-M. Legendre a i C. F. Gaussa. Polega ona na tym, 6

7 5 4 y x Rysunek 2: Metoda najmniejszych kwadratów. że mając obserwacje (x i, y i ), i = 1,..., n, rozwiązujemy następujący problem matematyczny: (y i (θ 0 + θ 1 x i )) 2 min. θ 0,θ 1 Wartości θ 0, θ 1, które określają rozwiązanie tego problemu, uważamy za poszukiwane. Powyższy problem jest równoważny do problemu: θ 2 1 x 2 i +2θ 1 θ 0 x i +nθ0 2θ 2 1 y i x i 2θ 0 Przyrównujemy do zera pochodne po θ 1 i θ 0 : θ n 1 x2 i + θ n 0 x i = n y ix i θ 1 n x i + nθ 0 = n y i 7 y i min θ 0,θ 1.

8 skąd, rozwiązując ten układ równań liniowych, dostajemy: n θ 1 = (x i x)(y i ȳ) n (x, i x) 2 θ0 = ȳ θ 1 x. Rozwiązanie to jest jednoznaczne pod warunkiem, że nie wszystkie {x i } są jednakowe. 8

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1.

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1. Weryfikacja hipotez Każde badanie naukowe rozpoczyna się od sformułowania problemu badawczego oraz najbardziej prawdopodobnego (na gruncie wiedzy badającego) ogólnego rozwiązania, czyli hipotezy badawczej.

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

6. PODSTAWY PLANOWANIA EKSPERYMENTU

6. PODSTAWY PLANOWANIA EKSPERYMENTU 6. PODSTAWY PLANOWANIA EKSPERYMENTU 6.. Pojęcie i rola badań doświadczalnych Przez eksperyment rozumiemy badanie jakiegoś zjawiska, polegające na celowym wywoływaniu tego zjawiska lub jego zmian oraz obserwacji

Bardziej szczegółowo

Wprowadzenie do metod probabilistycznych wspomagane komputerowo MAPLE. Jerzy Ombach. Państwowa Wyższa Szkoła Zawodowa

Wprowadzenie do metod probabilistycznych wspomagane komputerowo MAPLE. Jerzy Ombach. Państwowa Wyższa Szkoła Zawodowa Wprowadzenie do metod probabilistycznych wspomagane komputerowo MAPLE Jerzy Ombach Państwowa Wyższa Szkoła Zawodowa Nowy Sącz 2006 Rada Naukowa Zdzisława Zacłona, Leszek Rudnicki, Jarosław Frączek, Zdzisław

Bardziej szczegółowo

Regresja prosta. Sylwia Bedyńska Szkoła Wyższa Psychologii Społecznej w Warszawie Monika Książek Szkoła Główna Handlowa w Warszawie

Regresja prosta. Sylwia Bedyńska Szkoła Wyższa Psychologii Społecznej w Warszawie Monika Książek Szkoła Główna Handlowa w Warszawie ROZDZIAŁ 1 Regresja prosta 15 Sylwia Bedyńska Szkoła Wyższa Psychologii Społecznej w Warszawie Monika Książek Szkoła Główna Handlowa w Warszawie Regresja prosta część i modele regresji rozdział 1 W tym

Bardziej szczegółowo

WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ

WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Wiele zjawisk i procesów występujących w otaczającej nas rzeczywistości ma

Bardziej szczegółowo

Opracowywanie danych doświadczalnych

Opracowywanie danych doświadczalnych Opracowywanie danych doświadczalnych Michał K. Urbański, Wydział Fizyki Politechniki Warszawskiej, murba@if.pw.edu.pl październik 2014 SPIS TREŚCI 1. Wstęp 2 1.1. Treść skryptu i rozkład materiału......

Bardziej szczegółowo

Brunon R. Górecki. Podstawowy kurs nowoczesnej ekonometrii

Brunon R. Górecki. Podstawowy kurs nowoczesnej ekonometrii Brunon R. Górecki Podstawowy kurs nowoczesnej ekonometrii SPIS TREŚCI Wstęp CZĘŚĆ I. KLASYCZNY MODEL REGRESJI LINIOWEJ.Wprowadzenie.. Czym jest ekonometria?.. Pojęcie modelu ekonometrycznego.3. Dane statystyczne.4.

Bardziej szczegółowo

Modelowanie ekonometryczne

Modelowanie ekonometryczne Barbara Gładysz Jacek Mercik Modelowanie ekonometryczne Studium przypadku Wydanie II Oficyna Wydawnicza Politechniki Wrocławskiej Wrocław 007 Recenzent Paweł DITTMANN Opracowanie redakcyjne i korekta Alina

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

Statystyczne metody analizy danych

Statystyczne metody analizy danych Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezioska Podstawowe pojęcia STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów)

Bardziej szczegółowo

Maciej Jakubowski Artur Pokropek BADAJĄC EGZAMINY. Podejście ilościowe w badaniach edukacyjnych. Centralna Komisja Egzaminacyjna

Maciej Jakubowski Artur Pokropek BADAJĄC EGZAMINY. Podejście ilościowe w badaniach edukacyjnych. Centralna Komisja Egzaminacyjna Maciej Jakubowski Artur Pokropek BADAJĄC EGZAMINY Podejście ilościowe w badaniach edukacyjnych Centralna Komisja Egzaminacyjna Maciej Jakubowski Artur Pokropek BADAJĄC EGZAMINY Podejście ilościowe w badaniach

Bardziej szczegółowo

Wybrane estymatory parametrów prostej regresji w strumieniowym przetwarzaniu danych

Wybrane estymatory parametrów prostej regresji w strumieniowym przetwarzaniu danych Uniwersytet Ekonomiczny w Krakowie Praca licencjacka Wybrane estymatory parametrów prostej regresji w strumieniowym przetwarzaniu danych Zygmunt Zawadzki Kierunek: Finanse i Rachunkowość Specjalność: Rynki

Bardziej szczegółowo

Modele matematyczne rynków instrumentów pochodnych I

Modele matematyczne rynków instrumentów pochodnych I Matematyka stosowana Modele matematyczne rynków instrumentów pochodnych I Jacek Jakubowski jakub@mimuw.edu.pl Uniwersytet Warszawski, 2011 Streszczenie. Wykład jest wprowadzeniem do modelowania rynków

Bardziej szczegółowo

MATEMATYKA dla studentów kierunku Zarządzanie i Marketing ZBIGNIEW BARTOSIEWICZ DOROTA MOZYRSKA EWA PAWŁUSZEWICZ

MATEMATYKA dla studentów kierunku Zarządzanie i Marketing ZBIGNIEW BARTOSIEWICZ DOROTA MOZYRSKA EWA PAWŁUSZEWICZ MATEMATYKA dla studentów kierunku Zarządzanie i Marketing ZBIGNIEW BARTOSIEWICZ DOROTA MOZYRSKA EWA PAWŁUSZEWICZ Wrzesień 1998 2 Spis treści Wstęp 7 1 Podstawy 9 1.1 Elementy logiki............................

Bardziej szczegółowo

Optymalizacja systemu rekomendacyjnego na podstawie bazy USOS

Optymalizacja systemu rekomendacyjnego na podstawie bazy USOS Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Karol Kański Nr albumu: 248362 Optymalizacja systemu rekomendacyjnego na podstawie bazy USOS Praca magisterska na kierunku MATEMATYKA

Bardziej szczegółowo

Martyngały a rynki finansowe

Martyngały a rynki finansowe Jest to zapis odczytu wygłoszonego na XXXIII Szkole Matematyki Poglądowej Metody klasyczne i współczesne, sierpień 2004. Martyngały a rynki finansowe Jacek JAKUBOWSKI, Warszawa 1. Okazuje się, że teoria

Bardziej szczegółowo

BADANIE ZGODNOŚCI ROZKŁADU STÓP ZWROTU NA GPW W WARSZAWIE Z ROZKŁADAMI GAUSSA I CAUCHY EGO

BADANIE ZGODNOŚCI ROZKŁADU STÓP ZWROTU NA GPW W WARSZAWIE Z ROZKŁADAMI GAUSSA I CAUCHY EGO AKADEMIA EKONOMICZNA W POZNANIU Krzysztof Cichy BADANIE ZGODNOŚCI ROZKŁADU STÓP ZWROTU NA GPW W WARSZAWIE Z ROZKŁADAMI GAUSSA I CAUCHY EGO PRACA MAGISTERSKA Wydział Zarządzania Kierunek: Zarządzanie i

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

Zmienność w procesach

Zmienność w procesach MODUŁ IV Zmienność w procesach i jej odmiany. Podstawy statystycznego nadzorowanie procesów. Zdatność jakościowa procesu. Elementy koncepcji Six Sigma 1 Zmienność w procesach Zmienność jest naturalnym

Bardziej szczegółowo

Janusz Górczyński. Moduł 4. Badanie, czy trend zjawiska jest liniowy lub wykładniczy.

Janusz Górczyński. Moduł 4. Badanie, czy trend zjawiska jest liniowy lub wykładniczy. Materiały pomocnicze do e-learningu Prognozowanie i symulacje Janusz Górczyński Moduł 4. Badanie, czy trend zjawiska jest liniowy lub wykładniczy. Wyższa Szkoła Zarządzania i Marketingu Sochaczew 2012

Bardziej szczegółowo

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH Janusz Wątroba, StatSoft Polska Sp. z o.o. Tematyka artykułu obejmuje wprowadzenie do problematyki modelowania statystycznego i jego roli w badaniu

Bardziej szczegółowo

Elementy narzędziowni matematycznej

Elementy narzędziowni matematycznej Rozdział 1 Elementy narzędziowni matematycznej 1.1. Przekształcanie równań Równanie, w uproszczeniu, to dwa wyrażenia matematyczne połączone znakiem równości. Czyli w równaniu mamy dwie strony, lewą L

Bardziej szczegółowo

SYMULACJE KOMPUTEROWE PROCESÓW SINGULARNYCH I OSOBLIWYCH W FINANSACH - WYBRANE ALGORYTMY Szkic

SYMULACJE KOMPUTEROWE PROCESÓW SINGULARNYCH I OSOBLIWYCH W FINANSACH - WYBRANE ALGORYTMY Szkic SYMULACJE KOMPUTEROWE PROCESÓW SINGULARNYCH I OSOBLIWYCH W FINANSACH - WYBRANE ALGORYTMY Szkic Ryszard Kutner Zakład Dydaktyki Fizyki, Instytut Fizyki Doświadczalnej Wydział Fizyki, Uniwersytet Warszawski

Bardziej szczegółowo

ALGORYTMIZACJA METOD OBLICZANIA PODOBIEŃSTWA STATKÓW DLA WSPOMAGANIA PROJEKTOWANIA WSTĘPNEGO...

ALGORYTMIZACJA METOD OBLICZANIA PODOBIEŃSTWA STATKÓW DLA WSPOMAGANIA PROJEKTOWANIA WSTĘPNEGO... Spis treści 1. WPROWADZENIE... 6 1.1 Przegląd literatury - stan wiedzy... 6 1.1.1 Sztuczna inteligencja i systemy hybrydowe... 6 1.1.2 Opis metodologii CBR... 7 1.1.3 Przykład zastosowania CBR w okrętownictwie...

Bardziej szczegółowo

Opole, dn. 17 grudnia 2006 Politechnika Opolska Wydział Elektrotechniki, Automatyki i Informatyki Kierunek: Informatyka. Metody Komputerowe w Technice

Opole, dn. 17 grudnia 2006 Politechnika Opolska Wydział Elektrotechniki, Automatyki i Informatyki Kierunek: Informatyka. Metody Komputerowe w Technice Opole, dn. 17 grudnia 2006 Politechnika Opolska Wydział Elektrotechniki, Automatyki i Informatyki Kierunek: Informatyka Metody Komputerowe w Technice Temat: Generatory liczb losowych algorytmy z wykorzystaniem

Bardziej szczegółowo

Symulacje stochastyczne i metody Monte Carlo

Symulacje stochastyczne i metody Monte Carlo Matematyka stosowana Symulacje stochastyczne i metody Monte Carlo Wojciech NIEMIRO wniem@mimuw.edu.pl http://adres.strony1.www Uniwersytet Warszawski, 2013 Streszczenie. Jest to wykład na temat symulacji

Bardziej szczegółowo

Nieparametryczne estymatory jądrowe regresji w zastosowaniach ekonomicznych

Nieparametryczne estymatory jądrowe regresji w zastosowaniach ekonomicznych Uniwersytet Ekonomiczny w Krakowie Praca magisterska Nieparametryczne estymatory jądrowe regresji w zastosowaniach ekonomicznych Anna Węgrzynkiewicz Kierunek: Informatyka i Ekonometria Specjalność: Modelowanie

Bardziej szczegółowo

DYWERSYFIKACJA RYZYKA

DYWERSYFIKACJA RYZYKA WALDEMAR TARCZYŃSKI MAŁGORZATA ŁUNIEWSKA DYWERSYFIKACJA RYZYKA Na polskim rynku kapitałowym Wydawnictwo PLACET zaprasza Państwa do zapoznania się z naszą ofertą. PLACET słowo niegdyś używane w naszym języku

Bardziej szczegółowo