WYKŁAD 8 ANALIZA REGRESJI

Podobne dokumenty
ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

WYKŁAD 5 TEORIA ESTYMACJI II

POLITECHNIKA OPOLSKA

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

PDF created with FinePrint pdffactory Pro trial version

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 6 ESTYMACJA cz. 2

Rozdział 8. Regresja. Definiowanie modelu

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Ważne rozkłady i twierdzenia c.d.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

KORELACJE I REGRESJA LINIOWA

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Rozkłady statystyk z próby

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Testowanie hipotez statystycznych

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

STATYSTYKA MATEMATYCZNA

KADD Metoda najmniejszych kwadratów funkcje nieliniowe

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Rozkład normalny, niepewność standardowa typu A

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Wnioskowanie statystyczne. Statystyka w 5

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

STATYSTYKA INDUKCYJNA. O sondażach i nie tylko

1 Podstawy rachunku prawdopodobieństwa

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Wykład 3 Hipotezy statystyczne

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Prawdopodobieństwo i rozkład normalny cd.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Estymacja parametrów w modelu normalnym

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

DOKUMENTACJA SYSTEMU ZARZĄDZANIA LABORATORIUM. Procedura szacowania niepewności

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Komputerowa Analiza Danych Doświadczalnych

Testowanie hipotez statystycznych.

ĆWICZENIE 3 REZONANS AKUSTYCZNY

Estymacja parametrów rozkładu cechy

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Estymacja wektora stanu w prostym układzie elektroenergetycznym

Estymacja parametrów, przedziały ufności etc

Układy równań i równania wyższych rzędów

Wykład 12 Testowanie hipotez dla współczynnika korelacji

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

166 Wstęp do statystyki matematycznej

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Własności statystyczne regresji liniowej. Wykład 4

STATYSTYKA MATEMATYCZNA, LISTA 3

Wykład 12 Testowanie hipotez dla współczynnika korelacji

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Procedura szacowania niepewności

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Pobieranie prób i rozkład z próby

ĆWICZENIE 13 TEORIA BŁĘDÓW POMIAROWYCH

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Pochodna i różniczka funkcji oraz jej zastosowanie do obliczania niepewności pomiarowych

METODY STATYSTYCZNE W BIOLOGII

Metoda największej wiarygodności

Transkrypt:

WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej 5. Zamiana przypadków nieliniowych na liniowe

METODA NAJMNIEJSZYCH KWADRATÓW

METODA NAJMNIEJSZYCH KWADRATÓW

METODA NAJMNIEJSZYCH KWADRATÓW

METODA NAJMNIEJSZYCH KWADRATÓW

WSPÓŁCZYNNIK KORELACJI LINIOWEJ r=0,73

METODA NAJMNIESZYCH KWADRATÓW y=a+bx (1) Zakładamy, że: a) niepewność w określaniu x jest zaniedbywalna ; b) każdy wynik pomiaru y i podlega rozkładowi normalnemu; c) niepewności wszystkich wartości y mają tę samą wartość: σ y. Prawdziwa wartość y i =A+Bx i (2) Wynik pomiaru y i podlega rozkładowi normalnemu wyśrodkowanemu wokół swojej prawdziwej wartości z odchyleniem σ y, więc prawdopodobieństwo zmierzonej wartości y i wynosi: Prawdopodobieństwo otrzymania kompletnego zbioru wyników y 1,,y N jest iloczynem: (3) (4) gdzie: (5)

METODA NAJMNIESZYCH KWADRATÓW Najlepsze przybliżenie nieznanych stałych A, B uzyskamy, gdy prawdopodobieństwo jest największe, co odpowiada: (6) stąd otrzymujemy tzw. równania normalne o niewiadomych A i B: rozwiązanie tego układu równań daje: (8) (9) (7)

METODA NAJMNIESZYCH KWADRATÓW (10) (11) gdzie: (12) lub, w równoważnej formie: (11 ) (10 )

METODA NAJMNIESZYCH KWADRATÓW (4) Różniczkując równanie (4) względem σ y, a następnie przyrównując uzyskaną pochodną do zera, ponadto uwzględniając fakt, że liczba stopni swobody wynosi w tym przypadku N-2 (N- niezależnych pomiarów minus dwa wyznaczone parametry: A i B), uzyskujemy następujące wyrażenie na niepewność pomiarów y: (13)

METODA NAJMNIESZYCH KWADRATÓW DEFINICJA W obliczeniach statystycznych LICZBA STOPNI SWOBODY wynosi: liczba niezależnych pomiarów (N) minus liczba parametrów obliczonych z tych pomiarów z prawa przenoszenia błędów otrzymujemy: (14) (15) gdzie Δ dane jest równaniem (12) (12)

METODA NAJMNIEJSZYCH KWADRATÓW DLA INNYCH ZALEŻNOŚCI FUNKCYJNYCH Analogicznie można postępować w dopasowaniu innych krzywych przedstawioną metodą najmniejszych kwadratów np. w przypadku wielomianu: uzyskujemy następującą sumę kwadratów: (16) (17) Następnie obliczamy pochodne cząstkowe względem A,B,C,,Z przyrównujemy je do zera, otrzymując układ równań normalnych na parametry A, B,C, Z Podobnie postępujemy w przypadku funkcji wielu zmiennych np. z=a+bx+cy (regresja wielokrotna)

METODA NAJMNIEJSZYCH KWADRATÓW (ogólna zasada) (1) Dana jest funkcja: y= f(x; a o, a 1,...,a m ) (1) zmiennej niezależne x oraz m+1 parametrów a o, a 1,...,a m. Parametry te są stałe, które należy wyznaczyć. W tym celu przeprowadza się n pomiarów x i y otrzymując n par (x i, y i ) i=1,2,...,n. Wstawiając wartości (x i, y i ) do (1) otrzymujemy: y i = f(x i ; a o, a 1,...,a m ) i= 1, 2,..., n (2) Jeśliby wartości x i y można było wyznaczyć bardzo dokładnie, to do znalezienia m+1 parametrów wystarczyłoby przeprowadzić m+1 pomiarów. W rzeczywistości wartości x i y są obarczone błędami, co nie pozwala na dokładne wyznaczenie prawdziwych wartości tych parametrów. Z reguły przeprowadza się większą liczbę pomiarów czyli n> m+1. W tym przypadku układ równań (2) jest sprzeczny.

METODA NAJMNIEJSZYCH KWADRATÓW (ogólna zasada) (2) Zadaniem naszym jest dobór takich parametrów a o, a 1,...,a m aby równania (2) były spełnione w możliwie najlepszym sposobie (czyli chcemy określić najbardziej prawdopodobne wartości tych parametrów). Ponieważ. równania (2) nie są ściśle spełnione, więc: y i - f(x i ; a o, a 1,...,a m ) = i i= 1, 2,..., n (3) gdzie i są odchyleniami mierzonych wartości od obliczonych ze wzoru (1). Zasada najmniejszych kwadratów: Najbardziej prawdopodobne parametry są takie, dla których suma kwadratów odchyleń i jest najmniejsza: (4)

METODA NAJMNIEJSZYCH KWADRATÓW (ogólna zasada) (3) Przypadek liniowy: f(x: a o, a 1,..., a m) = o (x)*a o + 1 (x)*a 1 +...+ m (x)*a m (5) Korzystając z warunku koniecznego na minimum ( po wstawieniu (5) do (4) mamy:................................................. (6)

METODA NAJMNIEJSZYCH KWADRATÓW (ogólna zasada) (4) Wprowadzając oznaczenia: Układ równań (6) możemy zapisać ( tzw. postać normalna): [ o, o ] a o +[ o, 1 ] a 1 +...+[ o, m ] a m = [y, o ] [ 1, o ] a o +[ 1, 1 ] a 1 +...+[ 1, m ] a m = [y, 1 ]... (7) [ m, o ]a o +[ m, 1 ]a 1 +...+[ m, m ] a m = [y, m ] Jest to układ m+1- równań liniowych z m+1 niewiadomymi: a o, a 1,...,a m. Ponieważ: [ r, s ] = [ s, r ], więc macierz współczynników układu równań (7) jest macierzą symetryczną. W szczególnym przypadku gdy m=1 oraz o (x) = 1; 1 (x) = x mamy przypadek regresji prostoliniowej, w której a o = A (odcięta) oraz a 1 = B (nachylenie)

ZMIANA NIEKTÓRYCH PRZYPADKÓW NIELINIOWYCH FUNKCJI REGRESJI NA LINIOWE y Przypadek ogólny: f ( x, a, a2,..., a 1 n zmienne: x, y ; parametry: a 1, a 2,..., a n ) y f linearyzacja: f f o o o ( x, a1, a2,..., an ) ( ) o a1 ( ) o a2 a1 a2... f ( a n ) o a n Gdzie: przybliżona wartość parametru a i Dokładna wartość a i = +a i

WYZNACZANIE A i B EXCEL statystyczne NACHYLENIE, znane_y (wstawić wartości y i ) znane_x (wstawić wartości x i ) B EXCEL statystyczne ODCIĘTA, znane_y (wstawić wartości y i ) znane_x (wstawić wartości x i ) A

ESTYMACJA LINIOWEJ FUNKCJI REGRESJI y=a+bx Parametry A i B wyznacza się z próby, czyli są one estymatorami następujących parametrów zależności: y=α+βx w populacji generalnej. Stwierdzono, że są one estymatorami nieobciążonymi i zgodnymi. Obszar ufności dla prostej regresji y=α+βx, ograniczony tzw. krzywymi ufności, wyznacza się ze wzoru: (21) Gdzie oznacza wartość funkcji, wyznaczonej ze wzorów (10), (11) oznacza wartość szacowanej funkcji regresji y= α +βx, t γ jest wartością zmiennej o rozkładzie t-studenta, wyznaczonej dla określonego 1-γ poziomu ufności dla k=n-2 stopni swobody oraz: (22) Gdzie s r jest odchyleniem przeciętnym do prostej regresji, obliczanym ze wzoru: (23)

ESTYMACJA LINIOWEJ FUNKCJI REGRESJI y=a+bx Obszar ufności dla prostej regresji y=α+βx, ograniczony tzw. krzywymi ufności wyznacza się ze wzoru: (21)

ESTYMACJA LINIOWEJ FUNKCJI REGRESJI P.G. y= + *x ; Próba (N-elementowa): y =A +B*x 1. KRZYWE UFNOŚCI B- NACHYLENIE; A- ODCIĘTA t -ROZKŁAD.T.ODW; k=n-2 2. ESTYMACJI WSPÓŁCZYNNIKA (NACHYLENIA) REGRESJI LINIOWEJ t - ROZKŁAD.T.ODW ( prawdopodobieństwo= ; stopnie swobody: k=n-2)

TESTY ISTOTNOŚCI DLA WSPÓŁCZYNNIKA REGRESJI LINIOWEJ 1. H o : B= o k= N-2 2. H o : 1 = 2 (test równoległości) k= N1+N2-4

ESTYMACJA LINIOWEJ FUNKCJI REGRESJI Przykład: Celem uzyskania spieku materiału o kontrolowanej porowatości, do wyjściowego proszku przed spiekaniem dodawano grafitu. Po wypaleniu uzyskano następujące wyniki (wartości x i, y i w Tabeli) : Przyjmując poziom ufności 1-=0,95 oszacować metodą przedziałową zarówno całą funkcję regresji, jak i sam współczynnik regresji porowatości względem zawartości użytego grafitu. x i [% wag. y i [porowatość, grafitu] 1 2 3 4 5 6 7 %] 8 13 14 17 18 20 22 9,5 11,7 13,8 16,0 18,1 20,2 22,4 9 4 1 0 1 4 9 0,681 0,535 0,423 0,378 0,423 0,535 0,681 2,25 1,69 0,04 1,00 0,01 0,04 0,16 28 5,19 Rozwiązanie: EXCEL statystyczne NACHYLENIE, znane_y (wstawić wartości y i ) znane_x (wstawić wartości x) B=2,14 EXCEL statystyczne ODCIĘTA, znane_y (wstawić wartości y i ) znane_x (wstawić wartości x) A=7,4

ESTYMACJA LINIOWEJ FUNKCJI REGRESJI Przyjmując poziom ufności 1-=0,95 oszacować metodą przedziałową zarówno całą funkcję regresji, jak i sam współczynnik regresji porowatości względem zawartości użytego grafitu. x i [% wag. y i [porowatość, grafitu] 1 2 3 4 5 6 7 %] 8 13 14 17 18 20 22 9,5 11,7 13,8 16,0 18,1 20,2 22,4 9 4 1 0 1 4 9 0,681 0,535 0,423 0,378 0,423 0,535 0,681 2,25 1,69 0,04 1,00 0,01 0,04 0,16 28 5,19 0,695 0,546 0,431 0,386 0,431 0,546 0,695 1,8 1,4 1,1 1,0 1,1 1,4 1,8 7,7 10,3 12,7 15,0 17,0 18,8 20,6 11,3 13,1 14,9 17,0 19,2 21,6 24,2 EXCEL statystyczne ROZKŁAD.T.ODW t = 2,571 1-=0,95 => =0,05, k=n-2=5,

ESTYMACJA LINIOWEJ FUNKCJI REGRESJI y=a+bx Obszar ufności dla prostej regresji y=α+βx, ograniczony tzw. krzywymi ufności wyznacza się ze wzoru: (21) t - ROZKŁAD.T.ODW ( prawdopodobieństwo= ; stopnie swobody: k=n-2)

ESTYMACJA LINIOWEJ FUNKCJI REGRESJI y= 7,4 + 2,14 * x

ESTYMACJA LINIOWEJ FUNKCJI REGRESJI PRZEDZIAŁ UFNOŚCI DLA WSPÓŁCZYNNIKA β (NACHYLENIA) y=α+βx Dwuwymiarowy rozkład cech X i Y w populacji jest normalny, lub zbliżony do normalnego. Z populacji tej wylosowano n-elementową próbę, która dała wyniki (x i, y i ) i=1, 2,,N. Przedział ufności dla współczynnika regresji β funkcji regresji y=α+βx w populacji wynosi: (24) Gdzie B jest wspól. regresji, otrzymanym metodą najmniejszych kwadratów ( równ. 11 lub 11 ), s r dane jest równ. (23), a t γ jest wartością zmiennej o rozkładzie t-studenta, wyznaczonej dla określonego 1-γ poziomu ufności dla k=n-2 stopni swobody.

ESTYMACJA LINIOWEJ FUNKCJI REGRESJI PRZEDZIAŁ UFNOŚCI DLA WSPÓŁCZYNNIKA β (NACHYLENIA) t = 2,571 B=2,14 2,14-2,571*1,02/5,29< < 2,14+ 2,571*1,02/5,29 1,64< < 2,64

TESTY ISTOTNOŚCI DLA WSPÓŁCZYNNIKA B (NACHYLENIA) REGRESJI LINIOWEJ 1. H o : B= o k= N-2 2. H o : 1 = 2 (test równoległości) k= N1+N2-4

TEST ISTOTNOŚCI DLA WSPÓŁCZYNNIKA REGRESJI LINIOWEJ PROBLEM: Dwuwymiarowy rozkład cech X i Y w populacji jest normalny, lub zbliżony do normalnego. Z populacji tej wylosowano n-elementową próbę, która dała wyniki (x i, y i ) i=1, 2,,N. Na podstawie wyników próby sprawdzić hipotezę, że współczynnik β liniowej funkcji regresji: y=α+βx w populacji ma określoną wartość, tj: H o :β= β o wobec H 1 : β β o (w szczególności gdy β o =0, hipoteza głosi, że brak jest zależności między badanymi cechami X i Y). Rozwiązanie: Metodą najmn. kwadratów szacujemy parametry próby (A i B), obliczamy wg (23) s r oraz statystykę: Statystyka ta ma rozkład t-studenta z k=n-2 stopniami swobody, odczytujemy dla danego, t, gdy t t to H o odrzucić

ĆWICZENIE x i y i [kg] [J] 1 3.5 2 8.4 3 8.5 4 12.4 5 11.5 6 16.5 7 15.7 8 19.0 9 18.8 10 25.2 x sr =5.5 y sr =13.95 EXCEL => A (ODCIETA) i B (NACHYLENIE) dla x i, y i A=2.77 ; B= 2.03

ĆWICZENIE (2) x i y i [kg] [J] 1 3.5 2 8.4 3 8.5 4 12.4 5 11.5 6 16.5 7 15.7 8 19.0 9 18.8 10 25.2 x sr =5.5 y sr =13.95 A= 2.77 B= 2.03

ĆWICZENIE (3)

ĆWICZENIE (4)

ZMIANA NIEKTÓRYCH PRZYPADKÓW NIELINIOWYCH FUNKCJI REGRESJI NA LINIOWE (układy prostujące) a) Adsorpcja promieniowania: zmienne I, x ; parametry I o, Układ prostujący: Y= log I = f(x): I I o e x Y log I log Io log e x A B X b) Przewodnictwo elektryczne półprzewodników zmienne:, T ; parametry: o, E act ; stałe: R Układ prostujący: Y= log= f(t -1 )= f(x): Y log log o E act log e T R c) Przewodnictwo elektryczne elektrolitów 1 A B X o T zmienne:, T ; parametry: o, E act ; stałe: R Układ prostujący: Y= log(t) = f(t -1 )= f(x): E exp[ act o RT E exp[ RT act ] ] Y log( T ) log o E act log e T R 1 A B X

ZMIANA NIEKTÓRYCH PRZYPADKÓW NIELINIOWYCH FUNKCJI REGRESJI NA LINIOWE (układy prostujące) 1)] ( )[1 ( c p p p p cp v V o o m ) ( ) ( ) ( X f p p f V p p p Y o o X B A p p cv c cv V p p p Y o m m o ) ( 1 1 ) ( v m B A 1 d) Izoterma BET zmienne: V, p ; parametry: p o, c, v m Układ prostujący: