Przypomnienie: wykłady i zadania kursu były zaczerpnięte z podręczników: Model statystyczny Format danych

Podobne dokumenty
Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

STATYSTYKA MATEMATYCZNA

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

Krzywa wieża w Pizie. SAS Data Step. Przykład (2) Wykład 13 Regresja liniowa

Natalia Nehrebecka. Wykład 2

Weryfikacja hipotez dla wielu populacji

CZĘŚĆ 6. MODEL REGRESJI, TREND LINIOWY ESTYMACJA, WNIOSKOWANIE

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Natalia Nehrebecka. Zajęcia 4

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

Zadanie 2. Dany jest szereg rozdzielczy przedziałowy, wyznaczyć następujące miary: wariancja, odchylenie standardowe

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Dobór zmiennych objaśniających

Ekonometryczne modele nieliniowe

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

1. Weryfikacja hipotez dotyczących wariancji test F. 2. Wykorzystanie statystyki F do badania istotności regresji

( ) Statystyka Studenta. s n SE X. Wykład 2 Porównanie dwóch populacji testy Studenta i testy nieparametryczne

INFORMATYKA W SELEKCJI

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Natalia Nehrebecka. Zajęcia 3

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

65120/ / / /200

Prawdopodobieństwo i statystyka r.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Blok 2: Zależność funkcyjna wielkości fizycznych

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

Wykład 4 Związki i zależności

PAKIETY STATYSTYCZNE

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ

Testy statystyczne teoria

IID = 2. i i i i. x nx nx nx

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. Strona 1

INFORMATYKA W CHEMII Dr Piotr Szczepański

Statystyka i opracowanie danych W 5: Odkrywanie i analiza zależności pomiędzy zmiennymi losowymi (danymi empirycznymi)

Natalia Nehrebecka. Dariusz Szymański

N a l e W y u n i k a ć d ł u g o t r w a ł e g o k o n t a k t u p o l a k i e r o w a n y c h p o w i e r z c h n i z w y s o k i m i t e m p e r a

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Analiza regresji modele ekonometryczne

Analiza zależności zmiennych ilościowych korelacja i regresja

STATYSTYKA ZESTAW ZADAŃ

Metody predykcji analiza regresji

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

EKONOMETRIA Wykład 2: Metoda Najmniejszych Kwadratów

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:


Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Motto. Czy to nie zabawne, że ci sami ludzie, którzy śmieją się z science fiction, słuchają prognoz pogody oraz ekonomistów? (K.

0. Oszacowanie kilku prostych regresji, interpretacja oszacować parametrów

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1

Analiza korelacji i regresji

Regresja liniowa i nieliniowa

Statystyka. Zmienne losowe

Ć Ź ć Ę ć Ę Ć Ź Ź Ć

Nieparametryczne Testy Istotności

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Obliczanie średniej, odchylenia standardowego i mediany oraz kwartyli w szeregu szczegółowym i rozdzielczym?

Statystyczna analiza danych

Ź Ć Ó Ó

ć ć Ń Ę

Pattern Classification

EKSPLORACJA ZASOBÓW INTERNETU - MIŁOSZ KADZIŃSKI LABORATORIUM IV WEB ADVERTISING + LATENT SEMANTIC INDEXING

ma rozkład normalny z nieznaną wartością oczekiwaną m

Statystyka. Teoria błędów. Wykład IV ( )

Testy dotyczące wartości oczekiwanej (1 próbka).

f(x, y) = arctg x y. f(u) = arctg(u), u(x, y) = x y. x = 1 1 y = y y = 1 1 +

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Analiza struktury zbiorowości statystycznej

Sprawozdanie powinno zawierać:

Metody badań kamienia naturalnego: Oznaczanie współczynnika nasiąkliwości kapilarnej

Statystyka Inżynierska

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

KINEMATYKA MANIPULATORÓW

Zad 2 Dynamika zatrudnienia mierzona indeksami łańcuchowymi w ostatnich pięciu latach kształtowały się następująco: Lata Indeksy ( w %)

RACHUNEK NIEPEWNOŚCI POMIARU

( X, Y ) będzie dwuwymiarową zmienną losową o funkcji gęstości

Prawdopodobieństwo i statystyka r.

Prawdopodobieństwo i statystyka r.

BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH - ANALIZA KORELACJI PROSTEJ

EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

ż ć Ę ż ż ż Ń Ł ż ż ż ż ż ż ż ż

BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ

WYZNACZANIE PRZYSPIESZENIA ZIEMSKIEGO ZA POMOCĄ WAHADŁA RÓŻNICOWEGO

Metody analizy obwodów

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

. Wtedy E V U jest równa


Za: Stanisław Latoś, Niwelacja trygonometryczna, [w:] Ćwiczenia z geodezji II [red.] J. Beluch

Wnioskowanie statystyczne dla korelacji i regresji.

Metody prognozowania: Jakość prognoz Wprowadzenie (1) 6. Oszacowanie przypuszczalnej trafności prognozy

Transkrypt:

Wkład 13: (prota) regreja lnowa Model tattczn Format danch Przedzał ufnośc tet totnośc dla parametrów modelu Przpomnene: wkład zadana kuru bł zaczerpnęte z podręcznków: Stattka dla tudentów kerunków techncznch przrodnczch, J. Koronack, J. Melnczuk, WNT 004, wd. II Introducton to the Practce of Stattc, D. Moore, G. McCabe, Freeman 003, wd. IV Stattc for the Lfe Scence, M. Samuel, J. Wtmer, 003, wd. III H. Jaulewcz W. Kordeck \Rachunek prawdopodobeńtwa tattka matematczna. Przkład zadana", wd. II Słownctwo: Zmenna odpowedz jet głównm przedmotem zantereowana. Zmenne objaśnające ą pomocncze wjaśnają, a czaem wręcz wpłwają na zmenną odpowedz. Intereuje na zwązek tch zmennch. Ćwczene. W natępującch przkładach wkaż: oberwowane jednotk/oobnk, zmenne. Eample 1: Średn wzrot pewnej grup dzec w mejcowośc Kalama (Egpt) oberwowanch w weku 18--9 meęc: Scatterplot (wkre punktow): punkt (, ). Tu: wokość wek dzec w Kalama. Przedkutuj źródło zmennośc zmennej Age... Przkład : Średn wnk SAT z matematk w tane (USA) procent abolwentów zkoł średnej (HS) prztępującch do SAT 1

Dodatna cz ujemna korelacja? Mam tu... korelację. Mam tu... korelację. Wpółcznnk korelacj Oznaczam r. Oblczam dla n (par) oberwacj: 1 r n 1 Uwag: -1 r 1. Ne zależ od jednotek pomaru. Wkazuje na lnow zwązek, gd blk ±1. Neodporn na oberwacje odtające. Ne zależ od tego, która zmenna jet uważana za zmenną odpowedz, a która za objaśnającą. Prota regrej (najmnejzch kwadratów): Przkład 1 cd.: Prota regrej dla danch z Kamala predkcja dla weku 3 meęc. Lna prota, która najlepej opuje przblża catterplot. Opuje lnową odpowedź zmennej na zman zmennej objaśnająca. Równane protej (b-nachlene/lope, a- tała/ntercept): =a+b Najlepze a b ą oblczane z danch. Predkcja dla danej wartośc zmennej objaśnającej: ŷ =a+b

Wzór dla protej regrej (najmnejzch kwadratów) (X-zmenna objaśnająca, Y-zmenna odpowedz) Dane:,,,, r. Calculate: lope b r and ntercept a b ab Przkład1 cd. (dane z Kamala) 3.5 m o n th, 7 9.8 5 cm, 3.6 0 6 m o n th,.3 0 cm, r= 0.9 9 4 4 Wartośc reztowe (redual) Oblcz przewdwan wzrot dla weku 5 meęc. Ile wno różnca względem zaoberwowanego wzrotu? A dla weku 50 meęc?? Wartość reztowa (w/dla ) to (oberwowane )-(przewdwane ): r = -ŷ Np. dla danch z Kamala =5, wartość reztowa wno: Redual plot (wkre reztow): Scatterplot (wkre punktow) rezt zmennej objaśnającej. Pomaga ocenć dokładność przblżena przez protą regrej. Model tattczn (protej) regrej lnowej 0 1 Dane: n oberwacj potac ( 1, 1 ), (, ), ( n, n ). Odchlena ą z założena nezależne o tm amm rozkładze ze średną 0 odchlenem tandardowm. Parametr modelu to: 0, 1,. 3

Motwacja: dwe grup/populacje z tm amm odchlenem tandardowm różnm średnm: Regreja lnowa: wele grup z tm amm odchlenem tandardowm średną zmenającą ę lnowo wraz z. Mślm o protej regrej oblczonej dla danch jako etmatorze protej regrej dla populacj. lna równane nachlene (lope) Ogólne ŷa b b a Dla prób b b b ˆ 0 1 1 b 0 Dla populacj 0 1 1 0 tała (ntercept) Wzor ( Dane: n,, ),, n 1 r ( )( ) ( ) ( ) Stattk wnkowe: b b ˆ 1 r, a b0 b, b ( ˆ ) n ( ) (1 r n 1 ), n 1 r n, t 0 ( ), n 1 b, 1 r n 1 r Przedzał ufnośc tet totnośc dla nachlena tałej (lope oraz ntercept) Na pozome ufnośc C przedzał ufnośc dla 0: b t * 0 b Na pozome C przedzał ufnośc dla 1 to: b t * 1 t * znajdujem z (tabel) rozkładu Studenta z n- topnam wobod. 0 Przkład: 9 mężczzn w weku 0-9 lat. Merzm kn-fold thckne oraz bod dent: ID Ikn Den 1 1.7 1.093 1.56 1.063 3 1.45 1.078 4 1.5 1.056 5 1.51 1.073 4

Scatterplot prota najmnejzch kwadratów: Wnk SASa: The SAS Stem 17:47 Thurda, Jul, 004 5 The REG Procedure Model: MODEL1 Dependent Varable: Den Root M 0.00854 R-Square 0.704 Dependent Mean 1.06403 Adj R-Sq 0.7173 Coeff Var 0.805 Parameter Etmate Parameter Standard Varable DF Etmate Error t Value Pr > t 99% Confdence Lmt Intercept 1 1.16300 0.00656 177.30 <.0001 1.14574 1.1806 Ikn 1-0.0631 0.00414-15.3 <.0001-0.07403-0.051 SPSS, dla tch amch danch: Ecel, dla tch amch danch: Ćwczene: Znajdź przedzał ufnośc dla średnej zman bod dent na jednotkę knfold thckne. Stattka: Tetowane hpotez H0: 1=0 t To jet tet Studenta z df = n. Jeżel 1 =0, to = 0, tj. średna ne zmena ę z w modelu lnowm. W przecwnm raze mówm o lnowm wpłwe/zależnośc (nezerowm nachlenu w populacj). Zwkle oprogramowane podaje wartość tattk (dwutronną) P-wartość. Wtarcz znterpretować. 5

P-wartośc dla H0: 1=0 Ćwczene: Cz jet lnowa zależność pomędz bod dent oraz knfold thckne? Stattka tetowa: t df = n. Założena dla regrej lnowej: Wartośc zmennej odpowedz ą nezależne. (Można wkrć ew. problem oberwując wartośc reztowe jako funkcję numeru oberwacj/czau.) Dla każdej utalonej wartośc zmennej, zmenna zachowuje ę jak zmenna normalna. (Ab wkrć problem można narować htogram wartośc reztowch.) Założena dla regrej lnowej cd.: Odchlene tandardowe zmennej jet take amo dla wztkch. (Ab wkrć problem można pojrzeć na wkre reztow.) Należ wzukać/uunąć wartośc odtające tzw. oberwacje wpłwowe. Zależność pomędz jet lnowa (a ne krzwolnowa; ew. problem można wkrć oberwując catterplot). Rezt cza/numer oberwacj. Wkre reztow 6