WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Podobne dokumenty
Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Testowanie hipotez statystycznych

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu

Testowanie hipotez statystycznych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Testowanie hipotez statystycznych.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Statystyka w analizie i planowaniu eksperymentu

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

166 Wstęp do statystyki matematycznej

Testowanie hipotez statystycznych.

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Stosowana Analiza Regresji

Estymacja parametrów rozkładu cechy

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

PDF created with FinePrint pdffactory Pro trial version

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Statystyka w analizie i planowaniu eksperymentu

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Własności statystyczne regresji liniowej. Wykład 4

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Wnioskowanie statystyczne. Statystyka w 5

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

STATYSTYKA

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Wykład 3 Hipotezy statystyczne

1.1 Wstęp Literatura... 1

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Kolokwium ze statystyki matematycznej

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Rozdział 8. Regresja. Definiowanie modelu

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Testowanie hipotez statystycznych.

Prawdopodobieństwo i statystyka

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

STATYSTYKA MATEMATYCZNA, LISTA 3

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

Testowanie hipotez statystycznych cd.

Spis treści 3 SPIS TREŚCI

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

WYKŁAD 8 ANALIZA REGRESJI

Hipotezy statystyczne

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

1 Estymacja przedziałowa

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

Weryfikacja hipotez statystycznych

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Transkrypt:

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y ) jest wspó lczynnik ρ określony wzorem ρ = Cov(X, Y ), σ X σ Y gdzie σ X i σ Y oznaczaja odchylenie standardowe zmiennej odpowiednio X i Y, czyli σ X = E (X E(X)) 2, σ Y = E (Y E(Y )) 2. Wspó lczynnik ρ nazywamy wspó lczynnikiem korelacji liniowej. Przyjmuje wartości z przedzia lu [ 1, 1]. Wartość 0 oznacza brak korelacji liniowej pomiedzy cechami X i Y. Wartość 1 lub 1 oznacza zależność ścis la, liniowa, czyli zależność postaci Y = β 0 + β 1 X.

Rozważmy próbe losowa (X 1, Y 1 ), (X 2, Y 2 ),..., (X n, Y n ), gdzie (X i, Y i ) oznacza badana ceche (X, Y ) dla i-tej jednostki, wylosowanej niezależnie do próby. Definicja 1. Estymatorem wspó lczynnika korelacji liniowej ρ jest statystyka określona wzorem gdzie S 2 X = 1 n r = n 1 n nj=1 (X j X)(Y j Ȳ ) S X S Y, (1) j=1(x j X) 2, S 2 Y = 1 n n j=1 (Y j Ȳ ) 2. Równoważna do (1) jest formu la r = nj=1 X j Y j XȲ nj=1 (X j X) 2 (2) nj=1 (Y j Ȳ ) 2.

Estymator r nazywamy próbkowym wspó lczynnikiem korelacji liniowej Pearsona. Jest on estymatorem obciażonym, ponieważ E(r) ρ. Przedzia l ufności dla wspó lczynnika ρ Jeśli zmienna losowa (X, Y ) ma dwuwymiarowy rozk lad normalny, to statystyka U = r ρ 1 ρ 2 n (3) ma dla n graniczny rozk lad normalny standaryzowany N (0, 1). Niech 1 α b edzie za lożonym poziomem ufności. Oznaczmy przez u α kwantyl rz edu 1 α 2 rozk ladu normalnego standaryzowanego. Rozważmy granic e prawdopodobieństwa lim n P ( u α U u α ),

gdzie U jest zmienna losowa dana wzorem (3). Mamy lim n P ( u α r ρ 1 ρ 2 n uα ) = =Φ(u α ) Φ( u α ) = 2Φ(u α ) 1 = =2 Mamy zatem lim n P ( 1 α ) 2 ( 1 = 1 α. u α r ρ 1 ρ 2 n uα Po przekszta lceniach otrzymujemy lim n P ( ) = 1 α. r u α 1 ρ 2 n ρ r + u α 1 ρ 2 n ) = 1 α. Ponieważ wyrażenie 1 ρ 2 wyst epuj ace po obu stronach nierówności pdwójnej jest nieznane, wi ec zast epujemy je punktowym oszacowaniem, tj. wyrażeniem 1 r 2.

Zatem, dla dostatecznie dużej próby (tj. dla n 100) otrzymujemy równość przybliżona P ( r u α 1 r 2 n ρ r + u α 1 r 2 n ) 1 α. Tym samym dla dostatecznie dużej próby przedzia l postaci [ 1 r 2 1 r 2 ] r u α, r + u α n n jest dobrym przybliżeniem przedzia lu ufności dla wspó lczynnika ρ na poziomie ufności 1 α.

Test istotności dla wspó lczynnika korelacji liniowej ρ Za lóżmy, że badana cecha (X, Y ) ma w populacji dwuwymiarowy rozk lad normalny. Chcemy zweryfikować hipoteze zerowa, iż zmienne X i Y sa liniowo nieskorelowane, tj. hipoteze H 0 : ρ = 0, przeciwko hipotezie alternatywnej H 1 : ρ < 0 (lub ρ > 0, lub ρ 0). Statystyka testu jest zmienna losowa r t = n 2, 1 r 2 która przy za lożeniu prawdziwości hipotezy zerowej ma rozk lad Studenta o n 2 stopniach swobody.

W przypadku, gdy hipoteza alternatywna jest postaci H 1 : ρ < 0, wówczas hipoteze zerowa odrzucamy na rzecz hipotezy alternatywnej wtedy, gdy wartość statystyki testu jest mniejsza od kwantyla rzedu α rozk ladu Studenta o n 2 stopniach swobody. W przypadku, gdy hipoteza alternatywna jest postaci H 1 : ρ > 0, wówczas hipoteze zerowa odrzucamy na rzecz hipotezy alternatywnej wtedy, gdy wartość statystyki testu jest wieksza od kwantyla rzedu 1 α rozk ladu Studenta o n 2 stopniach swobody. W przypadku, gdy hipoteza alternatywna jest postaci H 1 : ρ 0, wówczas hipoteze zerowa odrzucamy na rzecz hipotezy alternatywnej wtedy, gdy wartość statystyki testu jest mniejsza od kwantyla rzedu α 2 lub wi eksza od kwantyla rzedu 1 α 2 rozk ladu Studenta o n 2 stopniach swobody.

Model regresji liniowej Niech (X, Y ) bedzie dwuwymiarowa zmienna losowa. Przypuśćmy, że dla pewnych sta lych β 0, β 1 i dla wartości x zmiennej X zmienna Y przyjmuja wartości zgodnie ze wzorem Y = β 0 + β 1 x + ɛ, (4) gdzie ɛ jest zmienna losowai ze średnia równa 0 i wariancja równa σ 2. Model (4) nazywamy modelem regresji liniowej zmiennej Y wzgl edem zmiennej X. Wspó lczynniki β 0 i β 1 nazywamy odpowiednio wyrazem wolnym i wspó lczynnikiem regresji. Sk ladnik ɛ nazywamy b l edem losowym w modelu regresji, a jego wariancj e σ 2 określamy mianem wariancji b l edu w modelu regresji.

Wartość oczekiwana zmiennej Y przy warunku X = x, sa postaci E (Y X = x) = E (β 0 + β 1 x) + E (ɛ) = = β 0 + β 1 x + E (ɛ) = β 0 + β 1 x. Wynik ten oznacza, że uśrednienie nieskończenie wielu obserwacji zmiennej Y poczynionych dla ustalonej wartości x zmiennej X daje wartość równa β 0 + β 1 x, zależna od wartości x zmiennej X. Oznaczajac warunkowa wartość oczekiwana po lewej stronie symbolem ŷ, czyli oznaczajac otrzymujemy równanie ŷ = E (Y X = x), ŷ = β 0 + β 1 x. (5) Równanie (5) nazywamy równaniem prostej regresji zmiennej Y wzgl edem zmiennej X.

Podobnie wariancja zmiennej Y przy warunku X = x równa jest D 2 (Y X = x) = D 2 (β 0 + β 1 x) + D 2 (ɛ) = σ 2. Wynika stad, że wariancja mieskończenie wielu obserwacji zmiennej Y poczynionych dla ustalonej wartości x zmiennej X jest sta la i równa wariancji σ 2 sk ladnika b l edu. Z powyższych rozważań wynika, że zmienna Y jest zmienna o wariancji σ 2 i o wartości oczekiwanej zależnej od wartości x zmiennej X (o ile parametr β 1 w modelu regresji jest różny od 0). Zatem rozk lad zmiennej Y zależy od wartości przyjmowanej przez zmienna X.

Przedzia ly ufności dla parametrów β 0 i β 1 Zauważymy, że model (4) jest określony przez trzy parametry: β 0, β 1, σ 2. Zajmiejmy si e estymatorami tych parametrów. Niech b edzie dana próba losowa (X 1, Y 1 ), (X 2, Y 2 ),..., (X n, Y n ), gdzie (X i, Y i ) oznacza cech e (X, Y ) dla i-tej jednostki wylosowanej niezależnie do próby. Estymatorami parametrów β 1, β 0 i wariancji sk ladnika b l edu σ 2 w modelu regresji (4) sa statystyki b 1, b 0 i Sɛ 2 określone wzorami b 1 = nj=1 (X j X)(Y j Ȳ ) nj=1 (X j X) 2, b 0 = Ȳ b 1 X, S 2 ɛ = nj=1 (Y j Ŷ j ) 2. n 2

Równanie ŷ = b 0 + b 1 x nazywamy oszacowaniem równania regresji (5). Wykorzystuje si e go predykcji wartości zmiennej Y przy zadanej wartości zmiennej X = x, czyli Y = b 0 + b 1 x ± S ɛ. Niech σb 2 oraz σ 2 1 b oznaczaja 0 wariancje statystyk odpowiednio b 1 oraz b 0. Ich estymatorami sa zmienne losowe określone wzorami Sb 2 1 = Sɛ 2 1 nj=1 (X i X) 2 S 2 b 0 = S 2 ɛ 1 n + X 2 nj=1 (X i X) 2

Jeśli sk ladnik b l edu ɛ w modelu (4) ma rozk lad normalny, wówczas statystyki t 0 = b 0 β 0 S b0, t 1 = b 1 β 1 S b1, maja rozk lady Studenta o n 2 stopniach swobody. Niech t α oznacza kwantyl rzedu 1 α 2 rozk ladu Studenta o n 2 stopniach swobody. Przedzia ly postaci [ ] b0 t α S b0, b 0 + t α S b0, [ b1 t α S b1, b 1 + t α S b1 ] s a estymatorami przedzia lowymi parametrów odpowiednio β 0 i β 1 na poziomie ufności 1 α.

Testy istotności dla parametrów β 0 i β 1 Za lóżmy, podobnie jak wyżej, że sk ladnik b l edu ɛ w modelu (4) ma rozk lad normalny. Chcemy zweryfikować hipoteze zerowa, iż wspó lczynnik regresji β 1 równy jest β 1,0. Hipoteza zerowa ma wiec postać H 0 : β 1 = β 1,0, przeciwko hipotezie alternatywnej H 1 : β 1 < β 1,0 (lub β 1 > β 1,0, lub β 1 β 1,0 ). Analogicznie, za lóżmy, że chcemy zweryfikować hipoteze zerowa, iż wyraz wolny β 0 równy jest β 0,0. Hipoteza ta ma postać H 0 : β 0 = β 0,0, przeciwko hipotezie alternatywnej H 1 : β 0 < β 0,0 (lub β 0 > β 0,0, lub β 0 β 0,0 ).

Statystyka testu wykorzystywana do testowania hipotezy H 0 jest zmienna t 1 (strona 13), w której β 1 zastapiony jest wartościa β 1,0, zak ladana w hipotezie zerowej. W przypadku testowania hipotezy H 0 statystyka testu jest zmienna t 0, w której wspó lczynnik β 0 zastapiony jest przez β 0,0, tj. wartość zak ladana w hipotezie zerowej. Obszary krytyczne w obu testach konstruujemy analogicznie, jak w przypadku testu Studenta dla wspó lczynnika korelacji ρ.