STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009

Podobne dokumenty
Metoda najmniejszych kwadratów

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Stosowana Analiza Regresji

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Wykład 12 Testowanie hipotez dla współczynnika korelacji

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Prawdopodobieństwo i statystyka r.

Porównanie dwóch rozkładów normalnych

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Analiza autokorelacji

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

STATYSTYKA MATEMATYCZNA, LISTA 3

Korelacja krzywoliniowa i współzależność cech niemierzalnych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Prawdopodobieństwo i statystyka r.

STATYSTYKA MATEMATYCZNA

Testowanie hipotez statystycznych.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Stosowana Analiza Regresji

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Wnioskowanie statystyczne. Statystyka w 5

Porównanie wielu rozkładów normalnych

Prawdopodobieństwo i statystyka

Statystyczna analiza danych

Uogólniona Metoda Momentów

Centralne twierdzenie graniczne

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Statystyka, Ekonometria

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Zmienna bazowa. 100(1 α)% przedział ufności dla µ: 100(α)% test hipotezy dla µ = µ 0; odrzucić, jeżeli Ȳ nie jest w przedziale

Testowanie hipotez statystycznych.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

1 Gaussowskie zmienne losowe

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Szkice do zajęć z Przedmiotu Wyrównawczego

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Porównanie błędu predykcji dla różnych metod estymacji współczynników w modelu liniowym, scenariusz p bliskie lub większe od n

Metody Ekonometryczne

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Zmienna losowa dwuwymiarowa i korelacja

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

Estymacja parametrów rozkładu cechy

Estymatory nieobciążone

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

O ŚREDNIEJ STATYSTYCZNEJ

1 Podstawy rachunku prawdopodobieństwa

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

PDF created with FinePrint pdffactory Pro trial version

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Stosowana Analiza Regresji

Wykład 5 Teoria eksperymentu

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Testowanie hipotez statystycznych

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

METODY STATYSTYCZNE W BIOLOGII

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Spis treści 3 SPIS TREŚCI

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Przyczynowość Kointegracja. Kointegracja. Kointegracja

MODELE I METODY STATYSTYKI MATEMATYCZNEJ

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Transkrypt:

STATYSTYKA MATEMATYCZNA WYKŁAD 7 23 listopada 2009

Wykład 6 (16.XI.2009) zakończył się zdefiniowaniem współczynnika korelacji: E X µ x σ x Y µ y σ y = T

WSPÓŁCZYNNIK KORELACJI ρ X,Y = ρ Y,X (!)

WSPÓŁCZYNNIK KORELACJI. ESTYMACJA ρ = Cov(X, Y ) Var(X )Var(Y ) R = S xy S x S y, S xy = 1 n n i=1 (X i X )(Y i Ȳ )

WSPÓŁCZYNNIK KORELACJI. ESTYMACJA Rozkład: f (µx,µ y,σ x,σ y,ρ)(r) = n 2 n (1 ρ2 ) (n 1)/2 (1 r 2 ) (n 4)/2 1 x n 2 0 (1 ρrx) n 1 1 x dx 2 (ryst)

WSPÓŁCZYNNIK KORELACJI. ESTYMACJA Rozkład: f (µx,µ y,σ x,σ y,ρ)(r) = n 2 n (1 ρ2 ) (n 1)/2 (1 r 2 ) (n 4)/2 1 x n 2 0 (1 ρrx) n 1 1 x dx 2 (ryst) Obciążenie:

WSPÓŁCZYNNIK KORELACJI. ESTYMACJA Rozkład: f (µx,µ y,σ x,σ y,ρ)(r) = n 2 n (1 ρ2 ) (n 1)/2 (1 r 2 ) (n 4)/2 1 x n 2 0 (1 ρrx) n 1 1 x dx 2 (ryst) Obciążenie: E (µx,µ y,σ x,σ y,ρ)(r) = ρ [ 1 1 ρ2 2n + O( 1 n 2 ) ]

WERYFIKACJA HIPOTEZY H : ρ = 0 Rozkład: f H (r) = Γ(n 1 2 ) ( ) πγ( n 2 1 r 2 (n 4)/2 2 )

WERYFIKACJA HIPOTEZY H : ρ = 0 Rozkład: f H (r) = Γ(n 1 2 ) ( ) πγ( n 2 1 r 2 (n 4)/2 2 ) t = R 1 R 2 n 2 tn 2

Obszar krytyczny testu H : ρ = 0, K : ρ 0: { ( R n 2 > t 1 R 2 n 2 1 α )} 2

Obszar krytyczny testu H : ρ = 0, K : ρ 0: { ( R n 2 > t 1 R 2 n 2 1 α )} 2 { R > tn 2 2 (1 α 2 ) } n 2 + tn 2 2 (1 α 2 )! R:wkkor.R

Jeżeli dwuwymiarowa zmienna losowa (X, Y ) ma dwuwymiarowy rozkład normalny i współczynnik korelacji jest równy zeru, to zmienne losowe X oraz Y są niezależne, ale..! R:Wsp-kor-lin-0.R! R:Wsp-kor-nlin.R

WSPÓŁCZYNNIKI REGRESJI Reg Y (x) = a yx x + b yx Reg X (y) = a xy y + b xy a yx = ρ σ y = Cov(X, Y ), b yx = µ y a yx µ x σ x σ 2 x a xy = ρ σ x = Cov(X, Y ), b xy = µ x a xy µ y σ y σ 2 y

WSPÓŁCZYNNIKI REGRESJI Z PRÓBY â yx = S xy S 2 x â xy = S xy S 2 y, ˆbyx = Ȳ â yx X, ˆbxy = X â xy Ȳ

WSPÓŁCZYNNIKI REGRESJI Z PRÓBY. Rozkład. Sx 2 n 2 (â 1 R 2 yx a yx ) t n 2 S 2 y Sy 2 n 2 (â 1 R 2 xy a xy ) t n 2 S 2 x

WSPÓŁCZYNNIKI REGRESJI Z PRÓBY. Rozkład. 1 S 2 x + X 2 S 2 x n 2 S 2 y 1 R 2 ) (ˆbyx b yx t n 2 1 S 2 y + Ȳ 2 S 2 y n 2 S 2 x 1 R 2 ) (ˆbxy b xy t n 2

ZASTOSOWANIA: przykłady

ZASTOSOWANIA: przykłady Pary zmiennych losowych; dwuwymiarowa zmienna losowa

ZASTOSOWANIA: przykłady Pary zmiennych losowych; dwuwymiarowa zmienna losowa Dwie cechy mierzone na tym samym osobniku (np. wzrost ciężar, wiek IQ)

ZASTOSOWANIA: przykłady Pary zmiennych losowych; dwuwymiarowa zmienna losowa Dwie cechy mierzone na tym samym osobniku (np. wzrost ciężar, wiek IQ) Sortowanie na cechy zastępcze

ZASTOSOWANIA: przykłady Pary zmiennych losowych; dwuwymiarowa zmienna losowa Dwie cechy mierzone na tym samym osobniku (np. wzrost ciężar, wiek IQ) Sortowanie na cechy zastępcze Wyniki kolokwium i egzaminu końcowego [KM s.261]

ZASTOSOWANIA: przykłady Pary zmiennych losowych; dwuwymiarowa zmienna losowa Dwie cechy mierzone na tym samym osobniku (np. wzrost ciężar, wiek IQ) Sortowanie na cechy zastępcze Wyniki kolokwium i egzaminu końcowego [KM s.261] Czas pracy rylca wielkość zdarcia rylca [BŁ]

ZASTOSOWANIA: przykłady Pary zmiennych losowych; dwuwymiarowa zmienna losowa Dwie cechy mierzone na tym samym osobniku (np. wzrost ciężar, wiek IQ) Sortowanie na cechy zastępcze Wyniki kolokwium i egzaminu końcowego [KM s.261] Czas pracy rylca wielkość zdarcia rylca [BŁ] Cechy fizyczne (psychiczne) bliźniąt jednojajowych

ZASTOSOWANIA: przykłady Pary zmiennych losowych; dwuwymiarowa zmienna losowa Dwie cechy mierzone na tym samym osobniku (np. wzrost ciężar, wiek IQ) Sortowanie na cechy zastępcze Wyniki kolokwium i egzaminu końcowego [KM s.261] Czas pracy rylca wielkość zdarcia rylca [BŁ] Cechy fizyczne (psychiczne) bliźniąt jednojajowych?

MODEL LINIOWY Retrospekcja i sformułowanie ogólnego modelu liniowego (1) Model pomiaru X = µ + ε, ε N(0, σ) (2) Pomiar wielkości związanych X = µ x + ε x, Y = µ y + ε y, (X, Y ) N(µ x, µ y, σ x, σ y, ρ) (3) Prosty przykład ogólnego modelu pomiaru (OZNACZENIA!) Y 1 = β 0 + β 1 + ε 1 Y 2 = β 0 + β 2 + ε 2 Y 3 = β 0 + β 3 + ε 3 Y 4 = β 0 + β 1 + β 2 + β 3 + ε 4 T

MODEL LINIOWY Ważenie trzech ciał Y 1 = β 0 + β 1 + ε 1 Y 2 = β 0 + β 2 + ε 2 Y 3 = β 0 + β 3 + ε 3 Y 4 = β 0 + ε 4 Y 1 = β 0 + β 1 + ε 1 Y 2 = β 0 + β 2 + ε 2 Y 3 = β 0 + β 3 + ε 3 Y 4 = β 0 + β 1 + β 2 + β 3 + ε 4 β 0 = Y 4 β 1 = Y 1 Y 4 β 2 = Y 2 Y 4 β 3 = Y 3 Y 4 Var(β 0 ) = σ 2, Var(β 1 )=Var(β 2 )=Var(β 3 )=2σ 2 β 0 = (Y 1 + Y 2 + Y 3 Y 4 )/2 β 1 = (Y 1 Y 2 Y 3 + Y 4 )/2 β 2 = ( Y 1 + Y 2 Y 3 + Y 4 )/2 β 3 = ( Y 1 Y 2 + Y 3 + Y 4 )/2 Var(β 0 ) = σ 2, Var(β 1 )=Var(β 2 )=Var(β 3 )=σ 2

MODEL LINIOWY Y 1 = x 1,1 β 1 + x 1,2 β 2 + + x 1,k β k + ε 1 Y 2 = x 2,1 β 1 + x 2,2 β 2 + + x 2,k β k + ε 2... Y n = x n,1 β 1 + x n,2 β 2 + + x n,k β k + ε n n k, x i,j - dowolne liczby rzeczywiste

MODEL LINIOWY. Przykłady Przykład 1. Ciało o jednostkowej masie umieszczono w polu działania siły o nieznanej wartości F. Obserwuje się położenia Y 1, Y 2,..., Y n ciała w wybranych chwilach t 1, t 2,..., t n. Obserwacje obarczone są błędami losowymi ε 1, ε 2,..., ε n. Zadanie polega na oszacowaniu F. Model: Y i = 1 2 Ft2 i + ε i, i = 1, 2,..., n

MODEL LINIOWY. Przykłady Przykład 2. Pewien produkt chemiczny można wytwarzać bez użycia katalizatorów, ale przypuszcza się, że w obecności katalizatorów wydajność procesu będzie większa. Dysponujemy dwoma katalizatorami A i B, których możemy użyć w dowolnych dawkach x 0, y 0. Spodziewamy się, że wtedy wydajność procesu będzie równa µ + αx + βy, gdzie α i β są nieznanymi efektywnościami katalizatorów A i B, a µ jest wydajnością procesu prowadzonego bez użycia katalizatorów. W celu oszacowania wielkości µ, α i β, rejestrujemy wydajność procesu przy wybranych poziomach x i, i = 1, 2,..., n, oraz y j, j = 1, 2,..., m, katalizatorów A i B i otrzymujemy wyniki Y i,j = µ + αx i + βy j + ε i,j, i = 1, 2,..., n; j = 1, 2,..., m, gdzie ε i,j są błędami losowymi.

MODEL LINIOWY. Przykłady Przykład 3 (regresja drugiego stopnia). Jeżeli wartość oczekiwana zmiennej losowej Y jest funkcją E(Y ) = α 0 + α 1 t + α 2 t 2 pewnej zmiennej t i zadanie polega na wnioskowaniu o współczynnikach α 0, α 1, α 2 na podstawie obserwacji zmiennej losowej Y dla wybranych wartości t, to zadanie można sformułować w postaci modelu liniowego Y 1 = x 1,1 β 1 + x 1,2 β 2 + + x 1,k β k + ε 1 Y 2 = x 2,1 β 1 + x 2,2 β 2 + + x 2,k β k + ε 2... Y n = x n,1 β 1 + x n,2 β 2 + + x n,k β k + ε n gdzie k = 3, x i,1 = 1, x i,2 = t i, x i,3 = ti 2, β 1 = α 0, β 2 = α 1, β 3 = α 2.

MODEL LINIOWY. Przykłady Przykład 4 (porównanie dwóch technologii, zabiegów, leków, itp.). Jeżeli µ 1 jest średnią wartością badanej cechy (wydajności, zużycia surowca, stanu zdrowia) dla pewnej technologii, zaś µ 2 taką samą wielkością dla pewnej innej, konkurencyjnej technologii i gdy na podstawie n 1 obiektów wykonanych według pierwszej technologii oraz n 2 obiektów wykonanych według drugiej mamy oszacować lub porównać µ 1 i µ 2, to model obserwacji ma postać Y i = x i,1 µ 1 + x i,2 µ 2 + ε i, gdzie x i,1 = 1, x i,2 = 0, gdy Y i pochodzi z pierwszej technologii, a x i,1 = 0, x i,2 = 1, gdy Y i pochodzi z drugiej technologii. W takich i podobnych sytuacjach może nas interesować nie tyle oszacowanie wielkości µ 1 i µ 2, ile oszacowanie różnicy µ 1 µ 2.

MODEL LINIOWY Y 1 = x 1,1 β 1 + x 1,2 β 2 + + x 1,k β k + ε 1 Y 2 = x 2,1 β 1 + x 2,2 β 2 + + x 2,k β k + ε 2 Y n = x n,1 β 1 + x n,2 β 2 + + x n,k β k + ε n n k, x i,j - dowolne liczby rzeczywiste

MODEL LINIOWY Y 1 = x 1,1 β 1 + x 1,2 β 2 + + x 1,k β k + ε 1 Y 2 = x 2,1 β 1 + x 2,2 β 2 + + x 2,k β k + ε 2 Y n = x n,1 β 1 + x n,2 β 2 + + x n,k β k + ε n n k, x i,j - dowolne liczby rzeczywiste Rozwiązanie (MNK): ˆβ = arg min β n i=1 (Y i (x i,1 β 1 + x i,2 β 2 +... + x i,k β k )) 2

MODEL LINIOWY Y = Xβ + ε Y 1 x 1,1 x 1,2... x 1,k β 1 ε 1 Y Y = 2..., X= x 2,1 x 2,2... x 2,k..., β = β 2..., ε= ε 2... Y n x n,1 x n,2... x n,k β k ε n ε 1, ε 2,..., ε n iid N(0, σ), n k, rx(x) = k

MODEL LINIOWY Estymacja wektora współczynników regresji β ˆβ = ( X T X ) 1 X T Y Var(ˆβ) = ( X T X ) 1 σ 2 ˆβ N (β, ( X T X ) 1 σ 2 )

MODEL LINIOWY Estymacja wariancji σ 2 Ŷ = Xˆβ n RSS = Y Ŷ 2 = (Y i Ŷ i ) 2 i=1 RSS σ 2 χ 2 n k 1 ˆσ 2 = RSS n k 1

Przypadek szczególny: model pomiaru Y i = µ + ε i, i = 1, 2,..., n ˆµ = 1 n n Y i, RSS = i=1 1 1 X=..., 1 XT X = n n (Y i Ȳ ) 2, ˆσ 2 = 1 n (Y i n 1 Ȳ )2 i=1 i=1

Przypadek szczególny: model E(Y x) = a + bx ( )