Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

Podobne dokumenty
Badanie zależności cech

Rozdział 8. Regresja. Definiowanie modelu

STATYSTYKA MATEMATYCZNA

Motto. Czy to nie zabawne, że ci sami ludzie, którzy śmieją się z science fiction, słuchają prognoz pogody oraz ekonomistów? (K.

PAKIETY STATYSTYCZNE

Jednoczynnikowa analiza wariancji. Wnioskowanie dla jednoczynnikowej ANOV-y. Porównywanie poszczególnych średnich

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Zmienne losowe typu ciągłego. Parametry zmiennych losowych. Izolda Gorgol wyciąg z prezentacji (wykład III)

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Ekonometria dla IiE i MSEMat Z7

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Wykład 9 Wnioskowanie o średnich

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stosowana Analiza Regresji

Przypomnienie: wykłady i zadania kursu były zaczerpnięte z podręczników: Model statystyczny Format danych

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

KORELACJE I REGRESJA LINIOWA

Wykład 4 Związki i zależności

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 1-2

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

METODY STATYSTYCZNE W BIOLOGII

MODELE LINIOWE. Dr Wioleta Drobik

Wykład 4 Testy zgodności. dystrybuanta rozkładu populacji dystrybuanty rozkładów dwóch populacji rodzaj rozkładu wartości parametrów.

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

S t a t y s t y k a, część 3. Michał Żmihorski

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Przenoszenie niepewności

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Prawdopodobieństwo i rozkład normalny cd.

STATYSTYKA MATEMATYCZNA

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Zajęcia 2. Estymacja i weryfikacja modelu ekonometrycznego

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Wprowadzenie do analizy korelacji i regresji

Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Weryfikacja hipotez statystycznych

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

STATYSTYKA MATEMATYCZNA

Ekonometria egzamin 07/03/2018

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

ANALIZA REGRESJI SPSS

Badanie normalności rozkładu

Ćwiczenia 10. Analiza regresji. Część I.

Metody prognozowania: Jakość prognoz Wprowadzenie (1) 6. Oszacowanie przypuszczalnej trafności prognozy

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Testowanie hipotez statystycznych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym.

WYKŁAD 8 ANALIZA REGRESJI

Wykład 8: Testy istotności

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Scenariusz lekcji matematyki z wykorzystaniem komputera

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Prognozowanie na podstawie modelu ekonometrycznego

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ

PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

PDF created with FinePrint pdffactory Pro trial version

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Estymacja parametrów rozkładu cechy

Ćwiczenia IV

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

INFORMATYKA W SELEKCJI

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka MODELE

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Elementy statystyki STA - Wykład 5

STATYSTYKA MATEMATYCZNA

Transkrypt:

Wkład 1: Prosta regresja liniowa Statstczn model regresji liniowej Dane dla prostej regresji liniowej Przedział ufności i test parametrów Przedział ufności dla średniej odpowiedzi Interwał prognoz (dla przszłch obserwacji)

Przkład: Obserwujem 9 mężczzn w wieku od 0 do 9 lat. Mierzm grubość fałdu skórnego i gęstość ciała: ID Iskin Den 1 1.7 1.093 1.56 1.063 3 1.45 1.078 4 1.5 1.056 5 1.51 1.073

Wkres punktow z linią najmniejszch kwadratów:

Dane wjściowe SAS (będziem często użwać oprogramowania do obliczeń): The SAS Sstem 17:47 Thursda, Jul, 004 5 The REG Procedure Model: MODEL1 Dependent Variable: Den Root MSE 0.00854 R-Square 0.704 Dependent Mean 1.06403 Adj R-Sq 0.7173 Coeff Var 0.805 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t 99% Confidence Limits Intercept 1 1.16300 0.00656 177.30 <.0001 1.14574 1.1806 Iskin 1-0.0631 0.00414-15.3 <.0001-0.07403-0.051

Excel, dla tch samch danch:

SPSS, dla tch samch danch:

Przpomnienie Mieliśm zmienną objaśniającą (X) i zmienną odpowiedzi (Y). Zrobiliśm wkres punktowe, regresję najmniejszch kwadratów i korelację. Linia najmniejszch kwadratów to a + bx, gdzie a jest punktem przecięcia, a b jest nachleniem. Nie rozróżnialiśm jeszcze prób od populacji.

Stuacja dla prostej regresji liniowej Pomślim o linii regresji obliczonej z prób jako oszacowaniu linii regresji dla populacji. Tpe of line Least Squares Regression equation of line slope -intercept Ch. General ŷ a bx b a Ch. 10 Sample ˆ b0 b1x b 1 b 0 Ch. 10 Population 0 1x 1 0

Model statstczn dla prostej regresji liniowej: x i i i 0 1 Dane: n obserwacji w formie (x 1, 1 ), (x, ), (x n, n ). Przjmuje się, że odchlenia i są niezależne i normalne ze średnią 0 i odchleniem standardowm. Parametrami modelu są: 0, 1 oraz.

Dwie grup o tm samm SD i różnmi średnimi:

Regresja liniowa: wiele grup ze średnimi zależnmi liniowo od x

Rzeczwiste dane nie będą dokładnie pasować do linii regresji: DANE = DOPASOWANIE + RESZTA DOPASOWANIE to linia regresji (najmniejszch kwadratów) RESZTA ( szum ),, jest różnica międz danmi a tm, co przewiduje linia.

Wzor (nie zapamiętuj) Dane: Statstki pochodne: 1 1 1 1 0 0 1 1, 1 ) (, 1 ) (1 ) ˆ (, ˆ,, r n r SE b t n r s s x x s SE n n r s n s b b bx b a s s r b b b x i b i i i i x ) ( ) ( ) )( (, 1 ) (, 1 ) (,,, x x x x r n s n x x s x n i i i i i i x

Przedział ufności i test istotności dla nachlenia regresji i przechwtwania Przedział ufności na poziomie C dla przecięcia 0: * 0 b b t SE Przedział ufności na poziomie C dla nachlenia 1: * 1 b b t SE t * z tabeli t z n- stopniami swobod 0 1

Ćwiczenie: Oblicz przedział ufności dla średniego spadku gęstości ciała na jednostkę grubości fałd skór. Porównaj z wnikami obok.

Statstka: Testowanie hipotez dla H0: 1=0 t b 1 SE b1 To t-test z df = n. Gd 1 =0, to = 0, tj. średnia nie zmienia się z x. W przeciwnm razie mam "zależność liniową", tj. niezerowe nachlenie (populacjne). Oprogramowanie zapewni statstkę testu i dwustronną P-wartość. W większości przpadków tlko interpretujem wniki.

Test jednostronnej hipotez dla H0: 1=0 Statstka: t b 1 SE b1 df = n.

Ćwiczenie: Cz istnieje "liniowa zależność" międz gęstością ciała a grubością fałdu skórnego?

Przedział ufności dla średniej odpowiedzi, : * ˆ t SE ˆ To zależ od x. Specjalistczne oprogramowanie oblicza ten przedział. Na niektórch wkresach rozrzutu będą to pasma krzwoliniowe (wewnętrzne) wokół danch. Uwaga: Dane szacunkowe dla średniej mają mniejszą zmienność niż te dla indwidualnch obserwacji.

To zależ od x. Specjalistczne oprogramowanie poda ten przedział. Na niektórch wkresach rozrzutu będą to krzwoliniowe (zewnętrzne) pasma wokół danch. Uwaga: indwidualne obserwacje mają większą zmienność, więc ten przedział jest szersz niż poprzedni. Przedział predkcjne dla pojednczej obserwacji: * ˆ t SEˆ

PU dla średnich i dla indwidualnch obserwacji DEN (w funkcji Lskin)

Któr jest któr?

Wniki SAS: przedział ufności dla indwidualnch obserwacji i średnich (w zależności od x = lskin)

Średnia odpowiedź ma liniow związek z x. Ab sprawdzić, cz relacja jest w przbliżeniu liniowa, wkonuje się wkres rozproszenia lub wkres resztkow. Założenia dla regresji: Kolejne odpowiedzi są niezależne od siebie. Możem wkrć problem, odnosząc wartości rezdualne do numeru obserwacji (czasu). Dla każdej ustalonej wartości x odpowiedź zmienia się zgodnie z rozkładem normalnm. Ab sprawdzić założenie normalności, można wkonać normaln wkres kwantlow reszt.

Założenia dla regresji: cd. Odchlenie standardowe dla (σ) jest takie samo dla wszstkich wartości x. Wartość ta jest nieznana. Ab potwierdzić stałą zmienność, patrzm na wkres resztkow. Należ również sprawdzić odstające lub wpłwowe obserwacje przed użciem regresji (mogą one dramatcznie wpłnąć na wniki).

Reszta w funkcji nr obserwacji

Reszta w funkcji Lskin

(ładn) Normaln wkres kwantlow reszt