Wnioskowanie statystyczne dla korelacji i regresji.

Podobne dokumenty
KORELACJA KORELACJA I REGRESJA. X, Y - cechy badane równocześnie. Dane statystyczne zapisujemy w szeregu statystycznym dwóch cech

BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH - ANALIZA KORELACJI PROSTEJ

opisać wielowymiarową funkcją rozkładu gęstości prawdopodobieństwa f(x 1 , x xn

Linie regresji II-go rodzaju

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

FUNKCJE DWÓCH ZMIENNYCH

Statystyka. Katarzyna Chudy Laskowska

Natalia Nehrebecka. Dariusz Szymański

Regresja linowa metoda najmniejszych kwadratów. Tadeusz M. Molenda Instytut Fizyki US

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 7-8

( ) ( ) ( ) ( ) ( )( ) ( ) ( ) 2. r s. ( i. REGRESJA (jedna zmienna) e s = + Y b b X. x x x n x. cov( (kowariancja) = (współczynnik korelacji) = +

STATYSTYKA MATEMATYCZNA

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 5

Rachunek Prawdopodobieństwa i statystyka W 10: Analizy zależności pomiędzy zmiennymi losowymi (danymi empirycznymi)

L.Kowalski zadania ze statystyki opisowej-zestaw 5. ZADANIA Zestaw 5

E K O N O M E T R I A (kurs 10 godz.)

W loterii bierze udział 10 osób. Regulamin loterii faworyzuje te osoby, które w eliminacjach osiągnęły lepsze wyniki:

. Wtedy E V U jest równa

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Materiały do wykładu 7 ze Statystyki

Prawdopodobieństwo i statystyka r.

Prawdopodobieństwo i statystyka r.

Statystyka Opisowa 2014 część 3. Katarzyna Lubnauer

( X, Y ) będzie dwuwymiarową zmienną losową o funkcji gęstości

ANALIZA ZALEŻNOŚCI DWÓCH ZMIENNYCH ILOŚCIOWYCH

Statystyka powtórzenie (II semestr) Rafał M. Frąk

Statystyka. Analiza zależności. Rodzaje zależności między zmiennymi występujące w praktyce: Funkcyjna

MODEL SHARP A - MIARY WRAŻLIWOŚCI

INSTRUKCJA LABORATORIUM Metrologia techniczna i systemy pomiarowe.

Zadanie 1. ), gdzie 1. Zmienna losowa X ma rozkład logarytmiczno-normalny LN (, . EX (A) 0,91 (B) 0,86 (C) 1,82 (D) 1,95 (E) 0,84

ma rozkład normalny z wartością oczekiwaną EX = EY = 1, EZ = 0 i macierzą kowariancji

ma rozkład normalny z nieznaną wartością oczekiwaną m

= n = = i i. Sprawdzenie istotności współczynnika korelacji ρ dla populacji na podstawie współczynnika r

Wykład 6. Klasyczny model regresji liniowej

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

będą niezależnymi zmiennymi losowymi o tym samym 2 x

Projekt 3 3. APROKSYMACJA FUNKCJI

Opracowanie wyników pomiarów

STATYSTYKA MATEMATYCZNA WYKŁAD 2 ESTYMACJA PUNKTOWA

STATYSTYKA MATEMATYCZNA WYKŁAD 1. Wiadomości wstępne

Tablica Galtona. Mechaniczny model rozkładu normalnego (M10)

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Teoria i praktyka. Wyższa Szkoła Turystyki i Ekologii. Fizyka. WSTiE Sucha Beskidzka Fizyka

POPULACJA I PRÓBA. Próba reprezentatywna. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 5 1

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

Statystyka Matematyczna Anna Janicka

Józef Beluch Akademia Górniczo-Hutnicza w Krakowie. Wpływ wag współrzędnych na wyniki transformacji Helmerta

będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

Laboratorium fizyczne

Dane modelu - parametry

Niepewności pomiarów. DR Andrzej Bąk

k k M. Przybycień Rachunek Prawdopodobieństwa i Statystyka Wykład 13-2

WSPÓŁZALEŻNOŚĆ PROCESÓW MASOWYCH Co w Sylabusie?

REGRESJA LINIOWA. gdzie

Podstawy analizy niepewności pomiarowych (I Pracownia Fizyki)

Regresja liniowa. (metoda najmniejszych kwadratów, metoda wyrównawcza, metoda Gaussa)

Wykład 4 Testy zgodności. dystrybuanta rozkładu populacji dystrybuanty rozkładów dwóch populacji rodzaj rozkładu wartości parametrów.

L.Kowalski PODSTAWOWE TESTY STATYSTYCZNE WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

STATYSTYKA MATEMATYCZNA

Podstawowe pojcia. Metody probabilistyczne i statystyka Wykład 7: Statystyka opisowa. Rozkłady prawdopodobiestwa wystpujce w statystyce.

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

x, y środek ciężkości zbioru

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Strona: 1 1. CEL ĆWICZENIA

MATEMATYKA STOSOWANA W INŻYNIERII CHEMICZNEJ

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

(liniowy model popytu), a > 0; b < 0

1. Relacja preferencji

f f x f, f, f / / / METODA RÓŻNIC SKOŃCZONYCH niech N = 2 (2 równania różniczkowe zwyczajne liniowe I-rz.) lub jedno II-rzędu

Analiza ZALEśNOŚCI pomiędzy CECHAMI (Analiza KORELACJI i REGRESJI)

Regresja REGRESJA

Statystyka powtórzenie (II semestr) Rafał M. Frąk

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Matematyka ubezpieczeń majątkowych r. t warunkowo niezależne i mają (brzegowe) rozkłady Poissona:

Różniczkowanie funkcji rzeczywistych wielu zmiennych. Matematyka Studium doktoranckie KAE SGH Semestr letni 2008/2009 R. Łochowski

STATYSTYKA OPISOWA. Państwowa Wyższa Szkoła Zawodowa w Koninie. Materiały pomocnicze do ćwiczeń. Materiały dydaktyczne 17 ARTUR ZIMNY

Zadanie 1. Rzucamy symetryczną monetą tak długo, aż w dwóch kolejnych rzutach pojawią się,,reszki. Oblicz wartość oczekiwaną liczby wykonanych rzutów.

Matematyka II. Wykład 11. Całka podwójna. Zamiana na całkę iterowaną. Obliczanie pól obszarów i objętości brył.

Liniowe relacje między zmiennymi

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

RACHUNEK NIEPEWNOŚCI POMIARU

Podstawowe zadanie statystyki. Statystyczna interpretacja wyników eksperymentu. Zalety statystyki II. Zalety statystyki

Ocena dopasowania modelu do danych empirycznych

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

STATYSTYKA MATEMATYCZNA

ZMIENNE LOSOWE WIELOWYMIAROWE

Weryfikacja hipotez dla wielu populacji

AKADEMIA MORSKA W SZCZECINIE

Statystyka Inżynierska

Permutacje. } r ( ) ( ) ( ) 1 2 n. f = M. Przybycień Matematyczne Metody Fizyki I Wykład 2-2

Metody obliczeniowe - Budownictwo semestr 2 - wykład nr 3 Nr: 1 Metody obliczeniowe wykład nr 3 aproksymacja i interpolacja pojęcie modelu regresji

Wykład ze statystyki. Maciej Wolny

Wyrażanie niepewności pomiaru

ROZKŁADY ZMIENNYCH LOSOWYCH

Transkrypt:

STATYSTYKA MATEMATYCZNA WYKŁAD 6 Woskowae statstcze dla korelacj regresj.

Aalza korelacj Założee: zmea losowa dwuwmarowa X, Y) ma rozkład ormal o współczku korelacj ρ.

X, Y cech adae rówocześe. X X X... X Y Y Y... Y 3

4 ) ) ) ) ), Y Y X X Y Y X X S S Y X Cov R Y X

Uwaga: a) ) ) ) ) ) 5

R X X Y ) X Y Y ) XY 6

Estmator R jest estmatorem zgodm asmptotcze eocążom współczka korelacj ρ. Estmator te ma asmptotcze rozkład ormal ρ N, ρ, próa mus ć ardzo lcza ). 7

Uwaga. +R U l -R +ρ N l, -ρ -3, ). Jeśl ρ, to R U - -R ma rozkład T. 8

Zatem przedzał ufośc dla współczka korelacj ρ próa ardzo lcza) ma postać: R u α R R ; R + uα R współczk korelacj z pró, lczeość pró, α pozom ufośc, u α odcztujem w talc z zależośc Φ u α ) α/ 9

Dla małch pró ) przedzał ufośc dla współczka korelacj ρ ma postać: A B e e ; A B e + e +, gdze + R uα A l R 3, + R uα B l + R 3 u α odcztujem w talc z zależośc Φ u α ) α/

Werfkacja hpotez dotczącch współczka korelacj. Zakładam, że cecha X,Y) ma rozkład ormal,. Wsuwam dwe hpotez: H ρ ρ ), H - jedą z trzech poższch hpotez. Rozpatrujem statstkę zór krtcz wg tael: H Statstka U Zór krtcz Odczt k ρ K ; k > < k; + ) Φ k ) α / ρ ρ > ρ +R +ρ -R -ρ l - l -3 K < k; + ) Φ k ) α ρ < K ; k > Φ k ) α ρ Deczje: Jeśl U K to H odrzucam, Jeśl U K to e ma podstaw do odrzucea H.

Przkład. Badao zależość mędz wdatkam a reklamę a wsokoścą sprzedaż. Dla pró 4 elemetowej otrzmao r,8. Sprawdzm a pozome stotośc,5 hpotez: H ρ,85) H ρ,85).

Rozwązae. Wartość statstk wos u -,86. Zór krtcz ma postać K ;,96 > <,96; + ) Poeważ u K to e ma podstaw do odrzucea H. 3

B adae stotośc współczka korelacj Wsuwam dwe hpotez: H ρ ) rak korelacj pomędz zmem), H jedą z trzech poższch hpotez. Rozpatrujem statstkę zór krtcz wg tael: H Statstka U Zór krtcz Odczt k ρ ; k > < k; + ) ρ > R R P T > k K ) α K < k;+ ) P T > k) α ρ < K ; k > T > k) α P Deczje: Jeśl u K to H odrzucam, Jeśl u K to e ma podstaw do odrzucea H. 4

Woskowae dla współczków regresj β + Nech ędze prostą regresj, a ˆ + prostą regresj wzaczoą a podstawe pró. β 5

6 Współczk, prostej regresj wzaczam stosując metodę ajmejszch kwadratów MNK). Chcem wzaczć mmum fukcj: *) e S ) ) ˆ ), gdze e ˆ azwam resztam modelu regresj. Uwaga. e

MNK: Należ wzaczć prostą regresj tak a suma pól kwadratów ła mmala. 7

8 Olczając pochode cząstkowe fukcj *) przrówując je do zera otrzmujem układ rówań ormalch: ) ) ) ) S S

9 Rozwązując otrzma układ rówań otrzmam wzor a przlżoe wartośc współczków ) ) ) ) ) ), cov X X Y s Y X r s s

Waracja resztowa: Waracja resztowa to średa z pól kwadratów zudowach a resztach odzwercedlająca stopeń dopasowaa prostej regresj do dach statstczch. Nech e $, gdze $ + wted e s e czl s e ) r s s Y e e s e s ozacza średe stadardowe) odchlee od prostej regresj.

Współczk determacj ) ) ) ), cov ) ) ) ˆ r S S Y X e R Y X + Uwaga:, R

Stadardowe łęd oszacowaa współczków prostej regresj. ) ) s s e ) ) ) ) ) s s s s s X e +

3 Stosujem eked zaps X Y s s )) )) ˆ ± ± + lu ) ˆ )) )) e s s s X Y ± + ± ±

Przedzał ufośc dla β,, ; dla pozomu ufośc α mam: β uα S ); + uα S ) gdze u α odcztujem z talc rozkładu Studeta: T > u ) α P α. S ) stadardowe łęd współczków prostej regresj. 4

Werfkacja hpotez dla β,, ; dla pozomu stotośc α rozpatrujem test dla poszczególch parametrów β,,. Wsuwam dwe hpotez: H β β ), H jedą z trzech poższch hpotez. 5

Rozpatrujem statstkę zór krtcz wg tael: H Statstka Zór krtcz Odczt k β ; k > < k; + ) β β > β β U β S ) K T > k) α P K < k;+ ) T > k) α β < K ; k > P T > k) α P Deczje: Jeśl u K to H odrzucam, Jeśl u K to e ma podstaw do odrzucea H. 6

Uwaga Jeśl adam stotość parametru β to przjmujem β tz. H β ) W modelach regresj pożądae jest odrzucee hpotez H β ). Przkład Z populacj dla której X, Y) ma rozkład ormal porao próę elemetową olczoo, że prosta regresj z pró ma postać: Y,35,4 X,5),) Na pozome stotośc,5 sprawdź stotość współczka β. 7

Rozpatrujem hpotez H β ) H β < ) Wartość statstk wos u 4., Zór krtcz ma postać K ;, 66 >. Poeważ olczoa wartość statstk ależ do zoru krtczego to odrzucam hpotezę H β ), zatem wk testu e podważa stotośc współczka β. 8

Progoza puktowa to przewdwaa wartość zmeej Y odpowadająca wartośc τ zmeej X. * τ) + τ 9

3 Stadardow łąd progoz ) ) + + + + e e S S S τ τ τ τ gdze S e odchlee resztowe

łąd względ progoz puktowej: δ τ S τ * τ % 3

Progoza przedzałowa dla poz. ufośc α. * * τ ) u S ; τ ) + u α u α odcztujem z talc rozkładu Studeta: τ T > u ) α P α. α S τ 3

Badae lowośc fukcj regresj - test ser. Badam populację ze względu a dwe cech X Y. Losujem próę - elemetową, ). Na podstawe tej pró chcem sprawdzć cz fukcja regresj jest lowa. Prostm testem do werfkacj tej własośc jest test ser. Nech + ędze prostą regresj wzaczoą a podstawe pró metodą ajmejszch kwadratów. Elemetom pró przpsujem smol a lu : a - gd > +, pukt leż ad prostą) - gd elemetów dla którch zachodz rówość e rozpatrujem). Sere to podcąg złożoe z jedakowch smol. < + pukt leż pod prostą) 33

Rozpatrujem hpotez H fukcja regresj jest lowa), H fukcja regresj e jest lowa), Stosujem statstkę: U lcza ser Zór krtcz: K ; k> gdze k odcztujem z talc dla pozomu stotośc α lcz oraz, gdze - lcza smol a, - lcza smol, Deczje: Jeśl U K to H odrzucam, Jeśl U K to e ma podstaw do odrzucea H. 34

Przkład. Badao zależość mędz wkam testów z dwóch przedmotów przeprowadzom w pewej uczel. Dla pró wlosowach studetów otrzmao astępujące lcz puktów: X 6 4 33 47 55 7 77 8 9 94 Y 5 34 6 83 9 4 4 33 5 45 7 Prosta regresj z pró ma postać Y + 5. Sprawdzm a pozome stotośc,5 hpotezę że zależość mędz tm cecham jest lowa. 35

Rozwązae. Otrzmam astępując cąg smol:,, a, a, a, a,,,,,, Lcza ser wos u 3 Z talc rozkładu ser odcztujem K ; 3> Poeważ u K to odrzucam hpotezę H, zatem możem sądzć, że zależość mędz wkam testów e jest lowa. 36