Statystyka. Analiza zależności. Rodzaje zależności między zmiennymi występujące w praktyce: Funkcyjna

Podobne dokumenty
Statystyka Opisowa 2014 część 3. Katarzyna Lubnauer

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 7-8

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 5

Wnioskowanie statystyczne dla korelacji i regresji.

Liniowe relacje między zmiennymi

ma rozkład normalny z nieznaną wartością oczekiwaną m

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Prawdopodobieństwo i statystyka r.

AKADEMIA MORSKA W SZCZECINIE

Tablica Galtona. Mechaniczny model rozkładu normalnego (M10)

Materiały do wykładu 7 ze Statystyki

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

. Wtedy E V U jest równa

Różniczkowanie funkcji rzeczywistych wielu zmiennych. Matematyka Studium doktoranckie KAE SGH Semestr letni 2008/2009 R. Łochowski

Statystyka. Katarzyna Chudy Laskowska

Statystyka Inżynierska

L.Kowalski PODSTAWOWE TESTY STATYSTYCZNE WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

L.Kowalski zadania ze statystyki opisowej-zestaw 5. ZADANIA Zestaw 5

Probabilistyka i statystyka. Korelacja

będą niezależnymi zmiennymi losowymi o tym samym 2 x

ma rozkład normalny z wartością oczekiwaną EX = EY = 1, EZ = 0 i macierzą kowariancji

( X, Y ) będzie dwuwymiarową zmienną losową o funkcji gęstości

W loterii bierze udział 10 osób. Regulamin loterii faworyzuje te osoby, które w eliminacjach osiągnęły lepsze wyniki:

POPULACJA I PRÓBA. Próba reprezentatywna. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 5 1

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

f f x f, f, f / / / METODA RÓŻNIC SKOŃCZONYCH niech N = 2 (2 równania różniczkowe zwyczajne liniowe I-rz.) lub jedno II-rzędu

opisać wielowymiarową funkcją rozkładu gęstości prawdopodobieństwa f(x 1 , x xn

STATYSTYKA MATEMATYCZNA WYKŁAD 1. Wiadomości wstępne

Podstawowe zadanie statystyki. Statystyczna interpretacja wyników eksperymentu. Zalety statystyki II. Zalety statystyki

STATYSTYKA MATEMATYCZNA WYKŁAD 2 ESTYMACJA PUNKTOWA

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

WSPÓŁZALEŻNOŚĆ PROCESÓW MASOWYCH Co w Sylabusie?

Zadanie 1. ), gdzie 1. Zmienna losowa X ma rozkład logarytmiczno-normalny LN (, . EX (A) 0,91 (B) 0,86 (C) 1,82 (D) 1,95 (E) 0,84

Prawdopodobieństwo i statystyka r.

ANALIZA KORELACJI DEFINICJA ZALEŻNOŚCI KORELACYJNEJ, RODZAJE ZALEŻNOŚCI KORELACYJNYCH KLASYFIKACJA METOD ANALIZY ZALEŻNOŚCI STATYSTYCZNYCH

BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH - ANALIZA KORELACJI PROSTEJ

będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

Średnia harmoniczna (cechy o charakterze ilorazu np. Prędkość, gęstość zaludnienia)

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

dev = y y Miary położenia rozkładu Wykład 9 Przykład: Przyrost wagi owiec Odchylenia Mediana próbkowa: Przykłady Statystyki opisowe Σ dev i =?

Planowanie eksperymentu pomiarowego I

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

PDF created with FinePrint pdffactory Pro trial version WIII/1

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Statystyka Opisowa Wzory

Podstawy analizy niepewności pomiarowych (I Pracownia Fizyki)

Średnia arytmetyczna Klasyczne Średnia harmoniczna Średnia geometryczna Miary położenia inne

Podstawy opracowania wyników pomiarowych, analiza błędów

FUNKCJE DWÓCH ZMIENNYCH

VI. TWIERDZENIA GRANICZNE

wyniki serii n pomiarów ( i = 1,..., n) Stosując metodę największej wiarygodności możemy wykazać, że estymator wariancji 2 i=

KORELACJA KORELACJA I REGRESJA. X, Y - cechy badane równocześnie. Dane statystyczne zapisujemy w szeregu statystycznym dwóch cech

OBLICZANIE NIEPEWNOŚCI METODĄ TYPU B

Wykład ze statystyki. Maciej Wolny

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

O testowaniu jednorodności współczynników zmienności

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH. dr Michał Silarski

Wyznaczanie oporu naczyniowego kapilary w przepływie laminarnym.

Statystyczne charakterystyki liczbowe szeregu

STATYKA. Cel statyki. Prof. Edmund Wittbrodt

5. OPTYMALIZACJA NIELINIOWA

Matematyka ubezpieczeń majątkowych r. t warunkowo niezależne i mają (brzegowe) rozkłady Poissona:

x, y środek ciężkości zbioru

Regresja REGRESJA

STATYSTYKA OPISOWA WYKŁAD 3,4

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

TARCIE CIĘGIEN O POWIERZCHNIĘ WALCOWĄ WZÓR EULERA

Materiały wspomagające wykład ze statystyki. Maciej Wolny

( ) ( ) ( ) ( ) ( ) ( )

Współczynnik korelacji rangowej badanie zależności między preferencjami

KALIBRACJA NIE ZAWSZE PROSTA

ZJAZD 1. STATYSTYKA OPISOWA wstępna analiza danych

IV. ZMIENNE LOSOWE DWUWYMIAROWE

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Zadanie 1. Rzucamy symetryczną monetą tak długo, aż w dwóch kolejnych rzutach pojawią się,,reszki. Oblicz wartość oczekiwaną liczby wykonanych rzutów.

Wyrażanie niepewności pomiaru

JEDNOWYMIAROWA ZMIENNA LOSOWA

3. OPTYMALIZACJA NIELINIOWA

Jego zależy od wysokości i częstotliwości wypłat kuponów odsetkowych, ceny wykupu, oczekiwanej stopy zwrotu oraz zapłaconej ceny za obligację.

Instrukcja do wykonania zadania. Masa ciała. Wys. Ciała

ROZKŁADY ZMIENNYCH LOSOWYCH

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Metoda Monte-Carlo i inne zagadnienia 1

ĆWICZENIE 5 TESTY STATYSTYCZNE

= , t 1872, = , t 1872,0.95

k k M. Przybycień Rachunek Prawdopodobieństwa i Statystyka Wykład 13-2

EKSTREMA FUNKCJI EKSTREMA FUNKCJI JEDNEJ ZMIENNEJ. Tw. Weierstrassa Każda funkcja ciągła na przedziale domkniętym ma wartość najmniejszą i największą.

Linie regresji II-go rodzaju

ZMIENNA LOSOWA JEDNOWYMIAROWA POJĘCIE ZMIENNEJ LOSOWEJ

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH I PRACOWNIA FIZYCZNA INSTYTUT FIZYKI UJ BIOLOGIA 2016

[, ] [, ] [, ] ~ [23, 2;163,3] 19,023 2,7

OKREŚLANIE NIEPEWNOŚCI POMIARÓW (poradnik do Laboratorium Fizyki)

Podprzestrzenie macierzowe

Portfel złożony z wielu papierów wartościowych

UOGÓLNIONA ANALIZA WRAŻLIWOŚCI ZYSKU W PRZEDSIĘBIORSTWIE PRODUKUJĄCYM N-ASORTYMENTÓW. 1. Wprowadzenie

SPRZEDAŻ PONIŻEJ KOSZTU WŁASNEGO W PRZEDSIĘBIORSTWIE WIELOASORTYMENTOWYM

WYZNACZANIE WARTOŚCI ENERGII ROZPRASZANEJ PODCZAS ZDERZENIA CIAŁ

Podstawowe pojcia. Metody probabilistyczne i statystyka Wykład 7: Statystyka opisowa. Rozkłady prawdopodobiestwa wystpujce w statystyce.

KONCEPCJA WIELOKRYTERIALNEGO WSPOMAGANIA DOBORU WARTOŚCI PROGOWEJ W BIOMETRYCZNYM SYSTEMIE UWIERZYTELNIANIA. Adrian Kapczyński Maciej Wolny

Teoria i praktyka. Wyższa Szkoła Turystyki i Ekologii. Fizyka. WSTiE Sucha Beskidzka Fizyka

Transkrypt:

Aalza zależośc Rodzaje zależośc mędzy zmeym występujące w praktyce: Fukcyja wraz ze zmaą wartośc jedej zmeej astępuje ścśle określoa zmaa wartośc drugej zmeej (p. w fzyce: spadek swobody gt s ) tochastycza wraz ze zmaą wartośc jedej zmeej astępuje zmaa rozkładu prawdopodobeostwa drugej zmeej (zmaa: rozkładów warukowych, średch waracj) Korelacyja wraz ze zmaą wartośc jedej zmeej astępuje średch drugej zmeej zmaa wartośc

Zmee będą stochastycze ezależe, jeśl rozkłady warukowe jedej zmeej, dla dowolych wartośc drugej, będą detycze. Zmee będą eskorelowae, jeśl średe warukowe będą take same. tąd wdad, że zmee mogą byd eskorelowae, ale stochastycze zależe (p. średe warukowe są take same, ale różą sę waracją)

Aby zbadad ezależośd stochastyczą dwóch cech ależy dae zestawd w tablcy kotygecyjej (krzyżowej, welodzelczej, korelacyjej). Tablca ta ma postad: Y\X x x x s * y s * y s * y r r r r s r * * j * * * s gdze s * j j * j r j 3

Warukem koeczym wystarczającym stochastyczej ezależośc cech jest, aby częstośc w rozkładach łączym brzegowych spełały relację j * * j dla każdej pary wskaźków (, j), gdze =,,, r, j =,,, s. Podstawą do ocey sły zależośc mędzy badaym cecham są różce pomędzy lczeboścam j zaobserwowaym w łączym rozkładze empryczym a teoretyczym lczeboścam, które wystąpłyby, gdyby cechy były ezależe j j j 4

Dokładej, do ocey sły ezależośc służy r s (j j) Z j j Z przyjmuje wartośc z przedzału [;(g-)], gdze g = m(r, s). Z =, gdy cechy są stochastycze ezależe, a Z = (g-), gdy występuje zależośd fukcyja. Na podstawe Z została określoa uormowaa mara sły zależośc cech, zwaa współczykem zbeżośc V Cramera. V Z (g V przyjmuje wartośc z przedzału [;]. ozacza stochastyczą ezależośd, a zależośd fukcyją. 5 )

Omówoa mara dotyczy ocey sły zależośc pomędzy cecham w zborowośc skooczoej. Do woskowaa o stochastyczej ezależośc dwóch zmeych w populacj geeralej a podstawe wyków otrzymaych w próbe moża zweryfkowad odpowedą hpotezę eparametryczą za pomocą testu. Hpoteza zerowa ma zwykle postad zdaa cechy w populacj geeralej są stochastycze ezależe, co w zapse formalym wygląda astępująco: H : gdze: p, j p p,,j, j p, j p, p, j =,,,r, j =,,,s. ozacza łączy rozkład prawdopodobeostwa zmeej (X,Y), ozacza brzegowy rozkład prawdopodobeostwa zmeej Y, ozacza brzegowy rozkład prawdopodobeostwa zmeej X. 6

H : tatystyka - cechy w populacj geeralej są stochastycze zależe. tatystyka sprawdzająca Z daa jest wzorem gdze, j p, j j p, p, j Z j r j s ( j j s j tatystyka Z, przy założeu prawdzwośc H, ma rozkład o (r-)(s-) stopach swobody. Zbór krytyczy określoy jest wzorem P(Z ), gdze α jest pozomem stotośc. Zatem zawsze, gdy Z hpotezę H odrzuca sę. j ) j r j j 7

Korelacja Do pomaru sły korelacj lowej mędzy loścowym cecham X Y (dla próby -elemetowej) służy współczyk korelacj Pearsoa, day wzorem: (x x)(y y) cov(x, Y) XY X Y rxy XY X X Y Y (x x) (y y) gdze: cov(x, Y) XY X Y X, Y odchylee stadardowe x, y wartośc cechy X oraz Y w -tej obserwacj 8 (x x)(y y)

Własośc:. Współczyk korelacj lowej Pearsoa r XY przyjmuje wartośc z przedzału *-;]. r XY = r Y X 3. r -XY = -r XY 4. r XY = ozacza brak korelacj lowej mędzy zmeym X Y 5. r XY = zależośd w postac fukcj lowej 9

W aalzach statystyczych zwykle przyjmuje sę, że: wartośd r XY pożej, brak zwązku lowego wartośd r XY pomędzy,,4 zależośd lowa wyraźa, ale ska wartośd r XY pomędzy,4,7 zależośd lowa umarkowaa wartośd r XY pomędzy,7,9 zależośd lowa zacząca wartośd r XY powyżej,9 zależośd lowa bardzo sla Uwaga: Przy elowej zależośc wartośd lczbowa współczyka korelacj jest ższa, ż wykałoby to z oczywstej sły zwązku mędzy cecham; wtedy odpowedą marą są stosuk korelacyje.

Do woskowaa o zależośc korelacyjej mędzy cecham w populacj geeralej moża zweryfkowad hpotezę o stotośc współczyka korelacj za pomocą astępującego testu, skostruowaego przy założeu, że (X,Y) mają dwuwymarowy rozkład ormaly: H : H : (H : ; H : ) Jeśl H jest prawdzwa, to statystyka t r r ma rozkład t-tudeta z - stopam swobody. r ozacza tu współczyk korelacj z próby, atomast ρ współczyk korelacj w populacj geeralej.

Obszar krytyczy opsay jest wzorem P( t t, ), gdze α ozacza pozom stotośc. Jeśl t t,, to H odrzucamy, w przecwym wypadku stwerdzamy brak podstaw do odrzucea H. Dla testów jedostroych (odpowedo) obszary krytycze:. (t t ) lub. P(t t, ), P, a H odrzucamy, gdy:. t t, lub. t t,.

Do badaa zależośc korelacyjej mędzy cecham jakoścowym (których wartośc moża uporządkowad) lub loścowym moża wykorzystad współczyk korelacj rag pearmaa r, określoy wzorem 6 d r 3 gdze a raga przyporządkowaa -tej obserwacj w perwszym cągu, b raga przyporządkowaa -tej obserwacj w drugm cągu, d = a b. Współczyk korelacj rag pearmaa r s przyjmuje wartośc z przedzału *-;] 3

Regresja O le badae zależośc korelacyjej moża przeprowadzd dla dwóch dowolych cech, to badae regresj przeprowadza sę dla takch cech, dla których zachodzą zwązk przyczyowoskutkowe (p. zależośd mędzy długoścą prawego lewego ramea moża badad zwązek korelacyjy, ale e ma zwązku typu regresja). Parametry fukcj regresj wyzacza sę za pomocą metody ajmejszych kwadratów. Ograczymy sę do przedstawea regresj lowej dwóch zmeych. W tym przypadku fukcje regresj są postac: ŷ x xˆ y 4

Wyzaczymy parametry fukcj regresj. Zmea X jest zmeą ezależą, a zmea Y zależą. Dla fukcj rozumowae jest aalogcze. Tutaj zmea Y jest zmeą ezależą, a zmea X zależą. Dyspoujemy rówoczesym obserwacjam zmeych X Y. Wartośc zmeych X, Y w -tej obserwacj ozaczmy przez x, y (odpowedo), a wartośc teoretycze tych zmeych w -tej obserwacj, wykające z fukcj regresj, ozaczymy odpowedo przez xˆ, ŷ. zukamy takch a oraz a, dla których fukcja F, określoa pożej, osąga mmum, tz. F( xˆ y, ) (y ŷ) (y x ) m 5 ŷ x

Warukem koeczym stea ekstremum jest zerowae sę perwszej pochodej, tz. tąd, po przekształceach otrzymamy układ rówao 6 y x y x x x ) ( F F

Rozwązaem układu jest: tatystyka Rówoważe a moża wyrazd astępująco: ( ) a cov(x, Y) XY X Y Y a r XY X X X X Waruek wystarczający dla mmum jest róweż spełoy (macerz drugej pochodej fukcj F w pukce (a,a ) jest dodato określoa). 7 a (x (x y x)(y a x) x y)

Dla regresj X względem Y aalogcze wzory mają postad: Rówoważe b moża wyrazd astępująco: b b (x (y x x)(y b y) y y) b cov(x, Y) Y XY Y X Y Y r XY X Y 8

Mamy fukcje regresj oraz. Parametr regresj α (β ) formuje as, o le jedostek przecęte zme sę wartośd zmeej zależej Y (X), gdy wartośd zmeej ezależej X (Y) wzrośe o jedą jedostkę; przy czym dodat zak parametru ozacza wzrost wartośc zmeej zależej, a ujemy - zmejszee wartośc tej zmeej. Różce pomędzy zaobserwowaym wartoścam zmeej zależej odpowedm wartoścam azywamy resztam. Ozaczmy je astępująco: u y ŷ ŷ x dla regresj z x dla regresj xˆ xˆ xˆ ŷ y x y 9

Lowe fukcje regresj wyzaczae a podstawe próby losowej metodą ajmejszych kwadratów mają astępujące własośc (sformułujemy je dla ŷ x, gdyż dla drugej regresj są aalogcze):. uma wartośc teoretyczych zmeej zależej jest rówa sume empryczych wartośc tej zmeej, tz.. ŷ. uma reszt wyos zero u (a x (y a ŷ ) ) a y x a ŷ z ( ) w. y

3. Pukt (x, y) ależy do wykresu fukcj regresj, bo po przekształceu drugego rówaa w (**) mamy y x. Do ocey dokładośc dopasowaa prostej regresj do daych empryczych ależy badad reszty. Waracja reszt daa jest wzoram: u u Perwastek kwadratowy z waracj ( ) jest odchyleem u z stadardowym reszt. Iterpretujemy go jako przecęte ( plus lub mus) odchylee zaobserwowaych wartośc zmeej zależej y (x ) od jej wartośc teoretyczych ŷ ( xˆ ). z z

Warację reszt moża wykorzystad do oszacowaa stadardowych błędów ocey parametrów a a (b b ), ozaczaych odpowedo:, (, ) a (x u x) a a b b b (y z y) a u (x x x) b z (y y y)

Wartośd otrzymaa a podstawe kokretej próby jest oceą średego odchylea wartośc współczyków regresj z prób -elemetowych od. Aalogcze terpretujemy,,. Z określea stadardowych błędów szacuku parametrów wdad, że dokładośd estymacj jest wprost proporcjoala do welkośc próby zakresu zmeośc zmeej ezależej, a odwrote proporcjoala do waracj reszt. Marą dopasowaa fukcj regresj do puktów empryczych jest współczyk determacj R. Wyraża sę wzorem: R a (ŷ (y y) y) R (xˆ (x 3 x) x) a b b regresjax wzgledem Y

Wartośd R ależy do przedzału *, + formuje as, jaka częśd obserwowaej w próbe całkowtej zmeośc zmeej zależej została wyjaśoa regresją lową. Ią marą jest współczyk determacj (zbeżośc), określoy wzorem (y (y ŷ ) y) (x (x regresjax wzgledem Y Wartośd ależy do przedzału *, + formuje as, jaka częśd obserwowaej w próbe całkowtej zmeośc zmeej zależej e została wyjaśoa regresją lową. xˆ ) x) 4

Oczywśce zachodz R Dla regresj lowej wartość współczyka determacj jest rówa kwadratow współczyka korelacj, tz. R r XY r YX Fukcja regresj ajczęścej wykorzystywaa jest do progozowaa (przewdywaa) wartośc zmeej zależej przy ustaloym pozome zmeej ezależej. 5