= n = = i i. Sprawdzenie istotności współczynnika korelacji ρ dla populacji na podstawie współczynnika r

Podobne dokumenty
Wnioskowanie statystyczne dla korelacji i regresji.

BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH - ANALIZA KORELACJI PROSTEJ

STATYSTYKA MATEMATYCZNA

Statystyka. Katarzyna Chudy Laskowska

FUNKCJE DWÓCH ZMIENNYCH

Laboratorium Metod Statystycznych ĆWICZENIE 2 WERYFIKACJA HIPOTEZ I ANALIZA WARIANCJI

opisać wielowymiarową funkcją rozkładu gęstości prawdopodobieństwa f(x 1 , x xn

Materiały do wykładu 7 ze Statystyki

STATYSTYKA MATEMATYCZNA

KORELACJA KORELACJA I REGRESJA. X, Y - cechy badane równocześnie. Dane statystyczne zapisujemy w szeregu statystycznym dwóch cech

Linie regresji II-go rodzaju

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 7-8

E K O N O M E T R I A (kurs 10 godz.)

ANALIZA ZALEŻNOŚCI DWÓCH ZMIENNYCH ILOŚCIOWYCH

ĆWICZENIE 3 ANALIZA WSPÓŁZALEŻNOŚCI ZJAWISK MASOWYCH

Analiza ZALEśNOŚCI pomiędzy CECHAMI (Analiza KORELACJI i REGRESJI)

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

ma rozkład normalny z wartością oczekiwaną EX = EY = 1, EZ = 0 i macierzą kowariancji

Prawdopodobieństwo i statystyka r.

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 5

W loterii bierze udział 10 osób. Regulamin loterii faworyzuje te osoby, które w eliminacjach osiągnęły lepsze wyniki:

Prawdopodobieństwo i statystyka r.

( X, Y ) będzie dwuwymiarową zmienną losową o funkcji gęstości

INSTRUKCJA LABORATORIUM Metrologia techniczna i systemy pomiarowe.

BADANIE CHARAKTERYSTYKI DIODY PÓŁPRZEWODNIKOWEJ

Teoria i praktyka. Wyższa Szkoła Turystyki i Ekologii. Fizyka. WSTiE Sucha Beskidzka Fizyka

Natalia Nehrebecka. Dariusz Szymański

Statystyka opisowa. Statystyczne metody badania prawidłowości w zakresie struktury zjawisk masowych

r h SSE EKONOMETRIA - WZORY p pk Opracowała: Joanna Kisielińska 1 Metody doboru zmiennych Metoda Nowaka Metoda Hellwiga Metoda momentów

Regresja linowa metoda najmniejszych kwadratów. Tadeusz M. Molenda Instytut Fizyki US

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Tablica Galtona. Mechaniczny model rozkładu normalnego (M10)

. Wtedy E V U jest równa

brak podstaw do odrzucenia hipotezy zerowej.

Miary statystyczne. Katowice 2014

Rachunek Prawdopodobieństwa i statystyka W 10: Analizy zależności pomiędzy zmiennymi losowymi (danymi empirycznymi)

Zadanie 1. Rzucamy symetryczną monetą tak długo, aż w dwóch kolejnych rzutach pojawią się,,reszki. Oblicz wartość oczekiwaną liczby wykonanych rzutów.

MODEL SHARP A - MIARY WRAŻLIWOŚCI

Liniowe relacje między zmiennymi

Statystyka Opisowa 2014 część 3. Katarzyna Lubnauer

INFORMATYKA W CHEMII Dr Piotr Szczepański

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

ma rozkład normalny z nieznaną wartością oczekiwaną m

x, y środek ciężkości zbioru

Józef Beluch Akademia Górniczo-Hutnicza w Krakowie. Wpływ wag współrzędnych na wyniki transformacji Helmerta

Opracowanie wyników pomiarów

Oznaczenia: -średnia arytmetyczna -średnia geometryczna. x H -średnia harmoniczna

Statystyka powtórzenie (II semestr) Rafał M. Frąk

będą niezależnymi zmiennymi losowymi o tym samym 2 x

Rozdział 3 Zastosowanie języka SQL w statystyce opisowej 1 Wprowadzenie

RACHUNEK NIEPEWNOŚCI POMIARU

STATYSTYKA MATEMATYCZNA

WSPÓŁZALEŻNOŚĆ PROCESÓW MASOWYCH Co w Sylabusie?

Średnia arytmetyczna Klasyczne Średnia harmoniczna Średnia geometryczna Miary położenia inne

STATYSTYCZNY OPIS UKŁADU CZĄSTEK

Podstawowe pojcia. Metody probabilistyczne i statystyka Wykład 7: Statystyka opisowa. Rozkłady prawdopodobiestwa wystpujce w statystyce.

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Johann Wolfgang Goethe Def.

będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

Natalia Nehrebecka. Zajęcia 4

Zadanie 1. ), gdzie 1. Zmienna losowa X ma rozkład logarytmiczno-normalny LN (, . EX (A) 0,91 (B) 0,86 (C) 1,82 (D) 1,95 (E) 0,84

Weryfikacja hipotez dla wielu populacji

Podstawy opracowania wyników pomiarowych, analiza błędów

Statystyka powtórzenie (II semestr) Rafał M. Frąk

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Niepewności pomiarów. DR Andrzej Bąk

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

Statystyka. Analiza zależności. Rodzaje zależności między zmiennymi występujące w praktyce: Funkcyjna

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

MATEMATYKA STOSOWANA W INŻYNIERII CHEMICZNEJ

BQR FMECA/FMEA. czujnik DI CPU DO zawór. Rys. 1. Schemat rozpatrywanego systemu zabezpieczeniowego PE

Wykład 6. Klasyczny model regresji liniowej

O testowaniu jednorodności współczynników zmienności

Podstawy analizy niepewności pomiarowych (I Pracownia Fizyki)

Dane modelu - parametry

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Statystyka Inżynierska

Natalia Nehrebecka. Wykład 2

Rys. 1. Interpolacja funkcji (a) liniowa, (b) kwadratowa, (c) kubiczna.

Wiek statku a prawdopodobieństwo wystąpienia wypadku na morzu analiza współzależności

termodynamika fenomenologiczna p, VT V, teoria kinetyczno-molekularna <v 2 > termodynamika statystyczna n(v) to jest długi czas, zachodzi

JEDNOWYMIAROWA ZMIENNA LOSOWA

Fizyka, technologia oraz modelowanie wzrostu kryształów

Laboratorium fizyczne

REGRESJA LINIOWA. gdzie

System finansowy gospodarki

POPULACJA I PRÓBA. Próba reprezentatywna. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 5 1

STATYSTYKA MATEMATYCZNA WYKŁAD 2 ESTYMACJA PUNKTOWA

65120/ / / /200

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

STATYSTYKA OPISOWA. Państwowa Wyższa Szkoła Zawodowa w Koninie. Materiały pomocnicze do ćwiczeń. Materiały dydaktyczne 17 ARTUR ZIMNY

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH. dr Michał Silarski

L.Kowalski zadania ze statystyki opisowej-zestaw 5. ZADANIA Zestaw 5

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

RACHUNEK NIEPEWNOŚCI POMIARU

EKONOMETRIA I Spotkanie 1, dn

Prawdopodobieństwo i statystyka r.

Transkrypt:

STATYSTKA I ANALIZA DANYCH LAB V I VI. Pla laboatoum V VI Koelacja współczk koelacj Peasoa testowae stotośc współczka koelacj Regesja lowa egesja posta, ocea dopasowaa, testowae stotośc współczków egesj Test ch-kwadat badae zgodośc ozkładu z ozkładem zadam ezaleŝośc zme. jakoścowch. Badae koelacj Koelacja stwedzee faktu wstępowaa zaleŝośc mędz zmem oaz zbadae sł keuku tej zaleŝośc Wzó a oblczee współczka koelacj Peasoa: ( ( ( ( gdze oaz to śede atmetczch zmech, S oaz S to ch odchlea stadadowe, C(, to kowaacja C(, ( ( C(, [.0,.0] S S Własośc: maa smetcza; emaowaa uomowaa (moŝa poówwać koelacje dla óŝch zestawów zmech; wskazuje e tlko słę, ale keuek; podata a obsewacje skaje. Zwkle pzjmuje sę: > 0.7 sla koelacja, > 0.9 badzo sla koelacja, < 0.3 bak koelacj Spawdzee stotośc współczka koelacj ρ dla populacj a podstawe współczka Itucja: spawdzam cz oblczo współczk (ocea koelacj w póbe moŝe bć uŝt w odeseu do populacj? Testowa układ hpotez: H0: ρ 0 (badae cech są eskoelowae w populacj geealej H: ρ 0 (badae cech są skoelowae; ajczęścej bada sę hpotezę ρ 0, ale moŝa teŝ ρ > 0 lub ρ < 0 Wbó statstk testowej: test t (gd < 30, uwaga: czasem podaje sę < 50 lub < 00 ozkład t-studeta test z (gd duŝe kozstam z ozkładu omalego gdze to lczość pa zmech X Y. Następe poówuje sę otzmaą watość z watoścą ktczą odcztaą z tablc testu t-studeta dla - stop swobod (lub ozkładu omalego, gd duŝe pzjętego pozomu stotośc α (uwaga: odcztując z tablc watość testu dla α/ w pzpadku testu dwustoego lub α w pzpadku jedostoego. W pzpadku, gd: t oblczeowe > t tablcowe stwedza sę stotość współczka koelacj lowej a pozome stotośc α (odzucam H0 a zecz H. - -

3. Aalza egesj Regesja wjaśee w sposób aaltcz kształtowaa sę watośc jedej zmeej losowej (zmeej zaleŝej lub objaśaej pod wpłwem ej zmeej (ezaleŝej lub objaśającej lub ch (welu zmech. Itucja: poszukujem fukcj matematczej ŷ, któa będze dobze pasowała do empczch pa obsewacj obu zmech: ŷ + ε gdze ŷ f(x jest teoetczm pozomem zmeej odczt. z fukcj egesj (elemet sstematcz, ε jest zmeą losową (po co uwzględa sę ε? Albo w modelu e moŝa uwzględć wszstkch zmech objaśającch albo pzjęta aaltcza postać fukcj egesj e odpowada dokłade zeczwstej fome zaleŝośc mędz badam zmem Lowa egesja posta ajpostsz odzaj egesj, w któch zaleŝość zmech moŝa opsać za pomocą l postej: ŷ + ε a + b + ε gdze zmea zaleŝa (objaśaa zmea ezaleŝa (objaśająca a współczk keukow (slope b waz wol (paamet stuktuale lowej fukcj egesj (tecept ε błąd losow Czasem zamast ŷ a + b uŝwa sę otacj ŷ β + β 0 Metoda ajmejszch kwadatów - MNK Rzeczwste dae (,,,(, Watość teoetcza fukcj egesj: f ( Błąd oszacowaa: - ˆ ŷ to tzw. watość esztowa lub ezduum. Watośc ezduów pow bć jak ajmejsze dla wszstkch,,. Wskaźk ozposzea suma kwadatów ezduów ma bć mmal: ( ˆ ( ( C(, ( S a b a Gd a ma dodatą (ujemą watość, to pod wpłwem wzostu zmeej ezaleŝej o jedostkę, zmea zaleŝa ośe (maleje śedo o a jedostek Gd a 0, to bak wpłwu zmeej ezaleŝej a zaleŝą Waz wol b zadko posada sesową tepetację S S - -

Ocea dopasowaa fukcj egesj do dach empczch Całkowta suma kwadatów óŝc: ( SSR + ( ( ˆ + ( ˆ gdze SSR egesja suma kwadatów odchleń (część wjaśoa pzez zbudowa model, esztowa suma kwadatów odchleń (część ewjaśoa pzez zbudowa model. Współczk detemacj ajwaŝejsza maa dopasowaa fukcj egesj do dach empczch (współczk koelacj podeso do kwadatu Stosuek zmeośc wjaśoej pzez model do zmeośc całkowtej: R SSR Odchlee stadadowe składka esztowego błąd stadadow (pzecęte odchlee watośc empczch od watośc teoetczch: S Test stotośc współczków ówaa egesj lowej test F SłuŜ do wefkacj hpotez o baku zaleŝośc lowej pomędz badam cecham populacj opea sę a współczku achlea postej wlczom dla pób. W ogólośc (gd zmech objaśającch jest węcej Ŝ jeda: test odpowada a ptae, cz steje low zwązek egesj mędz zmeą zaleŝą Y a któąkolwek zmeą objaśającą (ezaleŝą X, jak to sugeuje hpotetcze ówae egesj. Podstawowe wauk stosowaa: Poma a skal pzedzałowej Nomalość ozkładu badach cech Testowa układ hpotez: H0: a 0 (bak zaleŝośc lowej H: a 0 (zaleŝość lowa steje W ogólośc, gd ozwaŝam welu zmech β + + β k k + β 0 : H0: β β β k 0 (gdze k to lczba zmech ezaleŝch X H: e wszstke β są ówe 0 Na dzsejszch zajęcach teesuje as pzpadek k. Oblczee watośc statstk testowej: F( k, ( k+ SSR MSR MS dla k ( F(, SSR / k /( ( k+ Watość ktcza szukaj w tablcach ozkładu F-Sedecoa dla daego α mam dwa stope swobod pewsz odpowada k, dug lczbe zmech pomejszoej o k + ; czl dla jedej zmeej szukam watośc odpowadającej stopom (,- - 3 -

4. Test ch kwadat Aalza zmech jakoścowch (płeć, status, kolo, maka, odzaj, pofl, upodobaa Dae (zmee omale; zmee o watoścach upoządkowach; zmee loścowe mogą bć zdsketzowae (welkość masta, dochodów; zmee skategozowae Wkozstae: test wkozstując statstkę o ozkładze słuŝ do oce zgodośc ozkładu z ozkładem zadam lub oce zaleŝośc mędz zmem jakoścowm Ogaczee: Rozkład ch kwadat moŝa stosować, gd oczekwaa lczość w kaŝdej klase jest ówa pzajmej 5 (w pzecwm aze, tzeba połączć klas, ab otzmać wększą lczość. Tabca welodzelcza (kotgecj; dla pa zmech dwudzelcza ZałoŜea ozaczea: zmea ma k katego kodowach jako,,..., k zmea ma l katego kodowach jako,,..., l póba lcz pa pa (, j jest lczbą wstąpea w póbe pa obsewacj (, j Schemat postępowaa: Sfomułuj pzpuszczee co do populacj pzez okeślee odpowedch hpotez Test zgodośc ch-kwadat: H0 : zgodość z pewm załoŝom ozkłądem (p. takm, Ŝe wszstke watośc są ówo pawdopodobe; H : bak zgodośc (daa populacja ma ozkład ezgod z tm, któ podaa w H0 Test ezaleŝośc ch-kwadat: H0 : bak zaleŝośc zmech jakoścowch (czl zgodość z ozkładem oczekwam; H : zaleŝość Zaotuj zaobsewowae lczośc puktów pomaowch w poszczególch klasach Oblcz częstośc wstępowaa pewch zdazeń pzez załoŝeu pawdzwośc H0 (tzw. lczośc oczekwae w óŝch klasach (kategoach Jak oblczć watość oczekwaą? w pzpadku załoŝoch pawdopodobeństw p (p. wszstke p ówe p N w pzpadku tablc dwudzelczej (z zasad ezaleŝośc pawdopodob. P( A B P( A P( B? skąd sę to wzęło? j (suma zędu -tego (suma kolum j-tej / suma j / N j p j N p p j N /N j /N N j / N - 4 -

Pzjmj pozom ufośc α (zazwczaj badzo mał Stope swobod: Jeśl wkozstuje sę dae do estmacj paametów ozkładu pawdopodobeństwa okeśloego pzez hpotezę zeową, to dla kaŝdego paametu estmowaego a podstawe tch dach tac sę dodatkow stopeń swobod ( zmea (k -; zmee (k -(l -. Sumacza lczość pozwala e zać jedej jakejkolwek lczośc klas; czl edukuje lczbę stop swobod o. Okeśl obsza ktcz: (watość odcztae z tablc testu dla odpowedego α df;. Zbadaj óŝcę mędz watoścam obsewowam oczekwam (wzó a statstkę Watość statstk: k ( O l lub ( Oj k j j j O j obsewowaa lczość w klase oaz klase j od ag. obseved j hpotetcza (oczekwaa pz załoŝeu pawdzwośc H 0 lczość w klase oaz klase j od ag. epected Podejmj deczję a podstawe watośc statstk obszau ktczego: Oblczee watośc statstk dla tablc o postac: a b c d ( ad bc ( a+ b( c+ d( a+ c( b+ d Popawka Yatesa (gd < 40 któakolwek z lczośc oczekwach < 5: ( ad bc / ( a+ b( c+ d( a+ c( b+ d Sama watość statstk pozwala tlko a stwedzee, cz wstępuje współzaleŝość. Potzebe są e ma do badaa sł zwązku Watośc od 0 (bak zwązku do (całkowte powązae Współczk Ф-Yula (tablca Φ Współczk V-Camea (ogólejsz V m( l, k, gdze k oaz l są wmaam tablc welodzelczej. Współczk kotgecj Peasoa C (uwaga: ma(c < : C + - 5 -