STATYSTYKA MATEMATYCZNA

Podobne dokumenty
Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

INFORMATYKA W SELEKCJI

STATYSTYKA MATEMATYCZNA

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

STATYSTYKA MATEMATYCZNA

Natalia Nehrebecka. Wykład 2

Badanie zależności cech

Natalia Nehrebecka. Zajęcia 3

Weryfikacja hipotez dla wielu populacji

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

RACHUNEK NIEPEWNOŚCI POMIARU

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Natalia Nehrebecka. Zajęcia 4

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

KORELACJE I REGRESJA LINIOWA

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Natalia Nehrebecka. Dariusz Szymański

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Statystyka i opracowanie danych W 5: Odkrywanie i analiza zależności pomiędzy zmiennymi losowymi (danymi empirycznymi)

Prawdopodobieństwo i statystyka r.

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

Przypomnienie: wykłady i zadania kursu były zaczerpnięte z podręczników: Model statystyczny Format danych

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

STATYSTYKA MATEMATYCZNA

MODELE LINIOWE. Dr Wioleta Drobik

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

CZĘŚĆ 6. MODEL REGRESJI, TREND LINIOWY ESTYMACJA, WNIOSKOWANIE

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Nieparametryczne Testy Istotności


ANALIZA REGRESJI SPSS

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

EKONOMETRIA Wykład 2: Metoda Najmniejszych Kwadratów

BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH - ANALIZA KORELACJI PROSTEJ

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Analiza zależności zmiennych ilościowych korelacja i regresja

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

METODY STATYSTYCZNE W BIOLOGII

Regresja liniowa i nieliniowa

PDF created with FinePrint pdffactory Pro trial version

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Rozdział 8. Regresja. Definiowanie modelu

Dobór zmiennych objaśniających

Regresja i Korelacja

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Parametry zmiennej losowej

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Metody predykcji analiza regresji

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

65120/ / / /200

METODY STATYSTYCZNE W BIOLOGII

Systemy Wspomagania Decyzji

STATYSTYKA MATEMATYCZNA

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

METODY STATYSTYCZNE W BIOLOGII

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

STATYSTYKA MATEMATYCZNA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

WPROWADZENIE DO ANALIZY KORELACJI I REGRESJI

Wprowadzenie do technik analitycznych Metoda najmniejszych kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Markowa. ZałoŜenia schematu Gaussa-

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Analiza współzależności zjawisk

Zadanie 1. ), gdzie 1. Zmienna losowa X ma rozkład logarytmiczno-normalny LN (, . EX (A) 0,91 (B) 0,86 (C) 1,82 (D) 1,95 (E) 0,84

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

STATYSTYKA MATEMATYCZNA

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Statystyka Inżynierska

STATYSTYKA MATEMATYCZNA

Wprowadzenie do analizy korelacji i regresji

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

Statystyka. Zmienne losowe

Transkrypt:

STATYSTYKA MATEMATYCZNA. Wkład wstępn. Teora prawdopodobeństwa element kombnatork. Zmenne losowe ch rozkład 3. Populacje prób danch, estmacja parametrów 4. Testowane hpotez statstcznch 5. Test parametrczne (na przkładze testu t ) 6. Test neparametrczne (na przkładze testu ) 7. Korelacja regresja lnowa nelnowa 8. Analza warancj

KORELACJA WSPÓŁCZYNNIK KORELACJI mara welkośc (sł) zależnośc dwóch zmennch losowch. Korelacja lnowa Pearsona oblczane testowane. Korelacja rangowa Spearmana oblczane testowane

WSPÓŁCZYNNIK KORELACJI PEARSONA

WSPÓŁCZYNNIK KORELACJI PEARSONA - defncja r ). cov( ), cov( gdze: ) ( ) ( n n, ) )( ( ), cov( n warancje kowarancja (n lczba par obserwacj w próbe)

WSPÓŁCZYNNIK KORELACJI PEARSONA - oblczane r cov(. ) n n n. Mara sł zależnośc dwóch zmennch (, ). Założena: zmenne, - cągłe normaln rozkład zmennch zależność lnowa 3. r przjmuje wartośc z przedzału [ -, ]

WSPÓŁCZYNNIK KORELACJI PEARSONA - przkład

WSPÓŁCZYNNIK KORELACJI PEARSONA - przkład

WSPÓŁCZYNNIK KORELACJI PEARSONA - przkład PRÓBA DANYCH MASA CIAŁA ZAW. TŁUSZCZU 89 8 88 7 66 4 59 3 93 9 73 5 8 9 r mt = 0.94 77 5 00 30 67 3

WSPÓŁCZYNNIK KORELACJI PEARSONA - testowane. Hpotez H 0 : brak korelacj mędz masą cała, a zaw. tłuszczu H : stneje korelacja mędz masą cała, a zaw. tłuszczu H 0 : r mt = 0 H : r mt 0. Założone maksmalne prawdopodobeństwo błędu MAX = 0.0 3. Test: 4. Prawdopodobeństwo błędu dla t=7.47 wnos T =0.00007 5. MAX > T 6. H t r mt N r mt ~ t N 7. Wstępuje dodatna korelacja mędz masą cała, a zawartoścą tłuszczu

WSPÓŁCZYNNIK KORELACJI SPEARMANA

WSPÓŁCZYNNIK KORELACJI SPEARMANA - defncja 6 N n N d d - różnca w rankngu zmennch. Mara zależnośc dwóch zmennch (,). Brak założeń dotczącch rozkładu zmennch 3. Brak założeń dotczącch lnowej zależnośc 4. Test neparametrczn 5. Wkorzstuje rankng obserwacj 6. Przjmuje wartośc z przedzału [ -, ]

WSPÓŁCZYNNIK KORELACJI SPEARMANA - przkład

WSPÓŁCZYNNIK KORELACJI SPEARMANA- przkład PRÓBA DANYCH. 8 samców Fregata magnfcens objętość [cm 3 ] częstotlwość [Hz] 760 59 040 566 440 473 550 46 730 465 740 53 300 484 3080 57 3370 488 3740 485. Powązane objętośc worka z częstotlwoścą wdawanego dźwęku ct = - 0.76

. Hpotez H 0 : brak korelacj mędz objętoścą, a częstotlwoścą H : stneje korelacja mędz objętoścą, a częstotlwoścą H 0 : ct = 0 H : ct 0. Założone maksmalne prawdopodob. błędu MAX = 0.0 3. Test: 4. Prawdopodobeństwo błędu dla t=-4.68 wnos T =0.0009 5. MAX > T 6. H t N ~ t N 7. Wstępuje ujemna korelacja mędz objętoścą worka, a częstotlwoścą dźwęku

KORELACJA określane sł zależnośc (podobeństwa) zmennch zależnch (prz pomoc współcznnka korelacj) Jeśl zmenne są zależne można próbować przewdzeć wartośc jednej zmennej na podstawe wartośc przjmowanch przez drugą REGRESJA określane modelu zależnośc zmennch wkorzstane tego modelu do przewdwana wartośc neznanch na podstawe wartośc obserwowanch (zmerzonch) Ten matematczn model to równane regresj

REGRESJA Regresja lnowa. Równane regresj lnowej. Estmacja współcznnków prostej regresj 3. Przkład równań regresj Regresja nelnowa. Dane pochodzące z rozkładu dwumanowego. Transformacje danch dwumanowch 3. Równane regresj logstcznej Dopasowane równana regresj

REGRESJA LINIOWA

RÓWNANIE REGRESJI zaw. tłuszczu 30 9 8 7 6 5 4 3 50 60 70 80 90 00 masa cała

RÓWNANIE REGRESJI 0 ) ( ), cov(

RÓWNANIE REGRESJI zaw. tłuszczu 30 9 8 7 6 5 4 3 0 50 60 70 80 90 00 masa cała nachlene błąd wraz woln 0

RÓWNANIE REGRESJI zaw. tłuszczu 30 Wartość zaobserwowana () 9 8 7 6 5 4 Wartość przewdzana (ŷ) 3 50 60 70 80 90 00 masa cała

METODA NAJMNIEJSZYCH KWADRATÓW Jak wznaczć parametr równana regresj? 0 Tak ab odległośc obserwacj od prostej bł jak najmnejsze: metoda najmnejszch kwadratów 30 zaw. tłuszczu 9 8 7 6 5 4 3 50 60 70 80 90 00 masa cała

METODA NAJMNIEJSZYCH KWADRATÓW zaw. tłuszczu 30 9 8 7 6 5 4 3 50 60 70 80 90 00 masa cała ( ) mnmum

METODA NAJMNIEJSZYCH KWADRATÓW mn ˆ 0 N N 0 0 0 0 0 N N 0 0 0 0 N N

METODA NAJMNIEJSZYCH KWADRATÓW 0 cov(, ) N N

WSPÓŁCZYNNIK REGRESJI A WSPÓŁCZYNNIK KORELACJI b cov(, ) r Współcznnk regresj nformuje, o le zmen sę wartość zmennej, jeśl wartość zmennej zmen sę o zmenna objaśnana, zmenna zależna, zmenna neznana (nedostępna, nemerzona, neobserwowana) zmenna objaśnająca, zmenna nezależna (znana, dostępna, obserwowana, zmerzona)

WAŻONA METODA NAJMNIEJSZYCH KWADRATÓW JAK WYZNACZYĆ PARAMETRY RÓWNANIA REGRESJI JEŻELI MIERZONE SĄ ZE ZRÓŻNICOWANĄ DOKŁADNOŚCIĄ? 0 WAŻENIE OBSERWACJI

WAŻONA METODA NAJMNIEJSZYCH KWADRATÓW WAŻENIE OBSERWACJI 0 w cov (, ) w

PRZYKŁADY RÓWNAŃ REGRESJI. stopna 0 WIELOMIANY. stopna 3. stopna 0 3 0 3

PRZYKŁADY RÓWNAŃ REGRESJI REGRESJA LOGARYTMICZNA 0 ln

PRZYKŁADY RÓWNAŃ REGRESJI MASA CIAŁA WZROST ZAW. TŁUSZCZU 89 54 8 REGRESJA WIELOKROTNA zt wz 0zt zt 0wz wz 88 76 7 66 66 4 59 89 3 93 99 9 73 60 5 8 78 9 zt zt... wz... 0 0 0... 0... 0 0... 0 0 zt wz zt wz 77 58 5 00 73 30 67 69 3

REGRESJA NIELINIOWA

DANE chore zdrowe PRÓBA DANYCH gr. badawcza gr. kontrolna 9 3. Grupa badawcza stat kontakt z dmem ttonowm. Grupa kontrolna brak kontaktu 3. Wnk sekcj po roku badań zman nowotworowe w płucach

DANE choroba [] grupa [] 0=b. 0 0 0...... =k. 0. Dane ne mają rozkładu normalnego PRÓBA DANYCH. Y { chor, zdrow } rozkład dwumanow 3. Określam prawdopodobeństwo zachorowana w każdej grupe

TRANSFORMACJA DANYCH prawdopodobeństwo 0 transformacja funkcja prawdopodobeństwa - +

TRANSFORMACJA DANYCH Transformacja logstczna logt p ln p p p=0.5 logt(p)=0 p logt(p) + p 0 logt(p) -

TRANSFORMACJA DANYCH Transformacja logstczna logt p ln p p zależność nelnowa zależność lnowa

TRANSFORMACJA DANYCH. Transformacja logt - najczęścej stosowana. Inne transformacje prawdopodobeństwo funkcja prawdopodobeństwa : probt (podobna do logt, trudnejsza do oblczena) log-log (stosowana prz nesmetrcznośc względem p=0.5)

RÓWNANIE REGRESJI LOGISTYCZNEJ e e p p p p p p p 0 0 ) ( logt ) ( logt 0 ep ep ) ln( ) ln( ln logt p

PRZYKŁAD choroba [] grupa [] 0=b. 0 0 0...... =k. 0. Równane regresj logt p p ln p PRÓBA DANYCH.35.97. Prawdopodobeństwo zachorowana jest mnejsze w grupe kontrolnej 3. Prawdopodobeństwo zachorowana w grupe badawczej: p b ep.35.97 0 ep.35.97 0 0.93 4. Prawdopodobeństwo zachorowana w grupe kontrolnej: p k ep.35.97 ep.35.97 0.594

PRZYKŁADY

INTERPRETACJA WYNIKÓW RÓWNAŃ REGRESJI

INTERPRETACJA RÓWNAŃ REGRESJI nterval 8.36 0. temp. Wraz ze wzrostem temperatur czas pomędz odgłosam skraca sę. Wzrost temperatur o C powoduje skrócene odstępu o 0. s. 3. W temperaturze 0 C osobnk wdają dogłos średno co 6.6 s. : nterval 8.36 0.0 6.6

INTERPRETACJA RÓWNAŃ REGRESJI

INTERPRETACJA RÓWNAŃ REGRESJI. Model: n_dzec.8 0.0wek 0.03r_w 0.00r_w. Partnerz, którz w 003 r. mel średno 40 lat oraz, u którch mąż jest starsz o 5 mają średno.4 dzec: n_dzec.8 0.0 40 0.035 0.005 3. Partnerz, którz w 003 r. mel średno 5 lat oraz, u którch mąż jest starsz o 4 mają średno.66 dzec: n_dzec.8 0.0 5 0.034 0.00 4.4.66

PRZYKŁAD

DOPASOWANIE RÓWNANIA REGRESJI LINIOWEJ

RÓWNANIE REGRESJI BŁĄD różnca mędz a ŷ zaw. tłuszczu 30 Wartość zaobserwowana () 9 8 7 6 5 4 Wartość przewdzana (ŷ) 3 50 60 70 80 90 00 masa cała

DOPASOWANIE REGRESJI LINIOWEJ zmenność "" wjaśnona przez równane regresj n zaobserwowana ˆ R n n ˆ n

DOPASOWANIE REGRESJI LINIOWEJ WSPÓŁCZYNNIK DETERMINACJI jaka część obserwowanej zmennośc została wjaśnona przez równane regresj R n n ˆ przjmuje wartośc od 0 do ; m blższ tm lepsze dopasowane modelu regresj

DOPASOWANIE REGRESJI LINIOWEJ - przkład PRÓBA DANYCH MASA CIAŁA ZAW. TŁUSZCZU 89 8 88 7 66 4 59 3 93 9 73 5 8 9 77 5. Zmenna nezależna. Zmenna zależna, rozkład cągł tluszcz.57 0.9masa_cała R = 0.37 00 30 67 3

HISTOGRAM DIAGNOSTYCZNY Założene regresj lnowej: ˆ e ~ N 0, e

KORELACJA - podsumowane. Współcznnk korelacj lnowej Pearsona oblczane testowane. Współcznnk korelacj rangowej Spearmana oblczane testowane

REGRESJA Regresja lnowa. Równane regresj lnowej. Estmacja współcznnków regresj 3. Przkład równań regresj Regresja nelnowa Regresja logstczna - przkład Dopasowane równana regresj