Statystyka. Katarzyna Chudy Laskowska

Podobne dokumenty
Wnioskowanie statystyczne dla korelacji i regresji.

Materiały do wykładu 7 ze Statystyki

KORELACJA KORELACJA I REGRESJA. X, Y - cechy badane równocześnie. Dane statystyczne zapisujemy w szeregu statystycznym dwóch cech

opisać wielowymiarową funkcją rozkładu gęstości prawdopodobieństwa f(x 1 , x xn

Analiza ZALEśNOŚCI pomiędzy CECHAMI (Analiza KORELACJI i REGRESJI)

Rachunek Prawdopodobieństwa i statystyka W 10: Analizy zależności pomiędzy zmiennymi losowymi (danymi empirycznymi)

Teoria i praktyka. Wyższa Szkoła Turystyki i Ekologii. Fizyka. WSTiE Sucha Beskidzka Fizyka

Statystyka Opisowa 2014 część 3. Katarzyna Lubnauer

BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH - ANALIZA KORELACJI PROSTEJ

Statystyka powtórzenie (II semestr) Rafał M. Frąk

ANALIZA ZALEŻNOŚCI DWÓCH ZMIENNYCH ILOŚCIOWYCH

Statystyka. Analiza zależności. Rodzaje zależności między zmiennymi występujące w praktyce: Funkcyjna

MODEL SHARP A - MIARY WRAŻLIWOŚCI

FUNKCJE DWÓCH ZMIENNYCH

Regresja linowa metoda najmniejszych kwadratów. Tadeusz M. Molenda Instytut Fizyki US

Linie regresji II-go rodzaju

XXIII OGÓLNOPOLSKA OLIMPIADA MŁODZIEŻY - Lubuskie 2017 w piłce siatkowej

Natalia Nehrebecka. Dariusz Szymański

Podstawy analizy niepewności pomiarowych (I Pracownia Fizyki)

L.Kowalski zadania ze statystyki opisowej-zestaw 5. ZADANIA Zestaw 5

STATYSTYKA MATEMATYCZNA

Liniowe relacje między zmiennymi

Średnia wielkość powierzchni gruntów rolnych w gospodarstwie za rok 2006 (w hektarach) Jednostka podziału administracyjnego kraju

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Opracowanie wyników pomiarów

Probabilistyka i statystyka. Korelacja

Statystyka powtórzenie (II semestr) Rafał M. Frąk

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 7-8

POPULACJA I PRÓBA. Próba reprezentatywna. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 5 1

Dolnośląski O/W Kujawsko-Pomorski O/W Lubelski O/W. plan IV- XII 2003 r. Wykonanie

Planowanie eksperymentu pomiarowego I

Józef Beluch Akademia Górniczo-Hutnicza w Krakowie. Wpływ wag współrzędnych na wyniki transformacji Helmerta

ANALIZA KORELACJI DEFINICJA ZALEŻNOŚCI KORELACYJNEJ, RODZAJE ZALEŻNOŚCI KORELACYJNYCH KLASYFIKACJA METOD ANALIZY ZALEŻNOŚCI STATYSTYCZNYCH

Niepewności pomiarów. DR Andrzej Bąk

STATYSTYKA OPISOWA. Państwowa Wyższa Szkoła Zawodowa w Koninie. Materiały pomocnicze do ćwiczeń. Materiały dydaktyczne 17 ARTUR ZIMNY

Statystyczne charakterystyki liczbowe szeregu

STATYSTYKA MATEMATYCZNA

Priorytetowe dziedziny szkoleń specjalizacyjnych dla pielęgniarek i położnych, które będą mogły uzyskać dofinansowanie w 2019 r.

WSPÓŁZALEŻNOŚĆ PROCESÓW MASOWYCH Co w Sylabusie?

XIV Olimpiada Matematyczna Juniorów Statystyki dotyczące zawodów drugiego stopnia (2018/19)

Warszawa, dnia 9 lipca 2013 r. Poz. 576 KOMUNIKAT MINISTRA ROZWOJU REGIONALNEGO 1) z dnia 8 lipca 2013 r.

Prawdopodobieństwo i statystyka r.

KOMUNIKAT WYDZIAŁU ROZGRYWEK nr 18/2016/2017

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

Wiek statku a prawdopodobieństwo wystąpienia wypadku na morzu analiza współzależności

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

AKADEMIA MORSKA W SZCZECINIE

Przestępstwa drogowe wg jednostek podziału administracyjnego kraju - przestępstwa stwierdzone, przestępstwa wykryte, % wykrycia.

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 5

L.Kowalski PODSTAWOWE TESTY STATYSTYCZNE WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

. Wtedy E V U jest równa

INSTRUKCJA LABORATORIUM Metrologia techniczna i systemy pomiarowe.

Tablica Galtona. Mechaniczny model rozkładu normalnego (M10)

1. Pielęgniarstwo pediatryczne dla pielęgniarek 2. Pielęgniarstwo zachowawcze dla pielęgniarek 3. Pielęgniarstwo ratunkowe dla pielęgniarek

ROLNICTWO POMORSKIE NA TLE KRAJU W LICZBACH INFORMACJE OGÓLNE

ROLNICTWO POMORSKIE NA TLE KRAJU W LICZBACH INFORMACJE OGÓLNE (Źródło informacji ROCZNIK STATYSTYCZNY ROLNICTWA 2013 Głównego Urzędu Statystycznego)

Różniczkowanie funkcji rzeczywistych wielu zmiennych. Matematyka Studium doktoranckie KAE SGH Semestr letni 2008/2009 R. Łochowski

POWIERZCHNIA UŻYTKÓW ROLNYCH WEDŁUG WOJEWÓDZTW. Województwo

POWIERZCHNIA UŻYTKÓW ROLNYCH WEDŁUG WOJEWÓDZTW. Województwo

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

Prawdopodobieństwo i statystyka r.

W loterii bierze udział 10 osób. Regulamin loterii faworyzuje te osoby, które w eliminacjach osiągnęły lepsze wyniki:

Raport miesięczny. Za okres

ma rozkład normalny z wartością oczekiwaną EX = EY = 1, EZ = 0 i macierzą kowariancji

Monika Jeziorska - Pąpka Uniwersytet Mikołaja Kopernika w Toruniu

Kalendarz roku szkolnego 2018/2019

Wyrażanie niepewności pomiaru

OGÓLNOPOLSKI BENCHMARKING SZPITALI W RÓŻNYCH OBSZARACH DZIAŁALNOŚCI. Restrukturyzacja i zarzadzanie infrastrukturą

Budownictwo mieszkaniowe a) w okresie I-II 2014 r.

METODY KOMPUTEROWE 1

RACHUNEK NIEPEWNOŚCI POMIARU

Raport miesięczny. Za okres

Kalendarz roku szkolnego 2018/2019

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

Kalendarz roku szkolnego 2018/2019

Strona: 1 1. CEL ĆWICZENIA

ROLNICTWO POMORSKIE NA TLE KRAJU W LICZBACH

ma rozkład normalny z nieznaną wartością oczekiwaną m

BUDŻET WOJEWÓDZTWA KUJAWSKO POMORSKIEGO NA 2017 ROK

Raport miesięczny. Za okres

3 września 2018 r. Podstawa prawna:

Kalendarz roku szkolnego 2018/2019

Podstawy opracowania wyników pomiarowych, analiza błędów

Raport miesięczny. Za okres

Raport miesięczny. Za okres

Raport miesięczny. Za okres

ROZPORZĄDZENIE MINISTRA ROLNICTWA I ROZWOJU WSI 1) z dnia 29 lutego 2008 r.

Warszawa, dnia 4 marca 2014 r. Poz. 176 KOMUNIKAT MINISTRA INFRASTRUKTURY I ROZWOJU 1) z dnia 5 lutego 2014 r.

Raport miesięczny. Za okres

Raport miesięczny. Za okres

E K O N O M E T R I A (kurs 10 godz.)

Statystyka Opisowa Wzory

Kalendarz roku szkolnego 2018/2019

Analiza dynamiki i poziomu rozwoju powiatów w latach

Kalendarz roku szkolnego 2018/2019

Kalendarz roku szkolnego 2018/2019

Rozkład wyników ogólnopolskich

= n = = i i. Sprawdzenie istotności współczynnika korelacji ρ dla populacji na podstawie współczynnika r

Kalendarz roku szkolnego 2018/2019

Transkrypt:

Statstka Katarza Chud Laskowska http://kc.sd.prz.edu.pl/

Aalza korelacj umożlwa stwerdzee wstępowaa zależośc oraz oceę jej atężea ZALEŻNOŚCI pomędz CECHAMI: CECHY: ILOŚCIOWA ILOŚCIOWA CECHY: JAKOŚCIOWA JAKOŚCIOWA CECHY : ILOŚCIOWA JAKOŚCIOWA ANALIZA KORELACJI TEST NIEZALEŻNOŚCI CHI KWADRAT PEARSONA TEST ANOVA TEST Aova Kruskala Wallsa

Korelacja cech loścowe Zależość korelacja charakterzuje sę tm, że określom wartoścom jedej zmeej przporządkowae są ścśle określoe wartośc drugej zmeej. Stopeń zależośc pomędz cecham określa jest za pomocą współczka korelacj r x Współczk korelacj lowej Pearsoa Współczk korelacj Rag Spearmaa Lczo w przpadku cech loścowch, mającch rozkład ormal lub zblżo do ormalego (zbór dach powe bć lcz) Lczo w przpadku : - gd cech są merzale badaa zborowość jest elcza - gd cech mają charakter jakoścow steje możlwość ch uporządkowaa

Współczk korelacj lowej Pearsoa Aalzę zależośc pomędz cecham loścowm ależ rozpocząć od Sporządzea wkresu rozrzutu. Dzęk aalze grafczej moża już a Początku stwerdzć cz steje potecjala zależość pomędz cecham I cz jest ses oblczaa zwązku mędz badam zmem. Y Y korelacja lowa dodata r x > 0 korelacja lowa ujema r x < 0 X X Y brak korelacj lowej r x = 0 Y brak korelacj lowej r x = 0 korelacja elowa X X

Współczk korelacj lowej Pearsoa przjmuje wartośc z przedzału od -1 do 1 Przjmuje sę że: r x < 0, brak zwązku lowego 0,-0,4 zależość wraźa lowa ale ska 0,4 0,7 zależość umarkowaa 0,7 0,9 zależość zacząca powżej 0,9 zależość bardzo sla Jeśl współczk korelacj lowej Pearsoa jest rów 0 to e ma zwązku mędz badam zmem. Natomast jeśl współczk korelacj jest rów 1 lub -1 to wstępuje deal zwązek low.

Współczk korelacj lowej Pearsoa poda jest wzorem: r x 1 x x 1 x x C X, Y s s x Współczk korelacj formuje o sle keruku zwązku: SIŁA od 0 do 1 (0-100%) KIERUNEK + lub Korelacja dodata wstępuje wted gd wraz ze wzrostem jedej cech wzrastają średo wartośc drugej cech (zwązek proporcjoal) Korelacja ujema wstępuje wted gd wraz ze wzrostem jedej cech maleją średo wartośc drugej cech (zwązek proporcjoal)

UWAGI 1. Wartość współczka korelacj blska 0 ozacza tlko brak korelacj lowej Pearsoa (może wstąpć zwązek dlatego tak waże są wkres rozrzutu).. Współczk korelacj podlega wpłwom wartośc odstającch (ekstremalch) 3. Korelacja pozora boca przrost atural

Spalaa (l) Przkład W pewej frme sprawdzoo jak obcążee samochodów dostawczch wpłwa a zużce palwa. Sprawdzć cz steje zależość pomędz badam cecham. Obcążee samochodu Spalae Lp X Y ( x x) ( x x) ( ) ( ) ( x x) ( ) 1 175 5-3 59 -,6 6,76 59,8 181 5,5-17 89 -,1 4,41 35,7 3 185 6-13 169-1,6,56 0,8 4 19 6,5-6 36-1,1 1,1 6,6 5 195 7-3 9-0,6 0,36 1,8 6 0 7,5 4 16-0,1 0,01-0,4 7 05 8 7 49 0,4 0,16,8 8 10 9,5 1 144 1,9 3,61,8 9 15 10 17 89,4 5,76 40,8 10 0 11 484 3,4 11,56 74,8 1980 76 014 36,4 65,5 198 7,6 r x x 65,5 01436,4 65,5 73309,6 65,5 70,76 0,98 1 10 8 6 4 0 170 180 190 00 10 0 30 r x Obcążee samochodu (kg) 1 x x x x Zależość mędz obcążeem a spalaem jest bardzo wsoka. jest to zależość dodata, wprost proporcjoala, wraz ze wzrostem obcążea wzrasta spalae. W 98% obcążee wpłwa a zużce palwa. 1

Zadae: Zbadać zależość pomędz lczbą posadach samochodów przez przedsęborstwa trasportowe a kosztam stałm (ts.). X Y Lczba posadach samochodów Koszt stałe (ts.) 0 5 30 45 40 40 50 35

REGRESJA Pojęce aalz regresj ścśle wąże sę z pojęcem korelacj. Na podstawe korelacj stwerdzć moża, cz mędz dam wstępuje zależość (określć jej welkość) oraz jak keruek oa posada. Aalza regresj pozwala w sposób dokład zterpretować odkrte zależośc. Lę regresj określa sę jako mejsce geometrcze średch wartośc zmeej zależej, prz ustaloch wartoścach zmeej ezależej. Zmea zależa (objaśaa) Y=ax+b wraz wol b współczk kerukow a Zmea ezależa (objaśająca)

Parametr rówaa regresj z prób szacuje sę klasczą metodą ajmejszch kwadratów (MNK), polega oa a takm oszacowau parametrów Fukcj Y=ax+b b dla dach z prób speło bł waruek ˆ axx b 1 1 m Gdze ozaczają wartośc emprcze cech Y a wzaczoe a podstawe rówaa Y=ax+b ŷ wartośc teoretcze Oblczając mejsca zerowe perwszch pochodch cząstkowch względem odpowedch parametrów fukcj otrzmujem: a x x 1 b a x x x x 1 Y= x+b INTERPRETACJA Jeżel zmeą X zwększm o jedostkę, to zmea Y zwększ sę (spade) O współczk kerukow a

Do oce dopasowaa prostej regresj do puktów emprczch wkorzstuje sę reszt czl różcę pomędz wartoścam emprczm a teoretczm fukcj regresj. e t ˆ ˆ wartośc emprcze wartośc teoretcze Fukcja regresj jest poprawe oszacowaa jeżel wartośc reszt są ewelke mają charakter losow. Waracja składka resztowego: ˆ s ( e ) t 1 k - lczba obserwacj k lczba szacowach parametrów Odchlee stadardowe reszt zwae róweż średm błędem szacuku określa o le średo wartośc emprcze odchlają sę od wartośc teoretczch. Wraz ze wzrostem odchlea stadardowego reszt maleje poprawość dopasowaa prostej regresj do dach

Ab sprawdzć w jakm stopu prosta regresj dopasowaa jest do dach Oblcza sę współczk determacj R 1 R 1 1 ˆ Współczk zbeżośc meśc sę w przedzale od 0 do 1 a często terpretowa jest w procetach. Wskazuje stopeń braku dopasowaa Prostej regresj do dach.

Przkład cd. Obcążee samochodu Spalae Lp X Y ( x x) ( x x) ( ) ( ) ( x x) ( ) ŷ e ˆ t ( ) e t ( ) 1 175 5-3 59 -,6 6,76 59,8 4,61 0,39 0,151 6,76 181 5,5-17 89 -,1 4,41 35,7 5,39 0,11 0,011 4,41 3 185 6-13 169-1,6,56 0,8 5,91 0,09 0,0081,56 4 19 6,5-6 36-1,1 1,1 6,6 6,8-0,3 0,104 1,1 5 195 7-3 9-0,6 0,36 1,8 7,1-0,1 0,0441 0,36 6 0 7,5 4 16-0,1 0,01-0,4 8,1-0,6 0,3844 0,01 7 05 8 7 49 0,4 0,16,8 8,51-0,51 0,601 0,16 8 10 9,5 1 144 1,9 3,61,8 9,16 0,34 0,1156 3,61 9 15 10 17 89,4 5,76 40,8 9,81 0,19 0,0361 5,76 10 0 11 484 3,4 11,56 74,8 10,46 0,54 0,916 11,56 1980 76 014 36,4 65,5 1,4066 36,4 198 7,6 a x x 65,5 014 1 x x 1 0,13 b a x x 7,6 0,13198 7,6 5,74 18,14 Y=ax+b Y=0,13x-18,14

Y=ax+b Y=0,13x-18,14 0,4 0,1758 0,1758 8 1,4066 10 1,4066 ˆ ) ( 1 s k e s t 0,04 36,4 1,4066 ˆ 1 1 0,94 0,04 1 1 R

Współczk korelacj rag Spearmaa Współczk te służ do opsu sł korelacj dwóch cech w przpadku gd: -cech są merzale, a badaa zborowość jest małolcza -mają oe charakter jakoścow ale steje możlwość ch uporządkowaa Wzęte do badań cech ależ uporządkować ze względu a wartośc każdej cech oddzele (rosąco lub malejąco). Jedostkom w każdm z porządkowań przpsuje sę umer od 1 do czl ragę. r s 6 1 1 d 1 d ozacza różcę mędz ragam cech x Współczk korelacj rag Spearmaa przjmuje wartośc z przedzału [-1,1]. Im wższa wartość korelacj rag Spearmaa tm wększa zależość mędz cecham.

Przkład Lp Lczba Lczba samochodów ludośc Raga Y Raga X 1 ŁÓDZKIE 1568366 534357 6 6 0 0 6 MAZOWIECKIE 3541044 54911 1 1 0 0 1 3 MAŁOPOLSKIE 1898517 3310094 4 4 0 0 4 4 ŚLĄSKIE 51534 463588 0 0 5 LUBELSKIE 135 151895 7 8-1 1 7,5 6 PODKARPACKIE 1174565 103505 10 9 1 1 9,5 7 PODLASKIE 6978 118839 14 14 0 0 14 8 ŚWIĘTOKRZYSKIE 783698 166014 1 13-1 1 1,5 9 LUBUSKIE 60931 101104 16 16 0 0 16 10 WIELKOPOLSKIE 346895 341946 3 3 0 0 3 11 ZACHODNIOPOMORSKIE 937571 169307 11 11 0 0 11 1 DOLNOŚLĄSKIE 1655833 877840 5 5 0 0 5 13 OPOLSKIE 630900 108585 15 15 0 0 15 14 KUJAWSKO-POMORSKIE 153158 069543 9 10-1 1 9,5 15 POMORSKIE 1313756 40319 8 7 1 1 7,5 16 WARMIŃSKO-MAZURSKIE 78601 14741 13 1 1 1 1,5 d d 6 r s 6 1 1 d 1 r s 66 36 36 1 1 1 1 0,0088 16 16 1 1655 4080 0,991

Zadae Na podstawe dach określć słę zwązku pomędz lczbą emtowach reklam a lczbą sprzedach samochodów. Dokoać terpretacj współczka korelacj rag Spearmaa Lczba emsj reklam samochodu Lczba sprzedach samochodów 3 15 5 33 4 4 5 50 6 48 7 51