Statystyka powtórzenie (II semestr) Rafał M. Frąk

Podobne dokumenty
Statystyka powtórzenie (II semestr) Rafał M. Frąk

Statystyka. Katarzyna Chudy Laskowska

KORELACJA KORELACJA I REGRESJA. X, Y - cechy badane równocześnie. Dane statystyczne zapisujemy w szeregu statystycznym dwóch cech

Wnioskowanie statystyczne dla korelacji i regresji.

opisać wielowymiarową funkcją rozkładu gęstości prawdopodobieństwa f(x 1 , x xn

Materiały do wykładu 7 ze Statystyki

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH - ANALIZA KORELACJI PROSTEJ

Teoria i praktyka. Wyższa Szkoła Turystyki i Ekologii. Fizyka. WSTiE Sucha Beskidzka Fizyka

STATYSTYKA OPISOWA. Państwowa Wyższa Szkoła Zawodowa w Koninie. Materiały pomocnicze do ćwiczeń. Materiały dydaktyczne 17 ARTUR ZIMNY

MODEL SHARP A - MIARY WRAŻLIWOŚCI

Rachunek Prawdopodobieństwa i statystyka W 10: Analizy zależności pomiędzy zmiennymi losowymi (danymi empirycznymi)

Józef Beluch Akademia Górniczo-Hutnicza w Krakowie. Wpływ wag współrzędnych na wyniki transformacji Helmerta

Statystyka. Analiza zależności. Rodzaje zależności między zmiennymi występujące w praktyce: Funkcyjna

STATYSTYKA MATEMATYCZNA

Natalia Nehrebecka. Dariusz Szymański

INSTRUKCJA LABORATORIUM Metrologia techniczna i systemy pomiarowe.

POPULACJA I PRÓBA. Próba reprezentatywna. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 5 1

Statystyka Opisowa 2014 część 3. Katarzyna Lubnauer

Planowanie eksperymentu pomiarowego I

Statystyczne charakterystyki liczbowe szeregu

Niepewności pomiarów. DR Andrzej Bąk

Tablica Galtona. Mechaniczny model rozkładu normalnego (M10)

FUNKCJE DWÓCH ZMIENNYCH

Średnia arytmetyczna Klasyczne Średnia harmoniczna Średnia geometryczna Miary położenia inne

ANALIZA ZALEŻNOŚCI DWÓCH ZMIENNYCH ILOŚCIOWYCH

Prawdopodobieństwo i statystyka r.

AKADEMIA MORSKA W SZCZECINIE

Opracowanie wyników pomiarów

Statystyka Opisowa Wzory

L.Kowalski zadania ze statystyki opisowej-zestaw 5. ZADANIA Zestaw 5

Prawdopodobieństwo i statystyka r.

Linie regresji II-go rodzaju

Analiza ZALEśNOŚCI pomiędzy CECHAMI (Analiza KORELACJI i REGRESJI)

STATYSTYKA MATEMATYCZNA WYKŁAD 1. Wiadomości wstępne

ma rozkład normalny z nieznaną wartością oczekiwaną m

Podstawy analizy niepewności pomiarowych (I Pracownia Fizyki)

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

PDF created with FinePrint pdffactory Pro trial version WIII/1

. Wtedy E V U jest równa

Regresja linowa metoda najmniejszych kwadratów. Tadeusz M. Molenda Instytut Fizyki US

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 7-8

Ćwiczenia 10 KORELACJA

Zadanie 1. ), gdzie 1. Zmienna losowa X ma rozkład logarytmiczno-normalny LN (, . EX (A) 0,91 (B) 0,86 (C) 1,82 (D) 1,95 (E) 0,84

W loterii bierze udział 10 osób. Regulamin loterii faworyzuje te osoby, które w eliminacjach osiągnęły lepsze wyniki:

dev = y y Miary położenia rozkładu Wykład 9 Przykład: Przyrost wagi owiec Odchylenia Mediana próbkowa: Przykłady Statystyki opisowe Σ dev i =?

ZMIENNE LOSOWE WIELOWYMIAROWE

Liniowe relacje między zmiennymi

OBLICZANIE NIEPEWNOŚCI METODĄ TYPU B

L.Kowalski PODSTAWOWE TESTY STATYSTYCZNE WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

RACHUNEK NIEPEWNOŚCI POMIARU

ma rozkład normalny z wartością oczekiwaną EX = EY = 1, EZ = 0 i macierzą kowariancji

MATERIAŁY POMOCNICZE DLA STUDENTÓW DO NAUKI STATYSTYKI

Statystyczna analiza danych przedziały ufności

Lekcja 1. Pojęcia podstawowe: Zbiorowość generalna i zbiorowość próbna

JEDNOWYMIAROWA ZMIENNA LOSOWA

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

STATYSTYKA OPISOWA WYKŁAD 3,4

Podstawowe pojcia. Metody probabilistyczne i statystyka Wykład 7: Statystyka opisowa. Rozkłady prawdopodobiestwa wystpujce w statystyce.

( X, Y ) będzie dwuwymiarową zmienną losową o funkcji gęstości

MATEMATYKA STOSOWANA W INŻYNIERII CHEMICZNEJ

Statystyka Matematyczna Anna Janicka

STATYSTYKA I stopień ZESTAW ZADAŃ

Obliczanie średniej, odchylenia standardowego i mediany oraz kwartyli w szeregu szczegółowym i rozdzielczym?

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 5

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

E K O N O M E T R I A (kurs 10 godz.)

ANALIZA KORELACJI DEFINICJA ZALEŻNOŚCI KORELACYJNEJ, RODZAJE ZALEŻNOŚCI KORELACYJNYCH KLASYFIKACJA METOD ANALIZY ZALEŻNOŚCI STATYSTYCZNYCH

Probabilistyka i statystyka. Korelacja

Podstawy opracowania wyników pomiarowych, analiza błędów

Statystyka Matematyczna Anna Janicka

REGRESJA LINIOWA. gdzie

Wiek statku a prawdopodobieństwo wystąpienia wypadku na morzu analiza współzależności

będą niezależnymi zmiennymi losowymi o tym samym 2 x

Pomiary bezpośrednie i pośrednie obarczone błędem przypadkowym

Miary statystyczne. Katowice 2014

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Projekt 3 3. APROKSYMACJA FUNKCJI

Statystyczna analiza miesięcznych zmian współczynnika szkodowości kredytów hipotecznych

STATYSTYKA EKONOMICZNA I SPOŁECZNA

STATYSTYKA MATEMATYCZNA WYKŁAD 2 ESTYMACJA PUNKTOWA

będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

Strona: 1 1. CEL ĆWICZENIA

Sabina Nowak. Podstawy statystyki i ekonometrii Część I

ROZKŁADY ZMIENNYCH LOSOWYCH

TARCIE CIĘGIEN O POWIERZCHNIĘ WALCOWĄ WZÓR EULERA

Wyrażanie niepewności pomiaru

Statystyka Inżynierska

WSPÓŁZALEŻNOŚĆ PROCESÓW MASOWYCH Co w Sylabusie?

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

Analiza współzależności dwóch zjawisk zależności między tymi cechami

Matematyka II. Wykład 11. Całka podwójna. Zamiana na całkę iterowaną. Obliczanie pól obszarów i objętości brył.

Wykład ze statystyki. Maciej Wolny

Matematyczne metody opracowywania wyników

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

Zadanie 1. Rzucamy symetryczną monetą tak długo, aż w dwóch kolejnych rzutach pojawią się,,reszki. Oblicz wartość oczekiwaną liczby wykonanych rzutów.

METODY KOMPUTEROWE 1

Estymacja to wnioskowanie statystyczne koncentrujące się wokół oszacowania wartości parametrów rozkładu populacji.

Ocena dopasowania modelu do danych empirycznych

Transkrypt:

Statstka powtórzee (II semestr) Rafał M. Frąk

TEORIA, OZNACZENIA, WZORY

Rodzaje mar statstczch mar położea - wzaczają przecęta wartość cech statstczej mar zróżcowaa (lub zmeośc, rozproszea, dspersj) - wzaczają słę zróżcowaa wartośc cech statstczej mar asmetr (skośośc) - wzaczają słę skupea wartośc cech statstczej blżej dolej lub górej grac zboru wartośc mar spłaszczea (kocetracj) - wzaczają słę skupea wartośc cech statstczej wokół wartośc przecętej

Ozaczea { e, e,..., e} -elemetowa zborowość statstcza X, Y, Z. cech statstcze,, z wartośc cech statstczch wartość, jaką przjmuje cecha a -tm elemece zborowośc

Średa artmetcza - Dla małej zborowośc statstczej (bez koeczośc grupowaa dach w przedzał): ozacza tą obserwację ze zboru obserwacj dwdualch. - Dla zborowośc statstczej (wartośc cech pogrupowae w przedzał: o ozacza k t warat cech lub k środek k-tego przedzału. k K k o k k K ozacza lość waratów cech statstczej

Średe pozcje - Moda (domata) Moda jest to wartość cech statstczej ajlczej reprezetowaa w zborze obserwacj, czl wartość wstępująca z ajwększą częstoścą. Moda mus bć pojedczą wartoścą. Jeśl w zborze obserwacj e steje pojedcza wartość cech statstczej wstępująca ajczęścej, to moda e steje w tej zborowośc.

Grafcze wzaczae mod prz pomoc hstogramu f() M o

Wzaczae mod dla rozkładu cągłego ( ) ( ) dlugosc przedzalu z moda przedzale z moda lczebosc przedzalu astepujacego po z moda przedzal lczebosc przedzalu poprzedzajacego lczebosc przedzalu z moda przedzalu z moda dola graca + + + + d d d d d d d d d d d o M

Średe pozcje - Medaa (wartość środkowa) Medaa jest to wartość cech statstczej, dzeląca zbór obserwacj a lczebe rówe częśc (zbór obserwacj o wartoścach mejszch lub rówch oraz zbór obserwacj o wartoścach wększch lub rówch od wartośc meda).

Wzaczae meda dla rozkładu cągłego dlugosc przedzalu z medaa lczebosc przedzalu z medaa meda poprzedzajacch przedzal przedzalow dla lczebosc skumulowaa przedzalu z medaa dola graca + + d d k k d d d k k d e M

Mar zróżcowaa mar zróżcowaa zwae róweż maram zmeośc, rozproszea lub dspersj pozwalają określć jake jest zróżcowae wartośc cech statstczej w zborze obserwacj (jak moco rozproszoe są poszczególe obserwacje)

Waracja Merz oa śred rozrzut wartośc zmeej losowej od jej wartośc średej. Itucje waracja utożsamaa jest ze zróżcowaem zborowośc. ) ( ) ( ) ( s ) ( ) ( ) ( s K k k k o k K k k k o k

Odchlee Odchlee rozumem jako różcę mędz dwema wartoścam (tucje ozacza odchlee jedej wartośc od drugej). Odchlee stadardowe opsuje rozrzut wartośc zmeej losowej wokół średej artmetczej. s ( ) s ( )

Reguła trzech sgm Regułę trzech sgm rozpatrujem w oparcu o własośc rozkładu ormalego: w przedzale od średa-3s do średa+3s zawera sę około 99% obserwacj, w przedzale od średa-s do średa+s zawera sę około 95% obserwacj, w przedzale od średa-s do średa+s zawera sę około 68% obserwacj.

Ilustracja reguł trzech sgm

Tpow obszar zmeośc Tpow obszar zmeośc awązuje do reguł trzech sgm Tpow obszar zmeośc ma ajwększe zastosowae w przpadku, gd dae są wraźe skupoe wokół wartośc średej Tpow obszar zmeośc ma postać: [ s( ), + s( )]

Pozcje mar rozproszea Współczk zmeośc formuje o sle rozproszea. Klascz współczk zmeośc: V s s( ) 00%

Mar asmetr Asmetra rozkładu cech statstczej ozacza, że elemet zborowośc statstczej skupają sę blżej dolej albo blżej górej grac tej zborowośc. Jeśl jedostk zborowośc skupają sę blżej mejszch wartośc cech, to mówm, że asmetra jest prawostroa. Jeśl jedostk zborowośc skupają sę blżej wększch wartośc cech, to mówm, że asmetra jest lewostroa.

współczk asmetr Pearsoa Współczk te może zostać oblczo tlko wted, gd możlwe jest wzaczee mod. W s M s( ) o

współczk asmetr Pearsoa Współczk te jest oblcza prz pomoc meda. W s M s( ) e

Iterpretacja współczków asmetr W s 0 rozklad smetrcz W s > 0 asmetra prawostroa W s < 0 asmetra lewostroa

Schemat przeprowadzaa badaa opsowej aalz struktur. Plaowae badaa. Uzskwae dach 3. Ocea jakośc poprawośc dach 4. Czszczee dach 5. Porządkowae grupowae dach 6. Prezetacja tabelarcza dach 7. Prezetacja grafcza dach 8. Wbór wzaczee mar opsowch 9. Wosk końcowe

Aalza dwuwmarowa Aalza dwuwmarowa rozpatruje parę zmech losowch jako tegralą całość. Główm zadaem aalz dwuwmarowej jest wkazae cz mędz badam zmem steje współzależość (zwązek).

Keruek współzależośc Keruek współzależośc może bć: - dodat wraz ze wzrostem wartośc cech X rosą też wartośc cech Y ( a odwrót) - ujem wraz ze wzrostem wartośc cech X maleją wartośc cech Y ( a odwrót)

Rodzaje współzależośc Fukcja - zmaa wartośc zmeej X powoduje ścśle określoą zmaę wartośc zmeej Y Stochastcza - wraz ze zmaam wartośc zmeej X zmea sę rozkład prawdopodobeństw zmeej Y Korelacja - określom wartoścom zmeej X są przporządkowae średe z klku wartośc zmeej Y

Tablca korelacja

j j m j j - lczebosc brzegowe zmeej X gdze : m - losc waratow zmeejy - lczebosc absolute (tle obserwacj alez do - tego waratu zmeej X oraz do j- tego waratu zmeej Y) r j j - lczebosc brzegowe zmeej Y gdze : r - losc waratow zmeej X r j m j j - lczebosc calkowta

Tablca korelacja - przkład Y [000, 3000] (3000, 4000] (4000, 5000] (5000, 6000] o \ o X 500 3500 4500 5500 ------ j [0, 0] 5 0 0 3 (0, 0] 5 3 7 0 3 (0, 30] 5 0 35 8 0 43 (30, 40] 35 0 0 0 3 3 j ------- 5 53 9 3 00

Rozkład brzegowe warukowe Rozkład brzegow prezetuje strukturę wartośc jedej zmeej (X lub Y) bez względu a kształtowae sę wartośc drugej zmeej. Rozkład warukow prezetuje strukturę wartośc jedej zmeej (X lub Y), pod warukem, że druga zmea przjęła określoą wartość.

Rozkład brzegow dla zmeej Y - przkład Y o j j 000-3000 500 5 3000-4000 3500 53 4000-5000 4500 9 5000-6000 5500 3 SUMA ------------- 00

Rozkład warukow: X Y 500 - przkład X o 0 0 5 0 0 5 3 0 30 5 0 30 40 35 0 SUMA ----- 5

Średe brzegowe r o j m j o j j

Waracje brzegowe ) ( ) ( s r o r o

Średe warukowe Dla zmeej X Y j : j j r j o Dla zmeej Y X : j m j j o j

Tablca korelacja wzaczae korelacj Jeśl wraz ze wzrostem kokretch wartośc jedej zmeej moża zaobserwować wzrost warukowch średch drugej zmeej, to fakt te śwadcz o steu korelacj (współzależośc) DODATNIEJ mędz tm zmem. < <... < <... < r < ALBO <... < <... < r < <... < j <... < m < <... < j <... < m

Tablca korelacja wzaczae korelacj Jeśl wraz ze wzrostem kokretch wartośc jedej zmeej moża zaobserwować spadek warukowch średch drugej zmeej, to fakt te śwadcz o steu korelacj UJEMNEJ mędz tm zmem. < <... < <... < r > ALBO >... > >... > r < <... < j <... < m > >... > j >... > m

Mar sł korelacj Natomast do pomaru sł korelacj służą astępujące welkośc: - Współczk zbeżośc Czuprowa, - Współczk korelacj lowej Pearsoa.

Współczk zbeżośc Czuprowa Służ do określea sł zależośc, bądź stwerdzea jej braku. Nestet NIE moża prz jego pomoc wskazać keruku współzależośc.

Współczk zbeżośc Czuprowa Jeśl T T 0, to badae cech X Y są stochastcze ezależe (brak współzależośc). Jeśl T T, to badae cech X Y łącz zależość fukcja (całkowta współzależość).

Współczk korelacj lowej Pearsoa Jest powszeche stosowaą marą sł zwązku prostolowego mędz dwema cecham merzalm (zmee tpu cągłego). Prz jego pomoc możem wkrć jede prostolową współzależość mędz zmem (NIE krzwolową). Służ jedocześe zarówo do określea sł zależośc, jak też do wskazaa jej keruku.

Współczk korelacj lowej Pearsoa Wraża sę astępującm wzorem: r r cov(, s( ) s( ) ) cov(, ) tzw. kowaracja zmech X Y s() odchlee stadardowe zmeej X (dla rozkładu brzegowego zmeej X) s() odchlee stadardowe zmeej Y (dla rozkładu brzegowego zmeej Y)

Współczk korelacj lowej Pearsoa Ostatecze kowaracja zmech X Y określoa jest w astępując sposób: cov(, ) ( r j m j j o o j ), - srede brzegowe zmech losowch X Y

Współczk korelacj Pearsoa Jeśl r r 0, to badae cech X Y są ezależe pod względem lowośc (brak współzależośc prostolowej, co e wklucza stea zależośc krzwolowej). Jeśl r r, to badae cech X Y łącz peła zależość prostolowa dodata. Jeśl r r -, to badae cech X Y łącz peła zależość prostolowa ujema.

Mar krzwolowośc Do współczków merzącch współzależość krzwolową ależą: - współczk korelacj rag Spearmaa ϕ - współczk Yule'a - współczk V Cramera - współczk kotgecj C Pearsoa

Idea wzaczaa fukcj regresj Stwerdzee, że aspekt dotczące pewego zjawska są współzależe w jakm stopu, bwa ewstarczające. Zwkle jesteśm zateresowa określeem dokładejszej postac zależośc mędz badam cecham. Jedm z arzędz służącch do tego celu jest wkorzstae fukcj regresj.

Idea wzaczaa fukcj regresj Z drugej stro, fukcja regresj służ do przblżea wartośc jedej zmeej w zależośc od wartośc drugej zmeej. Ogóle mówąc, jest to węc sposób predkcj, czl progozowaa wartośc określoej zmeej losowej w zależośc od ch zmech losowch.

Regresja emprcza Jest to fukcje przporządkowae średch warukowch zmeej zależej kokretm wartoścom zmeej ezależej. Ab określć średe warukowe, potrzebe jest zestawee dach w tablc korelacjej

Regresja emprcza Fukcje regresj emprczch moża przedstawć astępująco: - regresja zmeej Y względem zmeej X g o,,, r - lczba przedzałów zmeej X - regresja zmeej X względem zmeej Y j o f j j,,, m - lczba przedzałów zmeej Y

Regresja lowa W praktce dość często spotka sę lową postać współzależośc mędz badam cecham. W wększośc przpadków przblżee uzskae przez zastosowae fukcj lowej jest wstarczające. Lowa fukcja regresj służąca do badaa zależośc zmeej Y od zmeej X ma postać: Y α + β + X ε

Regresja lowa W praktce stosować będzem lę regresj teoretczej: b X a Y + ˆ a a b

Ocea dokładośc oszacowaa Oszacowae waracj składka losowego u Oszacowae błędu wzaczea parametru a Oszacowae błędu wzaczea parametru b Oblczee współczka zbeżośc Oblczee współczka determacj

Oszacowaa reszt (składk losow) u ˆ ;,, 3,..., - rzeczwsta (emprcza) wartosc zm.y ˆ - estmowaa (teoretcza) wartosc zm.y

Błęd oszacowań parametrów strukturalch ( ) ( ) ( ) ( ) u s u s a s ( ) ( ) ( ) ( ) u s u s b s ( ) ( ) u u s ˆ ( ) 00% a a a s V ( ) 00% b b b s V

Współczk zbeżośc determacj ( ) ( ) ( ) ( ) 00% ˆ 00% s u s ϕ ( ) ( ) ϕ s u s R ( ) ( ) ( ) ( ) 00% ˆ 00% ˆ s s r R

PRZYKŁADY ZADAŃ

ZADANIE Przeprowadź aalzę statstczą dla astępującej zborowośc pracowków pod względem cech X (X mesęcze wagrodzee pracowków w EURO). Wartośc cech uszeregowao w przedzał: [50, 350] osoba ; [350, 450] 4 osob ; [450, 550] 6 osób ; [550, 650] 3 osob. - Przedstaw powższą zborowość w tabel roboczej, sporządź hstogram (częstośc absolutch skumulowach). - Oblcz zterpretuj astępujące mar statstcze w podaej zborowośc: - średa artmetcza, moda, medaa - tpow obszar zmeośc, klascz współcz. zmeośc - współczk asmetr Pearsoa

ZADANIE Przebadao małą zborowość pracowków pod kątem cech statstczch: X staż prac Y wagrodzee. Rezultat badaa przedstawoo w tablc korelacjej: Y 000-00 00-400 400-600 SUMA X o \ o j --------- 0-0 -4 0 5 0 4-6 0 4 SUMA ----------

ZADANIE - Uzupełj tablcę korelacją - Wzacz rozkład warukow zmeej X Y 500. - Sprawdź prz pomoc współczka korelacj lowej Pearsoa cz mędz zmem X Y zachodz współzależość. Zterpretuj otrzma wk.

ZADANIE 3 Y [000, 3000] (3000, 4000] (4000, 5000] o \ o X 500 3500 4500 ------ j [0, 0] 5 0 8 9 (0, 0] 5 0 5 0 5 (0, 30] 5 5 0 3 8 j ------- 6 5 3

ZADANIE 3 - Wzacz model regresj emprczej dla wagrodzea (zmea Y) względem stażu prac (zmea X), a podstawe dach zawartch w tablc korelacjej. - Przedstaw emprczą fukcję regresj a wkrese.

ZADANIE 4 W zameszczoej tabel przedstawoe został dae w postac obserwacj dwdualch dotczące czasu przgotowaa do egzamu testowego (X) wków uzskach z tego testu (Y) dla grup 6-cu studetów. 7 4 0 55 3 5 67 4 7 74 5 7 70 6 3 59 Razem 79 367

ZADANIE 4 Wkorzstując powższe dae ależ: - sporządzć wkres prezetując zależość mędz wkam egzamu (Y) oraz czasem przgotowaa (X), - jeśl to możlwe uzasadoe sformułować model regresj lowej, - oszacować parametr strukturale modelu regresj lowej (a, b), - wzaczć zterpretować astępujące welkośc: błęd oszacowań parametrów strukturalch, współczk zbeżośc oraz determacj.