Statstka powtórzee (II semestr) Rafał M. Frąk
TEORIA, OZNACZENIA, WZORY
Rodzaje mar statstczch mar położea - wzaczają przecęta wartość cech statstczej mar zróżcowaa (lub zmeośc, rozproszea, dspersj) - wzaczają słę zróżcowaa wartośc cech statstczej mar asmetr (skośośc) - wzaczają słę skupea wartośc cech statstczej blżej dolej lub górej grac zboru wartośc mar spłaszczea (kocetracj) - wzaczają słę skupea wartośc cech statstczej wokół wartośc przecętej
Ozaczea { e, e,..., e} -elemetowa zborowość statstcza X, Y, Z. cech statstcze,, z wartośc cech statstczch wartość, jaką przjmuje cecha a -tm elemece zborowośc
Średa artmetcza - Dla małej zborowośc statstczej (bez koeczośc grupowaa dach w przedzał): ozacza tą obserwację ze zboru obserwacj dwdualch. - Dla zborowośc statstczej (wartośc cech pogrupowae w przedzał: o ozacza k t warat cech lub k środek k-tego przedzału. k K k o k k K ozacza lość waratów cech statstczej
Średe pozcje - Moda (domata) Moda jest to wartość cech statstczej ajlczej reprezetowaa w zborze obserwacj, czl wartość wstępująca z ajwększą częstoścą. Moda mus bć pojedczą wartoścą. Jeśl w zborze obserwacj e steje pojedcza wartość cech statstczej wstępująca ajczęścej, to moda e steje w tej zborowośc.
Grafcze wzaczae mod prz pomoc hstogramu f() M o
Wzaczae mod dla rozkładu cągłego ( ) ( ) dlugosc przedzalu z moda przedzale z moda lczebosc przedzalu astepujacego po z moda przedzal lczebosc przedzalu poprzedzajacego lczebosc przedzalu z moda przedzalu z moda dola graca + + + + d d d d d d d d d d d o M
Średe pozcje - Medaa (wartość środkowa) Medaa jest to wartość cech statstczej, dzeląca zbór obserwacj a lczebe rówe częśc (zbór obserwacj o wartoścach mejszch lub rówch oraz zbór obserwacj o wartoścach wększch lub rówch od wartośc meda).
Wzaczae meda dla rozkładu cągłego dlugosc przedzalu z medaa lczebosc przedzalu z medaa meda poprzedzajacch przedzal przedzalow dla lczebosc skumulowaa przedzalu z medaa dola graca + + d d k k d d d k k d e M
Mar zróżcowaa mar zróżcowaa zwae róweż maram zmeośc, rozproszea lub dspersj pozwalają określć jake jest zróżcowae wartośc cech statstczej w zborze obserwacj (jak moco rozproszoe są poszczególe obserwacje)
Waracja Merz oa śred rozrzut wartośc zmeej losowej od jej wartośc średej. Itucje waracja utożsamaa jest ze zróżcowaem zborowośc. ) ( ) ( ) ( s ) ( ) ( ) ( s K k k k o k K k k k o k
Odchlee Odchlee rozumem jako różcę mędz dwema wartoścam (tucje ozacza odchlee jedej wartośc od drugej). Odchlee stadardowe opsuje rozrzut wartośc zmeej losowej wokół średej artmetczej. s ( ) s ( )
Reguła trzech sgm Regułę trzech sgm rozpatrujem w oparcu o własośc rozkładu ormalego: w przedzale od średa-3s do średa+3s zawera sę około 99% obserwacj, w przedzale od średa-s do średa+s zawera sę około 95% obserwacj, w przedzale od średa-s do średa+s zawera sę około 68% obserwacj.
Ilustracja reguł trzech sgm
Tpow obszar zmeośc Tpow obszar zmeośc awązuje do reguł trzech sgm Tpow obszar zmeośc ma ajwększe zastosowae w przpadku, gd dae są wraźe skupoe wokół wartośc średej Tpow obszar zmeośc ma postać: [ s( ), + s( )]
Pozcje mar rozproszea Współczk zmeośc formuje o sle rozproszea. Klascz współczk zmeośc: V s s( ) 00%
Mar asmetr Asmetra rozkładu cech statstczej ozacza, że elemet zborowośc statstczej skupają sę blżej dolej albo blżej górej grac tej zborowośc. Jeśl jedostk zborowośc skupają sę blżej mejszch wartośc cech, to mówm, że asmetra jest prawostroa. Jeśl jedostk zborowośc skupają sę blżej wększch wartośc cech, to mówm, że asmetra jest lewostroa.
współczk asmetr Pearsoa Współczk te może zostać oblczo tlko wted, gd możlwe jest wzaczee mod. W s M s( ) o
współczk asmetr Pearsoa Współczk te jest oblcza prz pomoc meda. W s M s( ) e
Iterpretacja współczków asmetr W s 0 rozklad smetrcz W s > 0 asmetra prawostroa W s < 0 asmetra lewostroa
Schemat przeprowadzaa badaa opsowej aalz struktur. Plaowae badaa. Uzskwae dach 3. Ocea jakośc poprawośc dach 4. Czszczee dach 5. Porządkowae grupowae dach 6. Prezetacja tabelarcza dach 7. Prezetacja grafcza dach 8. Wbór wzaczee mar opsowch 9. Wosk końcowe
Aalza dwuwmarowa Aalza dwuwmarowa rozpatruje parę zmech losowch jako tegralą całość. Główm zadaem aalz dwuwmarowej jest wkazae cz mędz badam zmem steje współzależość (zwązek).
Keruek współzależośc Keruek współzależośc może bć: - dodat wraz ze wzrostem wartośc cech X rosą też wartośc cech Y ( a odwrót) - ujem wraz ze wzrostem wartośc cech X maleją wartośc cech Y ( a odwrót)
Rodzaje współzależośc Fukcja - zmaa wartośc zmeej X powoduje ścśle określoą zmaę wartośc zmeej Y Stochastcza - wraz ze zmaam wartośc zmeej X zmea sę rozkład prawdopodobeństw zmeej Y Korelacja - określom wartoścom zmeej X są przporządkowae średe z klku wartośc zmeej Y
Tablca korelacja
j j m j j - lczebosc brzegowe zmeej X gdze : m - losc waratow zmeejy - lczebosc absolute (tle obserwacj alez do - tego waratu zmeej X oraz do j- tego waratu zmeej Y) r j j - lczebosc brzegowe zmeej Y gdze : r - losc waratow zmeej X r j m j j - lczebosc calkowta
Tablca korelacja - przkład Y [000, 3000] (3000, 4000] (4000, 5000] (5000, 6000] o \ o X 500 3500 4500 5500 ------ j [0, 0] 5 0 0 3 (0, 0] 5 3 7 0 3 (0, 30] 5 0 35 8 0 43 (30, 40] 35 0 0 0 3 3 j ------- 5 53 9 3 00
Rozkład brzegowe warukowe Rozkład brzegow prezetuje strukturę wartośc jedej zmeej (X lub Y) bez względu a kształtowae sę wartośc drugej zmeej. Rozkład warukow prezetuje strukturę wartośc jedej zmeej (X lub Y), pod warukem, że druga zmea przjęła określoą wartość.
Rozkład brzegow dla zmeej Y - przkład Y o j j 000-3000 500 5 3000-4000 3500 53 4000-5000 4500 9 5000-6000 5500 3 SUMA ------------- 00
Rozkład warukow: X Y 500 - przkład X o 0 0 5 0 0 5 3 0 30 5 0 30 40 35 0 SUMA ----- 5
Średe brzegowe r o j m j o j j
Waracje brzegowe ) ( ) ( s r o r o
Średe warukowe Dla zmeej X Y j : j j r j o Dla zmeej Y X : j m j j o j
Tablca korelacja wzaczae korelacj Jeśl wraz ze wzrostem kokretch wartośc jedej zmeej moża zaobserwować wzrost warukowch średch drugej zmeej, to fakt te śwadcz o steu korelacj (współzależośc) DODATNIEJ mędz tm zmem. < <... < <... < r < ALBO <... < <... < r < <... < j <... < m < <... < j <... < m
Tablca korelacja wzaczae korelacj Jeśl wraz ze wzrostem kokretch wartośc jedej zmeej moża zaobserwować spadek warukowch średch drugej zmeej, to fakt te śwadcz o steu korelacj UJEMNEJ mędz tm zmem. < <... < <... < r > ALBO >... > >... > r < <... < j <... < m > >... > j >... > m
Mar sł korelacj Natomast do pomaru sł korelacj służą astępujące welkośc: - Współczk zbeżośc Czuprowa, - Współczk korelacj lowej Pearsoa.
Współczk zbeżośc Czuprowa Służ do określea sł zależośc, bądź stwerdzea jej braku. Nestet NIE moża prz jego pomoc wskazać keruku współzależośc.
Współczk zbeżośc Czuprowa Jeśl T T 0, to badae cech X Y są stochastcze ezależe (brak współzależośc). Jeśl T T, to badae cech X Y łącz zależość fukcja (całkowta współzależość).
Współczk korelacj lowej Pearsoa Jest powszeche stosowaą marą sł zwązku prostolowego mędz dwema cecham merzalm (zmee tpu cągłego). Prz jego pomoc możem wkrć jede prostolową współzależość mędz zmem (NIE krzwolową). Służ jedocześe zarówo do określea sł zależośc, jak też do wskazaa jej keruku.
Współczk korelacj lowej Pearsoa Wraża sę astępującm wzorem: r r cov(, s( ) s( ) ) cov(, ) tzw. kowaracja zmech X Y s() odchlee stadardowe zmeej X (dla rozkładu brzegowego zmeej X) s() odchlee stadardowe zmeej Y (dla rozkładu brzegowego zmeej Y)
Współczk korelacj lowej Pearsoa Ostatecze kowaracja zmech X Y określoa jest w astępując sposób: cov(, ) ( r j m j j o o j ), - srede brzegowe zmech losowch X Y
Współczk korelacj Pearsoa Jeśl r r 0, to badae cech X Y są ezależe pod względem lowośc (brak współzależośc prostolowej, co e wklucza stea zależośc krzwolowej). Jeśl r r, to badae cech X Y łącz peła zależość prostolowa dodata. Jeśl r r -, to badae cech X Y łącz peła zależość prostolowa ujema.
Mar krzwolowośc Do współczków merzącch współzależość krzwolową ależą: - współczk korelacj rag Spearmaa ϕ - współczk Yule'a - współczk V Cramera - współczk kotgecj C Pearsoa
Idea wzaczaa fukcj regresj Stwerdzee, że aspekt dotczące pewego zjawska są współzależe w jakm stopu, bwa ewstarczające. Zwkle jesteśm zateresowa określeem dokładejszej postac zależośc mędz badam cecham. Jedm z arzędz służącch do tego celu jest wkorzstae fukcj regresj.
Idea wzaczaa fukcj regresj Z drugej stro, fukcja regresj służ do przblżea wartośc jedej zmeej w zależośc od wartośc drugej zmeej. Ogóle mówąc, jest to węc sposób predkcj, czl progozowaa wartośc określoej zmeej losowej w zależośc od ch zmech losowch.
Regresja emprcza Jest to fukcje przporządkowae średch warukowch zmeej zależej kokretm wartoścom zmeej ezależej. Ab określć średe warukowe, potrzebe jest zestawee dach w tablc korelacjej
Regresja emprcza Fukcje regresj emprczch moża przedstawć astępująco: - regresja zmeej Y względem zmeej X g o,,, r - lczba przedzałów zmeej X - regresja zmeej X względem zmeej Y j o f j j,,, m - lczba przedzałów zmeej Y
Regresja lowa W praktce dość często spotka sę lową postać współzależośc mędz badam cecham. W wększośc przpadków przblżee uzskae przez zastosowae fukcj lowej jest wstarczające. Lowa fukcja regresj służąca do badaa zależośc zmeej Y od zmeej X ma postać: Y α + β + X ε
Regresja lowa W praktce stosować będzem lę regresj teoretczej: b X a Y + ˆ a a b
Ocea dokładośc oszacowaa Oszacowae waracj składka losowego u Oszacowae błędu wzaczea parametru a Oszacowae błędu wzaczea parametru b Oblczee współczka zbeżośc Oblczee współczka determacj
Oszacowaa reszt (składk losow) u ˆ ;,, 3,..., - rzeczwsta (emprcza) wartosc zm.y ˆ - estmowaa (teoretcza) wartosc zm.y
Błęd oszacowań parametrów strukturalch ( ) ( ) ( ) ( ) u s u s a s ( ) ( ) ( ) ( ) u s u s b s ( ) ( ) u u s ˆ ( ) 00% a a a s V ( ) 00% b b b s V
Współczk zbeżośc determacj ( ) ( ) ( ) ( ) 00% ˆ 00% s u s ϕ ( ) ( ) ϕ s u s R ( ) ( ) ( ) ( ) 00% ˆ 00% ˆ s s r R
PRZYKŁADY ZADAŃ
ZADANIE Przeprowadź aalzę statstczą dla astępującej zborowośc pracowków pod względem cech X (X mesęcze wagrodzee pracowków w EURO). Wartośc cech uszeregowao w przedzał: [50, 350] osoba ; [350, 450] 4 osob ; [450, 550] 6 osób ; [550, 650] 3 osob. - Przedstaw powższą zborowość w tabel roboczej, sporządź hstogram (częstośc absolutch skumulowach). - Oblcz zterpretuj astępujące mar statstcze w podaej zborowośc: - średa artmetcza, moda, medaa - tpow obszar zmeośc, klascz współcz. zmeośc - współczk asmetr Pearsoa
ZADANIE Przebadao małą zborowość pracowków pod kątem cech statstczch: X staż prac Y wagrodzee. Rezultat badaa przedstawoo w tablc korelacjej: Y 000-00 00-400 400-600 SUMA X o \ o j --------- 0-0 -4 0 5 0 4-6 0 4 SUMA ----------
ZADANIE - Uzupełj tablcę korelacją - Wzacz rozkład warukow zmeej X Y 500. - Sprawdź prz pomoc współczka korelacj lowej Pearsoa cz mędz zmem X Y zachodz współzależość. Zterpretuj otrzma wk.
ZADANIE 3 Y [000, 3000] (3000, 4000] (4000, 5000] o \ o X 500 3500 4500 ------ j [0, 0] 5 0 8 9 (0, 0] 5 0 5 0 5 (0, 30] 5 5 0 3 8 j ------- 6 5 3
ZADANIE 3 - Wzacz model regresj emprczej dla wagrodzea (zmea Y) względem stażu prac (zmea X), a podstawe dach zawartch w tablc korelacjej. - Przedstaw emprczą fukcję regresj a wkrese.
ZADANIE 4 W zameszczoej tabel przedstawoe został dae w postac obserwacj dwdualch dotczące czasu przgotowaa do egzamu testowego (X) wków uzskach z tego testu (Y) dla grup 6-cu studetów. 7 4 0 55 3 5 67 4 7 74 5 7 70 6 3 59 Razem 79 367
ZADANIE 4 Wkorzstując powższe dae ależ: - sporządzć wkres prezetując zależość mędz wkam egzamu (Y) oraz czasem przgotowaa (X), - jeśl to możlwe uzasadoe sformułować model regresj lowej, - oszacować parametr strukturale modelu regresj lowej (a, b), - wzaczć zterpretować astępujące welkośc: błęd oszacowań parametrów strukturalch, współczk zbeżośc oraz determacj.