Materały wspomagające wykład ze statystyk Macej Woly
T: Zajęca orgazacyje Ageda. Program wykładu. Cel zajęć 3. Nabyte umejętośc 4. Lteratura 5. Waruk zalczea
Program wykładu T: Zajęca orgazacyje [h] T: Przedmot zadaa statystyk [h] T3: Metody aalzy rozkładu cechy [4h] T4: Badae współzależośc zjawsk [4h] T5: Badae dyamk zjawsk [4h] T6: Zmee losowe ch podstawowe rozkłady [3h] T7: Rozkład ormaly [h] T8: Twerdzea gracze [h] T9: Próba losowa rozkłady statystyk z próby [h] T0: Estymatory estymacja przedzałowa [3h] T: Hpotezy statystycze ch weryfkacja [4h]
Cel Zazajomee z podstawowym metodam procesu badaa statystyczego umożlwającym wykrywae prawdłowośc struktury, współzależośc dyamk zjawsk masowych oraz auczee woskowaa statystyczego
Umejętośc czytae, przetwarzae przedstawae daych statystyczych określae oblczae charakterystyk badaych zborowośc zastosowae estymatorów weryfkacja hpotez parametryczych eparametryczych woskowae a podstawe przeprowadzoych weryfkacj kostruowae model regresj ch zastosowae w ekoom progozowae a podstawe aalzy dyamk zjawsk
Lteratura [] Igatczyk W., Chromńska M., Statystyka. Teora zastosowae, Wyd. WSB, Pozań 999 [] Ostasewcz S., Rusak Z., Sedlecka K., Statystyka. Elemety teor zadaa, Wyd. AE we Wrocławu, Wrocław 999 [3] Sobczyk M., Statystyka, PWN, Warszawa 997
Waruk zalczea Egzam. Pozytywa ocea z ćwczeń. Egzam psemy 50% zadaa 50% teora 3. Ocea 60-68% dst 68-76% dst plus 76-84% db 84-9% db plus 9-00% bdb
T: Przedmot zadaa statystyk Ageda. Defcja. Geeza 3. Podstawowe pojęca zagadea 4. Proces badaa statystyczego
Defcja Statystyka jest to auka o metodach badaa zjawsk masowych, auka traktująca o metodach loścowych badaa prawdłowośc zjawsk masowych Zjawska masowe to zjawska, które występują często (p. zgoy, urodzea, małżeństwa, etc.)
Geeza Statystyka łac. status państwo Etapy rozwoju badaa zjawsk masowych: do XVII w. okres ewdecj zlczaa (dae, formacje) XVII XVIII w. opsywae zborowośc według wzorca podaego przez państwozawców (wykryce prawdłowośc w zjawskach masowych p. zgoach) od XVIII w. wprowadzee rachuku prawdopodobeństwa (rozwój metod statystyczych opartych a matematyce)
Podstawowe pojęca () Statystykę dzelmy a: - opsową, która ukazuje metody gromadzea, opracowaa prezetacj daych wraz z ch sumaryczym opsem, przy wykorzystau właścwych arzędz statystyczych - matematyczą zwaą woskowaem statystyczym, która powstała a gruce rachuku prawdopodobeństwa Statystyka ma zasadczo cztery zaczea: metoda pozawaa zjawsk masowych auka badająca zjawska masowe zbór lczb charakteryzujący zborowość (p. statystyka ludośc) parametr opsowy rozumay jako pewa welkość charakterystycza (p. średa arytmetycza, odchylee stadardowe)
Podstawowe pojęca () Przedmot badaa statystyczego Zborowość statystycza, populacja, masa statystycza Zborowoścą statystyczą azywamy zespół jedostek objętych badaem statystyczym, posadających jedą lub klka cech wspólych (stałych) oraz wele cech je różących Zborowość jedoroda to zborowość, którą tworzą jedostk ezróżcowae pod względem cechy stałej Jedostka statystycza to podstawowy elemet zborowośc statystyczej, który mus być jedozacze określoy pod względem rzeczowym (kogo lub co badamy), czasowym (kedy badamy) przestrzeym (gdze, a jakm terytorum badamy)
Podstawowe pojęca (3) Cecham statystyczym azywamy własośc jedostek statystyczych stałe zmee rzeczowe przestrzee czasowe czasowe przestrzee rzeczowe loścowe jakoścowe cągłe skokowe Źródło: []
Podstawowe pojęca (4) Szereg statystyczy to dae (lczby) odpowedo uporządkowae otrzymae w wyku przeprowadzoego badaa statystyczego szczegółowy rozdzelczy czasowy z cechą merzalą (loścową) z cechą emerzalą (jakoścową) mometów okresów puktowe przedzałowe geografcze e proste proste skumulowae skumulowae Źródło: []
Szereg szczegółowy Uporządkoway cąg wartośc badaej cechy statystyczej Np. wzrost [cm] w pewej grupe studetów 59; 59,5; 60; 6; 6; 6; 6; 6,5; 6,5; 63; 63; 63; 63; 63,5; 63,5; 64; 65; 65; 67; 67;67,5; 68; 68; 68; 68,5; 69; 69; 69; 69; 69,5; 69,5; 70; 70; 70,5; 70,5; 70,5; 70,5; 7; 7; 7,5; 73; 74; 75; 76; 76; 76,5; 77; 77; 77; 78; 78,5; 79; 79; 79; 80; 80; 8; 8; 8
Szereg rozdzelczy puktowy Szereg rozdzelczy staow zborowość statystyczą podzeloą a częśc (klasy) według określoej cechy z podaem lczebośc każdej z wyodręboych klas Np. wzrost [cm] w pewej grupe studetów 70 70,5 4 7 6 7,5 8 7 8 7,5 7 73 8 73,5 5 74 5 74,5 0
Szereg rozdzelczy przedzałowy Np. wzrost [cm] w pewej grupe studetów 56-60 60-64 0 64-68 68-7 7-76 0 76-80 80-84 5 84-88 0 88-9 4 9-96 & p. k + -środek k 3,3log - tego & 3 66 przedzału
Prezetacja grafcza szeregów Hstogram jest to zbór prostokątów, których podstawy, wyzaczoe a os odcętych, staową rozpętośc poszczególych przedzałów klasowych, atomast wysokośc są określoe a os rzędych przez lczebośc odpowadające przedzałom klasowym Dagram jest łamaą powstałą przez połączee puktów, których współrzędym są środk przedzałów klasowych odpowadające m lczebośc 5 0 5 0 5 0 55 60 65 70 75 80 85 90 95
Proces badaa statystyczego Badae statystycze jest procesem złożoym obejmującym całokształt czyośc badawczych zmerzających do pozaa zjawsk masowych za pomocą metody statystyczej. Proces te obejmuje: przygotowae badaa obserwację statystyczą opracowae statystycze aalzę statystyczą
Przygotowae badaa sformułowae problemu badawczego określee pozae przedmotu badaa celu zakresu badaa oraz postawee hpotez roboczych, które będą weryfkowae wybór metody obserwacj (peła lub częścowa) kostrukcja formularza statystyczego (układ pytań, odpowede częśc, kocepcja formularza)
Obserwacja statystycza Polega a uchwyceu teresującego badacza zespołu cech (określoych w formularzu statystyczym) Materał perwoty materał źródłowy otrzymay w toku specjalego badaa statystyczego Materał wtóry materał zebray do ych celów wykorzystay przez badacza do swoch celów
Opracowae statystycze kotrola formala merytorycza otrzymaego materału przełożee treśc a lczby opracowae schematów klasyfkacyjych dla badaych cech tablce robocze wykowe prezetacja grafcza rezultatów badaa
Aalza statystycza Wykryce prawdłowośc w badaej zborowośc - aalza struktury - aalza współzależośc - aalza dyamk - aalza przestrzea
Podsumowae zjawska masowe prawdłowośc statystyka opsowa statystyka matematycza szereg statystycze szczegółowy, rozdzelczy puktowy, rozdzelczy przedzałowy Szereg statystyczy rozkład zmeej, rozkład cechy (rozkład empryczy zmeej) grafcza prezetacja wyków różorake sposoby (p. wykresy kołowe) proces badaa statystyczego (przygotowae badaa, obserwacja statystycza, opracowae statystycze, aalza statystycza)
Rozkład empryczy zmeej Powró t Rozkładem empryczym zmeej azywamy przyporządkowae kolejym wartoścą zmeej odpowadających m lczebośc szereg statystyczy zmeej rozkład zmeej grafcze przedstawee rozkładu
T3: Metody aalzy rozkładu cechy Ageda. Mary położea. Mary zmeośc 3. Mary asymetr 4. Mary kocetracj
Mary położea Mary położea klasycze pozycyje średa arytmetycza e domata kwatyle średa harmocza średa geometrycza kwartyl perwszy medaa decyle kwartyl trzec e Źródło: []
Mary położea () Mary położea dzelą sę a: Mary przecęte, które charakteryzują śred lub typowy pozom wartośc cechy, wartośc wokół których skupają sę wszystke pozostałe wartośc aalzowaej cechy Kwatyle zdefowae jako wartośc cechy badaej zborowośc przedstawoej w postac szeregu statystyczego, które dzelą zborowość a określoe częśc pod względem lczby jedostek (częśc te pozostają do sebe w określoych proporcjach)
Średa arytmetycza () + + +... Dla szeregu szczegółowego: + + + k k k... Dla szeregu rozdzelczego puktowego: k
Średa arytmetycza () + + + k k k... & & & & Dla szeregu rozdzelczego przedzałowego: k
Średa arytmetycza (3) Własośc Suma wartośc cechy jest rówa loczyow średej arytmetyczej lczebośc zborowośc Średa arytmetycza speła waruek Suma odchyleń poszczególych wartośc cechy od średej rówa sę zero Suma kwadratów odchyleń poszczególych wartośc cechy od średej jest mmala m ma k k 0 ) ( 0 ) ( k m ) ( m ) (
Średa harmocza H Dla szeregu szczegółowego: k H Dla szeregu rozdzelczego puktowego: Dla szeregu rozdzelczego przedzałowego: k H &
Średa geometrycza G... Dla szeregu szczegółowego: Dla szeregu rozdzelczego: k k G k... k k G k... & & & &
Podsumowae - Średe klasycze Średa średch k Średa harmocza jest stosowaa, gdy wartośc cechy podae są w przelczeu a stałą jedostkę ej zmeej, czyl w postac wskaźków atężea (lczebośc w szeregu są wyrażoe w jedostkach lczka jedostek cechy) p. [kg/szt.] a [kg], [km/h] a [km] lub [l/m ] a [l] Średa geometrycza ma zastosowae przy badau średego tempa zma zjawsk (zjawska ujmowae są dyamcze)
Przykład () W czteroosobowej rodze średa mesęcza płaca wyos 300 zł. Jake wyagrodzee otrzymuje mama, jeżel ojcec mesęcze zaraba 500 zł, sy 300 zł, a córka 00 zł? Mama otrzymuje 00 zł mesęcze Śred wek w -osobowej grupe uczów wyos lat. Najstarszy człoek grupy ma 7 lat, a średa weku pozostałych wyos 0 lat. Ilu uczów lczy ta grupa? Grupa lczy 7 osób
Przykład () Oblcz średą prędkość samochodu, jeśl wadomo, że a) jechał 30 m. z prędkoścą 00 km/h oraz 45 m. z prędkoścą 60 km/h? B) jechał 50 km z prędkoścą 00 km/h 45 km z prędkoścą 60 km/h? Jake średe ależy zastosować dlaczego? W obu przypadkach jechał z prędkoścą 76 km/h
Domata () Domata (wartość ajczęstsza, moda, modala) wartość cechy statystyczej występująca ajczęścej w daym rozkładze empryczym. Wartość ajczęścej występująca w szeregu statystyczym. w szeregach szczegółowych rozdzelczych puktowych jest to wartość cechy, której odpowada ajwększa lczebość. w szeregach rozdzelczych przedzałowych oblcza sę przyblżoą wartość ze wzoru terpolacyjego (lub grafcze wyzacza sę z hstogramu)
Domata () 0 D D D D D D D D 0 ) ( ) ( D + + + 0 5 0 5 0 5 55 60 65 70 75 80 85 90 95
Kwatyle () Kwatyle to wartośc cechy badaej zborowośc, które dzelą zborowość a określoe częśc pod względem lczby jedostek Kwartyl perwszy dzel zborowość a dwe częśc w te sposób, że 5% jedostek zborowośc ma wartośc e wyższe ż kwartyl perwszy, a 75% jedostek zborowośc ma wartośc e ższe ż kwartyl perwszy Kwartyl drug (medaa, wartość środkowa) dzel zborowość a dwe częśc w te sposób, że połowa jedostek zborowośc ma wartośc e wyższe ż medaa, a połowa jedostek zborowośc ma wartośc e ższe ż medaa Kwartyl trzec dzel zborowość a dwe częśc w te sposób, że 75% jedostek zborowośc ma wartośc e wyższe ż kwartyl perwszy, a 5% jedostek zborowośc ma wartośc e ższe ż kwartyl perwszy
+ + + C p ) ( C p Q p p p ] [ p Kwatyle () Dla szeregu szczegółowego rozdzelczego puktowego: Q Q Q p cum p Q + Dla szeregu rozdzelczego przedzałowego: 3 Q Q Me Q Q Q Q (0;) p 4 3 4
Przykład (3) Na podstawe poższych daych porówaj śred wzrost w obu klasach, wyzacz domatę kwartyle oraz odpowedz a pytae: czy w klase A jest węcej uczów o wzrośce wększym od przecętego?. Odpowedź uzasadj Wzrost Klasa A Klasa B 58-6 3 6-64 5 3 64-67 8 6 67-70 5 8 70-73 6 5 73-76 3 6
Przykład (4) Wzrost Klasa A Klasa B środek cum cum 58-6 3 59,5 478,5 39 3 6-64 5 3 6,5 8,5 487,5 8 5 64-67 8 6 65,5 34 993 6 67-70 5 8 68,5 57,5 348 3 9 70-73 6 5 7,5 09 57,5 37 34 73-76 3 6 74,5 53,5 047 40 40 suma 40 40 6695 6767 średa 67,375 69,75
Przykład (5) W pukce skupu makulatury studec wykoal projekt ze statystyk badając pewą losowo wybraą próbę z populacj wag oddawaej makulatury. Oblczoo, że medaa wyos kg umejscowoa jest w przedzale od 0 kg do 5 kg, którego lczebość wyos 35. Jaka jest lczebość badaej próby, jeśl 30 osób z tej próby oddało makulaturę o wadzę mejszej ż 0 kg? Lczebość badaej próby wyos 88
Mary zmeośc Mary zmeośc klasycze pozycyje waracja odchylee stadardowe rozstęp odchylee przecęte odchylee ćwartkowe współczyk zmeośc współczyk zmeośc Źródło: []
Klasycze mary zmeośc () Waracja jest to średa arytmetycza kwadratów odchyleń poszczególych wartośc od średej arytmetyczej zborowośc k k ) ( s ) ( s ) ( s & s ) (,D, s σ
Klasycze mary zmeośc () Odchylee stadardowe określa przecęte zróżcowae poszczególych wartośc cechy od średej arytmetyczej. O le wartośc cechy różą sę średo od wartośc średej s s s, σ,s( )
Klasycze mary zmeośc (3) s s typ + < < Typowy obszar zmeośc, który obejmuje około /3 jedostek zborowośc: Odchylee przecęte o le jedostk daej zborowośc różą sę średo względem wartośc badaej cechy od średej arytmetyczej: k k d d d & d s
Klasycze mary zmeośc (4) Waracja ogóla, która jest sumą waracj wewątrzgrupowej mędzygrupowej: + k m k w m w ) ( s s s s s s Współczyk zmeośc: 00% d V 00% s V d s Rówość waracyja
Pozycyje mary zmeośc () Rozstęp: R ma m Odchylee ćwartkowe: Q Q Q 3 Typowy obszar zmeośc cechy: Me Q < typ < Me + Q
Pozycyje mary zmeośc () Współczyk zmeośc I: V Q Q Me 00% V Współczyk zmeośc II: Q Q 3 00% Q + Q Q,Q 3 3
Przykład (6) W dwóch przedsęborstwach przeprowadzoo badae robotków pod względem stażu pracy w zakładze. Otrzymao astępujące dae: Przedsęborstwo I śred staż 5 lat V 0% Przedsęborstwo II śred staż 0 lat V 5% Oblczyć śred staż, s V dla całej zborowośc pracowków wedząc, że lczba robotków w przedsęborstwe I wyosła 0 osób a w drugm 80 osób. Śred staż 3 lat, s3,73 roku, V9%
Mary asymetr () Wzrost Klasa A Klasa B 58-6 3 0 0 6-64 8 3 64-67 5 6 67-70 6 8 5 0 5 0 70-73 5 5 73-76 3 6 Klasyczo-pozycyjy wskaźk skośośc: 5 0 3 4 5 6 5 0 3 4 5 6 W sk D asymetra prawostroa asymetra lewostroa Pozycyjy wskaźk skośośc: Wsp ( Q3 Me ) ( Me Q ) D Me Me D
Mary asymetr () Klasyczo-pozycyjy współczyk asymetr (skośośc): A A s d D s D d Klasyczy współczyk asymetr (skośośc): A m s 3 3 m m r r Momet cetraly trzecego rzędu Momet cetraly rzędu r: k ( ( & ) ) r r Pozycyjy współczyk asymetr (skośośc): ( Q ( Q Me ) ( Me Q Me ) + ( Me Q 3 3 AQ 3 ) ) Q + Q Q Me
Mary kocetracj () kocetracja wartośc cechy wokół średej m wększe zróżcowae, tym mejsza kocetracja współczyk skupea (kurtoza): 30 5 Wykres wysmukły (leptokurtyczy) K K' m 4 s m s 4 4 4 3 0 5 0 5 0 3 4 5 6 7 8 9 0 3 K K' > > 3 0 9 8 7 6 5 4 3 0 3 4 5 6 7 8 9 0 3 Wykres spłaszczoy (platokurtyczy) K K' < < 3 0
Mary kocetracj () Krzywa kocetracj Loreza Współczyk kocetracj Loreza 0,9 K L a 5000 5000 b 5000 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0 a b cum 0,8 0,7 skumulowae odsetk lczebośc 0,6 0,5 0,4 0,3 0, cum skumulowae odsetk loczyu wartośc cechy lczebośc 0, 0 brak kocetracj K L 0
Przykład (7) Uzupełć dae dotyczące wzrostu (w cm) w dwóch klasach Średa 60 Typowy obszar zmeośc Współczyk zmeośc (55-65) 3,5% 6 (57;65),484% Domata 6 60 Współczyk asymetr -0, Waracja 5 0,5 6
Podsumowae - uzupełee Wzór Pearsoa: D 3( Me ) Sła asymetr: A 0,3 słaba 0,3 < A 0 7, umarkowa a 0 7, < A 0,9 sla 0,9 < A skraja ajważejsza jest terpretacja otrzymaych wyków wszystke oblczea mają ses jedye, gdy prowadzą do wosków wszechstroa aalza opsowa polega a oblczeu wszystkch adekwatych mar wraz z prawdłową terpretacją otrzymaych wyków aalza opsowa populacj a podstawe próby opera sę a detyczych zasadach z uwzględeem teor estymacj
T4: Badae współzależośc zjawsk Ageda. Wprowadzee. Aalza korelacj 3. Aalza regresj 4. Podsumowae
Korelacja () Korelacja cech loścowych Korelacja cech jakoścowych Korelacja lowa Korelacja elowa Zależość korelacyja (korelacja) polega a tym, że określoym wartoścom jedej zmeej odpowadają ścśle określoe średe wartośc drugej zmeej Korelacja dodata - wzrostow wartośc jedej cechy odpowada wzrost średch wartośc drugej cechy Korelacja ujema - wzrostow wartośc jedej cechy odpowada spadek średch wartośc drugej cechy
Korelacja () Wzrokowa ocea korelacyjego wykresu rozrzutu puktów empryczych 30 5 0 5 0 5 0 0 4 6 8 0 korelacja lowa dodata 30 5 0 5 0 5 0 0 4 6 8 0 korelacja lowa ujema 30 5 0 5 0 5 0 4 4,5 5 5,5 6 6,5 7 7,5 brak korelacj 35 30 5 0 5 0 5 0 0 4 6 8 0 4 6 korelacja krzywolowa
Korelacja (3) Rozkład warukowy Rozkład warukowy Szereg szczegółowy: y y y......... y Tablca korelacyja: Rozkład brzegowy Rozkład brzegowy y y y... y j... y s....... k.j... j... s.... j... s......................... j... s...................... k k... kj... ks k.......j....s
Współczyk korelacj lowej Pearsoa Mara sły zwązku lowego mędzy cecham y y s s cov( y ) r y y y ) cov( y y ) y ( ) ( y ) y )( ( r Dla szeregu szczegółowego: s j k k s j j y y ) y ( ) ( y ) y )( ( r & & & & Dla tablcy korelacyjej: k s j j y ) y )( ( y ) cov( & & ) y y )( ( cov( y ) symetryczy
Wartość współczyka korelacj lowej Pearsoa ry r y < 0, brak zwązku lowego 0, r y < 0,4 słaba zależość lowa 0,4 r y < 0 7, umarkowa a zależość lowa 0 7, r y < 0,9 zacząca zależość lowa 0,9 r y bardzo sla zależość lowa
Przykład () W fabryce zbadao, jak kształtuje sę średa wydajość pracowków w zależośc od czasu eprzerwaej pracy Czas pracy w godz. Wydajość w szt./godz. 3 4 5 6 7 0 0 8 5 3 Czy steje sla zależość mędzy czasem pracy a wydajoścą?
Przykład () X Y X Y X Y 0 0 400 44 4 484 3 3 0 60 9 400 4 4 8 7 6 34 5 5 5 75 5 5 6 6 3 78 36 69 7 7 84 49 44 Σ 8 0 433 40 46 średa 4 7,4 6,86 0 306,57 cov( y ) y y 6,86 4 7,4 6 7, S 0 4 0 6 S y y y 306,57 7,4 4, 79 r y cov( y ) s s y 6 7, 3,58 0,94
Przykład (3) Isteje bardzo sla lowa zależość korelacyja mędzy czasem pracy a wydajoścą Zależość tą cechuje korelacja ujema, czyl m dłuższy czas pracy tym ższa średa wydajość pracy
Przykład (4) Daa jest tablca korelacyja stażu pracy (Y) pracowków w pewym zakładze oraz lczby pobraych przez ch pożyczek (X) z kasy zapomogowo-pożyczkowej. Lczba pożyczek Staż pracy w latach 0 4 4-8 8-30 3-3 4 4 8 5 6-8 Oblczyć współczyk korelacj mędzy stażem pracy pracowków a lczbą pobraych pożyczek
Przykład (5) X Y 0 4 4-8 8-30 3-33 49,5 74,5 3 4 4 8 34 9 46,5 5 6-8 9 49,5 7,5 j 34 0 76 8 763 j y j 68 3 00 400 j y j 36 79 000 98 S,8 S y 0,83 cov( y ) r y 0,80 3,53
Stosuk (wskaźk) korelacyje Pearsoa s s s y yw ym s yw k + s k s ( ym y y. y ). s s s w m s w + s s j s j s m j ( j. j ). j esymetrycze ezależe od kształtu zależośc <0; > e y 0 eskorelowae e y zależość fukcyja e y s s ym yw m w e y sy s s y s s s Stosuek korelacyjy zmeej Y względem zmeej X Stosuek korelacyjy zmeej X względem zmeej Y
Przykład (6) & y& j 6 0 y y.,5 30 3 0 33 49,5 74,5,36 78 3,5 4 8 34 9 46,5 6,94 36 5,5 0 8 9 49,5 7,5 9,56 86 j 34 0 76 8 763 400 j y j 68 3 00 400 j y j j j. j 36 79 000 98,74 3,3 4,30 59 73 86 8 S y 0,83 S,8 r y 0,80,7 7,37 ey 0,80 e y 0,8,8 0,83
Kwadraty wskaźków korelacyjych Kwadraty wskaźków korelacyjych azywae są współczykam determacj, które formują w lu procetach zmay zmeej zależej są spowodowae (zdetermowae) zmaam zmeej ezależej 00 e y Ocey kwadratów wskaźków korelacyjych wyrażoe w procetach 00 e y
Stopeń krzywolowośc Różca mędzy kwadratam wskaźka korelacj oraz współczyka korelacj wartośc z przedzału <0;> m>0, krzywolowość zwązku jest stota w przecwym wypadku jeśl wartość r y pozwala, moża uzać zwązek lowy m m y y e e y y r r y y
Współczyk korelacj rag Spearmaa Służy do opsu sły korelacj dwóch cech, w sytuacj, gdy steje możlwość uporządkowaa obserwacj empryczych w określoej kolejośc 6 r s ( d ) d ozacza różcę mędzy ragam odpowadających sobe -tych obserwacj (wartośc) cechy X oraz Y stosoway zwykle dla cech jakoścowych lub loścowych z ewelką lczbą obserwacj przyjmuje wartośc z przedzału <-;> terpretacja wartośc detycza jak współczyka korelacj Pearsoa
Przykład (6) X Y d d - 3-3 3 4 4 4 5-5 5 4 6 6 7-7 7 6 Σ 0 6 d 6 0 s ( ) 7( 49 ) r 0,8
Korelacja weloraka cząstkowa () przy badau welu cech, welu zmeych korelacja weloraka, gdy uwzględa sę oddzaływae a jedą zmeą (zależą) welu zmeych (ezależych) korelacja cząstkowa, gdy badamy współzależośc tylko ektórych cech (zmeych), elmując wpływ pozostałych
Korelacja weloraka cząstkowa () r j.kl...z Współczyk korelacj cząstkowej P j P P jj P j jest dopełeem algebraczym macerzy P współczyków korelacj par wszystkch włączoych do aalzy zmeych, powstałym przez skreślee -tego wersza j-tej kolumy P r... rz r... r z............ r r z z...
Korelacja weloraka cząstkowa (3) Współczyk korelacj welorakej R. jkl...z det det P P P jest macerzą powstałą z macerzy P przez usuece -tego wersza -tej kolumy
Korelacja cech jakoścowych Cecha X + - RAZEM Cecha Y + a b a+b - c d c+d RAZEM a+c b+d ϕ (a + ad bc b)(a + c )( b + d )(c + d )
Wprowadzee - regresja Fukcja regresj to aaltyczy wyraz przyporządkowaa średch wartośc zmeej objaśaej (zależej) kokretym wartoścom zmeych objaśających (ezależych). Emprycza l regresj zmeej Y względem X jest lą łamaą powstałą przez połączee puktów o współrzędych (,y ) Emprycza l regresj zmeej X względem Y jest lą łamaą powstałą przez połączee puktów o współrzędych ( y j,y j )
Fukcja regresj Na podstawe empryczych l regresj moża postawć hpotezę odośe typu fukcj matematyczej (lowa, wykładcza, parabola, td.) opsującej mechazm powązań mędzy badaym zmeym Fukcja regresj II rodzaju jest przyblżeem empryczych l regresj. Wybór postac aaltyczej fukcj regresj II rodzaju ależy dokoywać róweż a podstawe źródeł pozastatystyczych (teor ekoom, op ekspertów, dośwadczeń wykających z poprzedch badań, etc)
Lowa fukcja regresj () Fukcja regresj II rodzaju Y względem X: ˆ α + α + Y 0 f( ) X ξ α cov( XY ), α0 y α S X Fukcja regresj II rodzaju X względem Y: ˆ X 0 g( Y ) β + β Y + ξ ' β cov( XY ), β0 βy S Y
Lowa fukcja regresj () Zwązk mędzy współczykem korelacj oraz parametram strukturalym lowej fukcj regresj r α β y r r y y α S S S S β y y
Badae dokładośc oszacowaej fukcj regresj () ˆ z ŷ y e Reszty zbudowaego modelu: ) ˆ ( S ) ŷ ( y S z e Waracja resztowa:
Badae dokładośc oszacowaej fukcj regresj () ϕ Współczyk zbeżośc: y ( y ( y ŷ y ) ) R Współczyk determacj: y ( ŷ ( y y y ) ) R y + ϕ y R y r y
Podsumowae - regresja lowa fukcja regresj regresja krzywolowa regresja welu zmeych badae dokładośc weryfkacja
T5: Badae dyamk zjawsk Ageda. Podstawowe pojęca. Badae zma szeregu dyamczego 3. Ideksy dywduale agregatowe 4. Dekompozycja szeregu dyamczego 5. Metody wyodrębea tredu
Podstawowe pojęca Aalzę dyamk zjawsk masowych przedstawa sę a podstawe szeregów czasowych (dyamczych, chroologczych). Szeregem dyamczym azywamy cąg wartośc badaego zjawska obserwowaego w kolejych jedostkach czasu. W szeregach czasowych zmeą ezależą jest czas, atomast zmeą zależą jest wartość badaego zjawska. Szereg czasowe mometów formują o o rozmarach zjawska w pewych ścśle określoych mometach (chwlach) Szereg czasowe okresów formują o rozmarach zjawska w określoych przedzałach czasu.
Średa w szeregu dyamczym W przypadku szeregu czasowego okresów przecęty pozom badaego zjawska oblcza sę za pomocą średej arytmetyczej (w przypadku erówych przedzałów czasowych ależy przyjąć odpowede wag). W przypadku szeregu czasowego mometów oblcza sę średą chroologczą: 3 ch + + + + + + + + +......
Badae zma szeregu dyamczego Przyrosty absolute: Przyrosty względe: Ideksy (wskaźk dyamk): k t k t, t t t t, k k t k t / t t t t t / k t k t / t t t t / jedopodstawowe łańcuchowe
Przykład Średa rocza prema w pewej frme kształtowała sę w ostatch latach w astępujący sposób: t 3 4 5 t 50 30 390 450 550 t, 0 70 40 00 300 t,3-40 -70 0 60 60 t,t- - 70 70 60 00 t/ 0,0000 0,0560 0,0 0,600 0,400 t/3-0,007-0,0504 0,0000 0,043 0,5 t/t- - 0,0560 0,0530 0,043 0,0690 t/,0000,0560,0,600,400 t/3 0,8993 0,9496,0000,043,5 t/t-,0560,0530,043,0690
Średe tempo zma 3 G y y y y y y y y... Przyjmując, że średe tempo przyrostu wartośc prem z roku a rok e ulege zmae, jaka będze kształtować sę prema w kolejych 3 latach? 80 07 055 550 y y 75 9 055 550 y y 635 5 055 550 y y 055 4 3 3 G 5 8 G 5 7 G 5 6 4 G, ), ( ) ( *, ), ( ) ( *,, *,, / T G T y y ) ( *
Ideksy dywduale Ideksy dywduale są stosowae w badau dyamk zjawsk jedorodych. Zwykle rozpatruje sę trzy rodzaje dywdualych wskaźków dyamk: Idywdualy deks ce: p p p 0 Idywdualy deks lośc: q q q Rówość deksowa: 0 Idywdualy deks wartośc: w q q 0 p p 0 w p q
Ideksy zespołowe (agregatowe) Ideksy agregatowe służą do badaa dyamk zespołu zjawsk zwykle ejedorodych bezpośredo esumowalych. Kostrukcja deksów agregatowych opera sę a wykorzystau określoych współczyków przelczeowych w postac wag, którym ajczęścej są cey lośc. Wyróża sę deksy agregatowe dla welkośc absolutych oraz dla welkośc stosukowych. Do zespołowych deksów welkośc absolutych zalcza sę: agregatowy deks wartośc, agregatowy deks lośc, agregatowy deks ce.
Ideksy agregatowe () 0 0 0 0 w p q p q p q p q I Agregatowy deks wartośc: 0 0 0 L q p q p q I Agregatowy deks lośc wg formuły Laspeyresa: Agregatowy deks lośc wg formuły Paashego: 0 P q p q p q I
Ideksy agregatowe () 0 0 0 L p q p p q I Agregatowy deks ce wg formuły Laspeyresa: Agregatowy deks ce wg formuły Paashego: 0 P p q p p q I P p L p F p I I I Agregatowy deks ce wg formuły Fshera: Agregatowy deks lośc wg formuły Fshera: P q L q F q I I I
Ideksy agregatowe (3) Rówość deksowa dla deksów agregatowych: I w I L p I P q I L q I P p I F p I F q
Przykład W pewym zakładze produkowae są trzy wyroby. Zebrao formacje dotyczące produkcj (w setkach sztuk) oraz ce jedostkowych (w setkach złotych) wyrobów w dwóch latach: 003 (okres bazowy) 005 (baday okres). Iformacje te przedstawoo w poższej tabel. Wyrób Produkcja Cey jedostkowe 003 (q 0 ) 005 (q ) 003 (p 0 ) 005 (p ) A 0,8, 4 30 B,,4 8 0 C,5, 30 3 Jak zmeła sę wartość produkowaych wyrobów w porówywaych okresach? Jak wpływ a zmaę wartośc mała dyamka ce, a jak dyamka lośc produkowaych wyrobów?
Model wahań w czase Modelem wahań w czase azywamy kostrukcję teoretyczą (rówae lub układ rówań), która opsuje kształtowae sę określoego zjawska jako fukcj zmeej czasowej, odchyleń perodyczych (okresowych) oraz odchyleń przypadkowych. Na zmeość badaego zjawska w czase mają wpływ: tedecja rozwojowa (tred), wahaa okresowe, wahaa przypadkowe (losowe). Y Y t Model addytywy: F(t ) + G (t ) + ξ(t ) Model multplkatywy: t F(t ) G (t ) 0 ξ ( t ) Y t pozom badaego zjawska F(t) fukcja tredu G (t) fukcja wahań okresowych ξ(t) składk losowy
Metody wyodrębaa tredu Tredem (tedecją rozwojową) azywamy powole, regulare systematycze zmay określoego zjawska, obserwowae w dostatecze długm czase będące rezultatem przyczy główych. Najczęścej do wyodrębea wykorzystuje sę: mechaczą metodę średch ruchomych aaltyczą metodę ajmejszych kwadratów
Metoda mechacza wyodrębaa tredu Polega a zastępowau daych empryczych (dla kolejych okresów) średm pozomam z okresu badaego klku okresów sąsedch. Średe ruchome mogą być oblczae z parzystej (średe ruchome scetrowae) lub eparzystej (średe ruchome zwykłe) lczby kolejych wyrazów szeregu empryczego. Zwykle w celu wyodrębea tredu stosuje sę średe ruchome zwykłe. 3 y y y y... 3 y y y y 3 y y y y y,...,,y y 4 3 3 + + + + + + 4 y y y y y y... 4 y y y y y y 4 y y y y y y y,...,,y y 3 4 4 6 5 4 3 5 4 3 + + + + + + + + + + + +
Metoda aaltycza wyodrębaa tredu Polega a dopasowau określoej fukcj matematyczej do całego szeregu czasowego. Istotym problemem jest dobór postac aaltyczej fukcj tredu. Do ajczęścej stosowaych fukcj tredu ależy fukcja lowa. Dla przeumerowaych jedostek czasu Y t α Ŷ t 0 a + α t 0 + a t + ξ t a 0 y t t t t y a t y (t (t t t ) ) t' t' y t' t t'
Przykład Na podstawe daych dotyczących zysków osągaych przez pewe przedsęborstwo wyodrębć tedecję rozwojową metodą mechaczą (zastosować róże średe ruchome) oraz aaltyczą. Jeśl tred sę e zme, to jake średe zysk osąge przedsęborstwo w drugm kwartale 007 roku? 000 00 00 003 004 I 5, 33,6 6,0 7,7 30,5 II,4 4,0 6,6 6, 3, III,8 3,9 30, 9,3 9,8 IV 3, 3,3 5, 5,5 5,9 V,5 3,3 5, 5,5 7,9 VI,3 3, 4,6 5, 4,9 VII, 3,0 3,6,3 4,3 VIII,6,9,5 4, 4, IX 0,6,3,7 4, 4,3 X 4,6 4, 4, 5,4 6,0 XI 3,6 4, 5,6 7, 5,9 XII 8, 8,4 7,4 9,4 9,4
Rozwązae Średe ruchome trzyokresowe 000 00 00 003 004 I - 8,4 6, 6,9 9,0 II - 8,6 7,0 7, 30,7 III 3, 7, 7,6 7,7 30,8 IV,5 3,7 7,3 7,0 9,3 V,8 3,5 6,8 6,8 7,9 VI,3 3, 4,9 5,4 6, VII,0 3, 4,4 4,3 5,7 VIII,7,7 3,6 3,9 4,5 IX,4,4,9 3,5 4,3 X,3,8 3, 4,5 4,8 XI,9 3,6 4, 5,5 5,4 XII 5,4 5,6 5,7 7,3 7,
Rozwązae 35,0 30,0 5,0 0,0 5,0 0,0 3 4 5
Rozwązae Średe ruchome dzewęcokresowe 000 00 00 003 004 I - 4, 4,0 4,8 6,0 II - 4,4 4,4 4,9 6,7 III - 4,7 5, 5,5 7, IV - 4,8 5,4 5,7 7,6 V - 5,0 5,8 6,0 8,0 VI - 5,3 6,0 6,3 8, VII - 5, 6,0 6, 8,0 VIII - 4,9 5,8 5,9 7,7 IX,3 4,3 5, 5,5 7, X, 3, 5,0 5,3 6,6 XI,5 3, 4,8 5,4 5,9 XII 3, 3,7 4,5 5,4 5,9
Rozwązae 35,0 30,0 5,0 0,0 5,0 0,0 3 4 5
Metoda aaltycza wyodrębaa tredu przykład 000 00 00 003 004 Suma I 5, 33,6 6,0 7,7 30,5 64,9 II,4 4,0 6,6 6, 3, 630,4 III,8 3,9 30, 9,3 9,8 636,0 IV 3, 3,3 5, 5,5 5,9 63,0 V,5 3,3 5, 5,5 7,9 64,3 VI,3 3, 4,6 5, 4,9 69, VII, 3,0 3,6,3 4,3 65,3 VIII,6,9,5 4, 4, 64,3 IX 0,6,3,7 4, 4,3 64,0 X 4,6 4, 4, 5,4 6,0 64,4 XI 3,6 4, 5,6 7, 5,9 66,4 XII 8, 8,4 7,4 9,4 9,4 64,7 75,8 Arkusz kalkulacyjy MS Ecel
Podsumowae badae dyamk zjawsk aalza szeregu czasowego składk modelu wahań w czase (tred, wahaa sezoowe, wahaa przypadkowe) główe zastosowae: progozowae ekoometra
T6: Zmee losowe ch podstawowe rozkłady Ageda. Podstawowe pojęca. Zmea losowa cągła skokowa 3. Podstawowe charakterystyk rozkładów 4. Wybrae rozkłady zmeej losowej skokowej 5. Wybrae rozkłady zmeej losowej cągłej
Podstawowe pojęca () Zmeą losową azywamy zmeą, która przyjmuje wartośc ze zboru lczb rzeczywstych z określoym prawdopodobeństwem. Zmeą losową azywamy dyskretą lub skokową, jeżel przyjmuje wartośc z skończoego zboru wartośc lub przelczalego zboru wartośc. Zmeą losową azywamy cągłą jeżel wartośc tej zmeej przyjmują wartośc z całego zboru lczb rzeczywstych lub z przedzałów (przedzału) lczbowych zboru lczb rzeczywstych. Rozkładem prawdopodobeństwa zmeej losowej azywamy fukcję, która przyporządkowuje wartoścom zmeej prawdopodobeństwo.
Podstawowe pojęca () Dystrybuatą zmeej losowej X azywamy fukcję zmeej rzeczywstej taką, że: Własośc dystrybuaty: lm F( ) 0 F()P(X<) jest fukcją przyajmej lewostroe cągłą jest fukcją emalejącą lm F( )
Zmea losowa skokowa Rozkładem skokowej zmeej losowej azywamy fukcję,która realzacjom zmeej losowej przyporządkowuje prawdopodobeństwo: P(X )p Dystrybuata zmeej losowej skokowej: F( ) < p
Wartość oczekwaa zmeej losowej skokowej Wartość oczekwaa (średa, adzeja matematycza): E(c)c E( X ) p Własośc wartośc oczekwaej: E(X+Y)E(X)+E(Y) E(X-Y)E(X)-E(Y) E(cX) ce(x) E(XY)E(X)E(Y) jeśl zmee są ezależe
Waracja zmeej losowej skokowej Waracja zmeej losowej skokowej (S (X), D (X)): S S ( X ) ( ( X ) E( X E( ) E X )) ( X ) Własośc waracj: S (c)0 S (cx)c S (X) S (X+Y) S (X)+ S (Y) S (X-Y) S (X)+ S (Y) p
Przykład Rzucamy dwukrote symetryczą moetą. Jeśl wypade dwukrote orzeł otrzymujemy zł, jeśl wypade dwukrote reszka otrzymujemy 3 zł, jeśl wypade za perwszym razem orzeł, a za drugm reszka, to otrzymujemy zł. Jeśl atomast perwsza będze reszka, a późej orzeł, to c e dostaemy a) przedstawć fukcję prawdopodobeństwa wygraej b) przedstawć dystrybuatę aalzowaej zmeej losowej c) oblczyć wartość oczekwaą oraz warację wygraej
0 3 p 0,5 0,5 0,5 0,5 < < < < 3 3 75 0, 0,5 0 0,5 0 0 ) F(
0 3 p 0,5 0,5 0,5 0,5 p 0 0,5 0,5 0,75,5 0 4 9 p 0,5 0,5 0,5 0,5 p 0 0,5,5 3,5 S ( X ) E( X ) E ( X ) 3,5 (,5 ),5
f ( Zmea losowa cągła Fukcja gęstośc prawdopodobeństwa zmeej losowej cągłej: ) lm 0 P( < X < + ) F( ) f ( )d Jeśl F() jest różczkowala: F ' ( ) f ( )
Własośc fukcj gęstośc:. f ( ) 0 0 f ( ). f ( )d 3. P(a < X < b) P(a X b) b f ( )d P( X a) 0 a
Charakterystyk lczbowe rozkładu zmeej losowej cągłej Wartość oczekwaa: E( X ) f ( )d por. własośc wartośc oczekwaej Waracja zmeej losowej cągłej: S ( X ) ( E( X )) por. własośc waracj f ( )d
Przykład Dla jakej wartośc parametru a poższa fukcja jest fukcją gęstośc prawdopodobeństwa f ( ) 0 3 a 9 0 3 poza tym Wyzaczyć dystrybuatę zmeej X. Oblczyć E(X) oraz S (X). Jake jest prawdopodobeństwo, że zmea jest wększa od mejsza od 4?
Ie charakterystyk lczbowe rozkładów zmeych losowych Kwatylem rzędu p azywamy wartość zmeej losowej, dla której F( )p Modą, domatą zmeej losowej azywamy taką wartość * zmeej losowej, dla której: f(*)ma f() dla zmeej cągłej, P(X*)ma P(X ) dla zmeej skokowej Współczykem zmeośc zmeej losowej azywamy wyrażee: V S S ( X ) E( X ) ( 00%)
Wybrae rozkłady zmeej losowej skokowej () Zmea losowa X ma rozkład zero-jedykowy, jeżel jej fukcja rozkładu jest określoa wzorem: P(X)p oraz P(X0)q-p Dystrybuata rozkładu zero-jedykowego: F( ) 0 q 0 0 < >
Wybrae rozkłady zmeej losowej skokowej () Zmea losowa X ma rozkład dwumaowy, jeżel jej fukcja rozkładu jest określoa wzorem: k P( 0, X,,..., k ) Dystrybuata rozkładu dwumaowego: C k oraz p k q p k + q F( ) k< C k p k q k E( X ) p oraz S ( X ) pq
Wybrae rozkłady zmeej losowej skokowej (3) Zmea losowa X ma rozkład Possoa, jeżel jej fukcja rozkładu jest określoa wzorem: P( X Dystrybuata rozkładu Possoa: k F( ) k λ k ) k! 0,,,... k< E( X ) S λ k! k e e λ λ ( X ) λ
Zmea losowa X ma rozkład jedostajy w przedzale <a,b>, jeżel jej fukcja gęstośc jest określoa wzorem: Dystrybuata rozkładu jedostajego: > < b 0 b a a b a 0 ) f ( Wybrae rozkłady zmeej losowej cągłej () > < b b a a b a a 0 ) F(
Wybrae rozkłady zmeej losowej cągłej () Zmea losowa X ma rozkład wykładczy, jeżel jej fukcja gęstośc jest określoa wzorem: f ( ) 0 λ e λ Dystrybuata rozkładu wykładczego: < 0 0 F( ) 0 e λ < 0 0
Wybrae rozkłady zmeej losowej cągłej (3) Zmea losowa X ma rozkład ormaly, jeżel jej fukcja gęstośc jest określoa wzorem: f( ) e σ π ( m ) σ Dystrybuata rozkładu ormalego: R F( ) σ π e ( m ) σ d
T7: Rozkład ormaly Ageda. Fukcja gęstośc oraz dystrybuata. Stadaryzoway rozkład ormaly N(0,) 3. Tablce dystrybuaty rozkładu ormalego 4. Przykład: umem stadaryzować korzystać z tablc dystrybuaty rozkładu ormalego 5. Wybrae rozkłady zwązae z rozkładem ormalym
Podstawowe określea Zmea losowa X ma rozkład ormaly, jeżel jej fukcja gęstośc jest określoa wzorem: f( ) Dystrybuata rozkładu ormalego: e σ π ( m ) σ R F( ) σ π e ( m ) σ d Zmea losowa X o rozkładze ormalym o średej m odchyleu stadardowym σ X - N(m,σ)
Stadaryzoway rozkład ormaly () Dla rozkładu N(0,) fukcja gęstośc przyjmuje astępującą postać: f ( ) e π R Dystrybuata rozkładu ormalego N(0,): F( ) π e d TABLICE ROZKŁADU N(0,)
Stadaryzoway rozkład ormaly () Dla rozkładu N(m,σ) ależy zastosować przekształcee azywae stadaryzacją: U X m σ Zmea stadaryzowaa ma rozkład: U N(0,)
Fukcja gęstośc rozkładu ormalego krzywa ormala, krzywa Gaussa-Laplace a 0,9 0,8 0,7 0,6 N(0;0,5) N(0,) 0,5 0,4 0,3 b N(,5;0,75) 0, 0, 0-4 -3,6-3, -,8 -,4 - -,6 -, -0,8-0,4-0 0,4 0,8,,6,4,8 3, 3,6 4 N(;,5)
. Jest krzywą w kształce dzwou, symetryczą względem prostej m. Ma jedo maksmum w pukce m 3. Ma dwa pukty przegęca o współrzędych: (m Własośc krzywej Gaussa σ, ) oraz (m + σ, σ π e σ π e 4. Lewe prawe ramę (ogo) krzywej zblżają sę asymptotycze do os odcętych )
3 3,35 3,7 0,45 0,4 0,35 0,3 0,5 0, 0,5 0, 0,05 0 Tablce dystrybuaty rozkładu ormalego F(X) b -,6 -,5 -,9 -,55 -, -0,85-0,5-0,5 0, 0,55 0,9,5,6,95,3,65 X -3,3 -,95-3,65-4
Przykład Jak procet produkcj zakładów obuwczych powo staowć obuwe o rozmarach od 7do 33, jeżel wadomo, ze długość stopy u dorosłego człoweka jest zmeą losową o rozkładze N(9,3). P (7 < X < 33 ) FN( 9,3 )(33 ) FN( 9,3 )(7 ) 33 9 7 9 Φ Φ Φ 3 3 0,908 ( 0, 7486 ) 0,6568 (,33 ) Φ( 0,67 ) Produkcja obuwa aalzowaego rozmaru powa staowć 65,68%
Rozkład χ (ch kwadrat) Rozkładem ch-kwadrat z k stopam swobody zmeej losowej χ k azywamy rozkład sumy k elemetowej kwadratów ezależych zmeych losowych o stadaryzowaym rozkładze ormalym N(0,): χ X k X + X N(0, ) +... + X k,,..., k
Lczba stop swobody Lczba stop swobody jest rówa lczbe wszystkch obserwacj (pomarów) pomejszoej o lczbę wszystkch ograczeń arzucoych a te obserwacje (pomary) Ograczeem jest każda welkość, która zostaje oblczoa a podstawe tych samych obserwacj (pomarów)
Rozkład t Studeta Rozkładem t - Studeta z k stopam swobody azywamy rozkład zmeej losowej X zdefowaej w astępujący sposób: T k X χ k k χ k, X N(0, ) Zmee X oraz χ k są ezależe
Rozkład F Fshera Sedecora Rozkładem F Fshera Sedecora (Sedecora, F Fshera) ze stopam swobody m oraz m azywamy rozkład zmeej losowej F mm zdefowaej w astępujący sposób: F mm m m χ χ m m Zmee χ m oraz χ m są ezależe
T8: Wybrae twerdzea o rozkładach Ageda. Nerówość Czebyszewa prawa welkch lczb. Twerdzee Movre a-laplace a 3. Cetrale twerdzee gracze Ldberga- Levy ego 4. Uzupełee, wosk, podsumowae
Nerówość Czebyszewa E( X ) m, 0 < σ S ( X ) < Jeśl to dla każdego t > 0 P( X m t ) σ t X N( m, σ ) Jeśl to: P( X m 3σ ) 0,0
Słabe Prawo Welkch Lczb Jeśl day jest cąg ezależych zmeych losowych X, X,..., X o jedakowym rozkładze (zmee mają jedakowe rozkłady prawdopodobeństwa, wartośc oczekwae m oraz waracje σ ) to dla każdego ε > 0 otrzymujemy: lm P X + X +... + X m < ε
Moce Prawo Welkch Lczb Jeśl day jest cąg ezależych zmeych losowych X, X,..., X o jedakowym rozkładze (zmee mają jedakowe rozkłady prawdopodobeństwa, wartośc oczekwae m oraz waracje σ ) to: P lm X + X +... + X m
Twerdzee Movre a-laplace a Jeśl X jest zmeą losową o rozkładze dwumaowym, ech ozacza lczbę dośwadczeń a p prawdopodobeństwo sukcesu, to: lm F ( X ) F ( N( p, pq ) X )
Twerdzee Ldeberga-Levy ego Jeśl day jest cąg ezależych zmeych losowych X, X,..., X o jedakowym rozkładze (zmee mają jedakowe rozkłady prawdopodobeństwa, wartośc oczekwae m oraz waracje σ ) to zmea losowa Z X + X +...+ X ma rozkład ormaly przy Z N(m, σ )
Uzupełee,wosk, podsumowae dwumaowy, p 0, p λ Possoa λ ormaly ch-kwadrat m m t-studeta m m cost F Fshera-Sedecora m
T9: Próba losowa podstawowe rozkłady statystyk z próby Ageda. Podstawowe defcje - próba losowa, statystyka. Wybrae rozkłady statystyk z próby zwązaych ze średą 3. Wybrae rozkłady statystyk z próby zwązaych z waracją 4. Podsumowae
Podstawowe defcje Jeżel,,..., jest cągem realzacj w dośwadczeu losowym ezależych zmeych X, X,..., X o jedakowym rozkładze, to cąg,,..., azywa sę statystyczą próbą prostą dokoaą a zmeych losowych X, X,..., X Statystyką azywa sę zmeą losową będącą fukcją zmeych losowych X, X,..., X staowących próbę
Rozkład średej arytmetyczej Jeżel cecha X w populacj geeralej ma rozkład N(m,σ) o zaych parametrach, to średa arytmetycza oblczoa a podstawe -elemetowej próby ma rozkład ormaly: X N Jeżel cecha X w populacj geeralej ma rozkład N(m,σ) o ezaym σ, to statystyka T - oblczoa a podstawe - elemetowej próby ma rozkład t-studeta z - stopam swobody. T X m, m S σ
Rozkład waracj z próby Jeżel cecha X w populacj geeralej ma rozkład N(m,σ) o zaych parametrach, to S σ (statystyka S / σ ma rozkład ch-kwadrat z - stopam swobody) gdze S ozacza warację próbkową χ
Graczy rozkład częstośc Częstość wystąpea zdarzea A w ser ezależych dośwadczeń jest określoa za pomocą astępującego wzoru Y Z twerdzea Movre a-laplace a wyka, że przy dużej próbe: Y N p, X pq
Podsumowae rozkład ormaly a podstawe próby moża woskować o wartośc charakterystyk (statystyk) w całej populacj próba losowa pozwala szacować (estymować) wartość charakterystyk w populacj geeralej
T0: Estymatory estymacja przedzałowa Ageda. Podstawowe defcje. Estymacja puktowa własośc estymatorów 3. Estymacja przedzałowa 4. Podsumowae
Podstawowe defcje Estymacją azywa sę szacowae parametrów lub rozkładu zmeej losowej w populacj geeralej a podstawe próby pobraej z tej populacj Estymatorem parametru Q rozkładu zmeej losowej X azywamy taką statystykę Q f(x,x,...,x ), której rozkład zależy od szacowaego parametru. Wartość q polczoą a podstawe realzacj próby azywa sę oceą parametru Q. Wyrażee Q -Q azywa sę błędem szacuku, a jego marą jest E(Q -Q).
Podstawowe własośc estymatorów Estymatorem zgodym azywamy estymator stochastycze zbeży do parametru estymowaego, tz. tak, który dla każdego ε > 0 speła rówość: lm P( Q Q < ε ) Estymator eobcążoy to tak estymator, którego wartość oczekwaa rówa jest parametrow estymowaemu, czyl: E( Q ) Q
Estymacja przedzałowa Estymacja przedzałowa jest to szacowae wartośc parametru Q za pomocą tzw. przedzału ufośc Przedzałem ufośc azywamy przedzał lczbowy, o którym przypuszczamy, że meśc sę w m ezay parametr populacj Z przedzałem tym zwązaa jest mara ufośc (pewośc), że te przedzał aprawdę zwera teresujący as parametr, zwaa pozomem ufośc
Estymacja przedzałowa Rozkład statystyk z próby określa prawdopodobeństwa, z jakm ta statystyka może przyjmować wartośc z określoych przedzałów lczbowych. Jeśl próba została pobraa otrzymalśmy kokretą oceę pewego parametru, te prawdopodobeństwa mogą być wykorzystae jako pozomy ufośc zwązae z przedzałam, które mogą zawerać ezay parametr
Przedzały ufośc dla średej w populacj ze zaym σ Cetrale twerdzee gracze mów, że średa z dowolej (odpowedo dużej) próby ma rozkład ormaly gdze: m średa X σ odchylee lczebo ś N( próby m, w populacj, σ stadardow e w populacj, )
Przez z α/ będzemy ozaczać taką wartość stadaryzowaej zmeej losowej ormalej Z, która odca pod prawym ogoem krzywej gęstośc ormalej pole o merze α/ 0,4 Np.,96 jest wartoścą z α/ dla α/ 0,05, poeważ z,96 odca pole o merze 0,05 0-3,9 -,96 0,96 3,9
Mara pola pod krzywą z wyłączeem pól pod ogoam rówa -α jest azywaa współczykem ufośc 0,4 0-3,9 -,96 0,96 3,9
Mara pól pod ogoam rówa α jest azywaa prawdopodobeństwem błędu 0,4 0-3,9 -,96 0,96 3,9
Współczyk ufośc pomożoy przez 00 daje pozom ufośc wyrażoy w procetach (-α)00% przedzał ufośc dla m, gdy σ jest zae, a próba została pobraa z populacj ormalej lub jest dużą próbą, jest określoy w astępujący sposób: σ ( z ; + z α / α / σ ) Precyzja (błędem) szacuku to połowa długośc przedzału ufośc. Względa precyzja (błąd) szacuku to loraz połowy długośc przedzału ufośc do wartośc progozy puktowej
Przykład. Wyzaczyć przedzał ufośc średch mesęczych wydatków a żywość w gospodarstwach domowych w pewym meśce przyjmując prawdopodobeństwo błędu a pozome 5%. Wylosowao próbę 00-elemetową, w której średa wyosła 40 zł. Wadomo poadto, że poprzede badaa przeprowadzae rokrocze wykazały stałą warację wydatków a żywość w całej populacj rodz. Waracja wyos 0000. 40, σ 0000, σ 00, 00 (40 -,96 ;40 +,96 00 ( 400,4; 439,6) 00 00 00, Przedzał lczbowy (400,4; 439,6) z prawdopodobeństwem 0,95 pokrywa ezaą wartość przecętych wydatków a żywość w daym meśce. )
Przedzały ufośc dla średej w populacj z ezaym σ ( 30) (-α)00% przedzał ufośc dla m, gdy σ jest ezae, a rozkład w populacj jest ormaly, jest określoy w astępujący sposób: gdze: t α jest wartoścą z rozkładu t-studeta o - stopach swobody, która odca pod ogoem krzywej gęstośc rozkładu pole o merze α, s jest odch. stadard. oblczoym w próbe ) ; ( + s t s t α α s s ) ( ) ( ˆ,
Przedzały ufośc dla średej w populacj z ezaym σ (>30) (-α)00% przedzał ufośc dla m, gdy σ jest ezae, a rozkład w populacj jest ormaly oraz mamy dużą lczbę obserwacj (duża próba), jest określoy w astępujący sposób: s ( z ; + z α / α / s ) s ; + ( zα / zα / s )
Przedzały ufośc dla waracj w populacj Rozkład ch-kwadrat (χ ) jest rozkładem prawdopodobeństwa sumy kwadratów ezależych, stadaryzowaych, ormalych zmeych losowych. Jeżel próba pobraa została z populacj o rozkładze ormalym, to zmea losowa: S χ σ ma rozkład χ o - stopach swobody.
Dla małej próby (-α)00% przedzał ufośc dla σ w populacj, gdy rozkład w populacj jest ormaly, określoy jest wzorem: gdze: s s ; χ χ α / α / χ α/ jest wartoścą zmeej w rozkładze ch-kwadrat o - stopach swobody, która odca pole o merze α/ z prawej stroy, atomast χ -α/ odca pole o merze -α/ z prawej stroy (tym samym pole o merze α/ z lewej stroy)
0 stop swobody 5 stop swobody 0 stop swobody 30 stop swobody 0,006 0,005 0,004 0,003 0,00 0,00 0 0 0 0 30 40 50 Rozkład ch-kwadrat w zależośc od stop swobody
Dla dużej próby (-α)00% przedzał ufośc dla σ w populacj, gdy rozkład w populacj jest ormaly oraz mamy dużą próbę, określoy jest wzorem: + s z ; s z α / α /
Przykład. Zbudować przedzał ufośc dla waracj będącej marą zróżcowaa gęstośc zaludea w pewym województwe, jeśl w 5 wylosowaych kwadratach województwa o powerzch km każdy, średa lczba meszkańców wyos 4 osoby oraz waracja w próbe wyos 40. Wcześejsze badaa wykazują, że rozkład gęstośc zaludaa a badaym teree jest rozkładem ormalym. Przy kostrukcj przedzału ufośc przyjąć pozom ufośc 0,95. X 4, S ( X ) 40, χ 6,89 χ 5 40 ; 6,89 5 40 5,6873 0,05;4 (,97;06,60) 0,95;4 5,6873 95% przedzał ufośc waracj gęstośc zaludea w daym województwe przedstawa sę astępująco: (,97; 06,60).
Przykład. Zbudować przedzał ufośc dla waracj będącej marą zróżcowaa gęstośc zaludea w pewym województwe, jeśl w 00 wylosowaych kwadratach województwa o powerzch km każdy, średa lczba meszkańców wyos 4 osoby oraz waracja w próbe wyos 40. Wcześejsze badaa wykazują, że rozkład gęstośc zaludaa a badaym teree jest rozkładem ormalym. Przy kostrukcj przedzału ufośc przyjąć pozom ufośc 0,95. X + α 4, S ( X ) 40, Φ( zα / ) z /,96 40 40 6,346 6,346 ; ;,96,96,386 0,864 00 00 α ( 5,55; 7,34) 95% przedzał ufośc odchylea stadardowego gęstośc zaludea w daym województwe przedstawa sę astępująco: (5,55; 7,34). Dla waracj atomast: (30,85; 53,9)
Przedzały ufośc dla wskaźka struktury Zwązae ze zjawskam o charakterze bardzej jakoścowym ż loścowym. Iteresuje as wtedy względa częstość (frakcja, prawdopodobeństwo) pojawaa sę pewej cechy w populacj. Np. frakcja (odsetek, procet) sztuk wadlwych wśród wyrobów wytworzoych za pomocą pewej maszyy. Odsetek osób, które zacągają e spłacają kredytów. Odsetek przedsęborstw, które zalegają ze składkam a pracowcze ubezpeczea społecze.
Dla dużych prób (-α)00% przedzał ufośc dla wskaźka struktury w populacj p wyzacza wzór: pˆ qˆ pˆ z ; pˆ + z α / α / pˆ qˆ gdze : pˆ ozacza podzeloe frakcję z próby (czyl lczb ę sukcesów w próbe j przez lczebo ś próby) oraz qˆ pˆ
Przykład. Pobrao próbę 00 kosumetów stwerdzoo, że 34 osoby w próbe kupują produkt wyprodukoway za gracą, pozostal abywają produkt krajowy. Wyzaczyć 95% przedzał ufośc dla udzału zagraczych produktów w badaym ryku. 0,34,96 34, 0,34 0,66 00 00 ;0,34 +,96 ( 0,47;0,438 ) pˆ 0,34 0,34 0,66 00 Z prawdopodobeństwem 0,95 moża stwerdzć, że udzał w ryku produktów zagraczych zawera sę w przedzale od 4,7% do 43,8%.
Precyzja szacuku Precyzja (błędem) szacuku to połowa długośc przedzału ufośc. Względa precyzja (błąd) szacuku to loraz połowy długośc przedzału ufośc do wartośc estymatora puktowego (środka przedzału)
Wyzaczae lczebośc próby Mmala wymagaa lczebość próby do oszacowaa średej w populacj, wyos: z / α σ B gdze B jest połową rozpętośc (-a)00% przedzału ufośc dla.
Przykład. Rozkład wzrostu studetów jest rozkładem ormalym N(m,0). Ilu studetów ależy wylosować do próby, aby oceć przecęty wzrost studeta z maksymalym błędem szacuku cm a pozome ufośc 0,99? (,576 ) 0 65,87 Mmala lczebość próby studetów w celu ustalea przecętego ch wzrostu wyos 66 osób.
Podsumowae Jeżel poberamy próby o tej samej lczebośc z tej samej populacj, to m wyższy jest pozom ufośc, tym szerszy jest przedzał ufośc Jeżel poberamy próby z tej samej populacj, to przy ustaloym pozome ufośc m lczejsza próba, tym węższy jest przedzał ufośc
T: Hpotezy statystycze ch weryfkacja. Podstawowe defcje Ageda. Testowae hpotezy o wartośc przecętej oraz wyzaczae zboru krytyczego 3. Wybrae testy stotośc 4. Testowae hpotez eparametryczych 5. Podsumowae
Podstawowe defcje Hpotezą statystyczą azywamy każdy sąd o zborowośc geeralej wyday bez przeprowadzea badaa całkowtego Hpotezą zerową (ozaczoą przez H 0 ) jest hpoteza o wartośc jedego (lub welu) parametru populacj. Hpoteza ta traktowaa jest jako prawdzwa dopók e uzyska sę przesłaek do zmay staowska. Hpotezą alteratywą (ozaczoą przez H ) jest hpotezę, którą jesteśmy skło przyjąć,gdy odrzucamy H 0. Jest to hpoteza przypsująca parametrow (lub parametrom) populacj wartość ezgodą z przypsaą mu (m) przez hpotezę zerową.
Sprawdzaem (statystyką testu) azywamy statystykę z próby, której wartość oblczoa a podstawe wyków obserwacj jest wykorzystywaa do ustalea czy możemy hpotezę zerową odrzucć, czy też jej odrzucć e możemy. Test statystyczy jest to reguła postępowaa, która przyporządkowuje wykom próby losowej decyzję przyjęca lub odrzucea hpotezy H 0. Błąd I rodzaju α P(H 0 odrzucoa H 0 prawdzwa) Błąd II rodzaju β P(H 0 e zostaje odrzucoa H 0 fałszywa)
Pozom stotośc testu hpotezy statystyczej jest prawdopodobeństwo popełea błędu perwszego rodzaju. Zborem krytyczym azywamy zbór tych wartośc sprawdzau hpotezy, które przemawają za odrzuceem hpotezy H 0. Pukty (wartośc) krytycze wyzaczają grace mędzy obszaram przyjęca odrzucea. Obszar krytyczy (określoy przez wartośc krytycze) ustalay jest tak, aby prawdopodobeństwo, że sprawdza hpotezy przyjme wartośc mplkujące odrzucee hpotezy H 0, wyos α.
Wartośc krytycze zależą od sformułowaa hpotezy alteratywej H. W testach parametryczych (stotośc) hpoteza H 0 jest zawsze hpotezą o rówośc. Hpoteza alteratywa H może być zaprzeczeem, hpotezą o wększośc lub o mejszośc.
Wartość oczekwaa (średa) Wybór sprawdzau hpotezy. Gdy rozkład cechy w populacj geeralej jest N(m,s) oraz zae jest σ lub ezae σ, ale jest duża próba, s σ. Gdy ezay jest rozkład, ale próba jest duża. Wtedy sprawdzaem hpotezy H 0 : m m 0 jest statystyka: o rozkładze N(0,) Z σ m
Wybór sprawdzau hpotezy 3. Gdy rozkład cechy w populacj geeralej jest N(m,σ), ezae σ oraz próba jest mała Wtedy sprawdzaem hpotezy H 0 : m m 0 jest statystyka: Z m σ o rozkładze t-studeta z (-) stopam swobody
0 0,4-3,9 -,96 0,96 3,9 α α ) ( } { : / / 0 α α α α Φ > z z Z P m m H Jeśl Z z α/ to e ma podstaw do odrzucea H 0.
H : m < m0 P{ Z < z } Φ( z α α ) α α 0,4 Jeśl Z - z α to e ma podstaw do odrzucea H 0. α 0-3,9 -,96 0,96 3,9
H : m > m0 P{ Z > z } α Φ( z α α ) α 0,4 Jeśl Z z α to e ma podstaw do odrzucea H 0. α 0-3,9 -,96 0,96 3,9
Przykład a. Ploy żyta w gospodarstwach dywdualych pewego województwa mają rozkład ormaly o ezaych parametrach. Przypuszcza sę, że ploy są rzędu 30 q/ha. Czy przypuszczee to jest słusze a pozome stotośc 0,05, jeżel w próbe złożoej z 6 losowo wybraych gospodarstw otrzymao: średe ploy 8 q/ha oraz s4 q/ha? H 0 : m30 H : m<30 Z z α 8 30 4,708 W przypadku testu jedostroego odczytujemy z tablc rozkładu t-studeta wartość dla α 6,5 Poeważ Z < - z a to ależy odrzucć hpotezę H 0 a rzecz hpotezy alteratywej H. Należy przyjąć, że przypuszczee dotyczące ploów rzędu 30 q/ha e jest słusze a przyjętym pozome stotośc
Przykład b. Ploy żyta w gospodarstwach dywdualych pewego województwa mają rozkład ormaly o ezaych parametrach. Przypuszcza sę, że ploy są rzędu 30 q/ha. Czy przypuszczee to jest słusze a pozome stotośc 0,05, jeżel w próbe złożoej z 6 losowo wybraych gospodarstw otrzymao: średe ploy 8 q/ha oraz s4 q/ha? H 0 : m30 H : m 30 8 30 Z 6, 5 4,0595 z α W przypadku testu dwustroego odczytujemy z tablc rozkładu t-studeta wartość dla α Poeważ Z > z a to to ależy odrzucć hpotezę H 0 a rzecz hpotezy alteratywej H. Należy przyjąć, że przypuszczee dotyczące ploów rzędu 30 q/ha, e jest słusze a przyjętym pozome stotośc
Przykład. Przy wycee prywatyzowaego lasu bukowego wylosowao 00 buków stosując odpowede urządzea pomarowe określoo ch wysokość. W zastosowaym urządzeu pomarowym błąd pomaru jest welkoścą losową o rozkładze N(0;,5). Sprawdzć a pozome stotośc 0,05, czy ops drzewostau wcześej przez begłego (oparty a wyzaczoej przez ego średej wysokośc drzewa m 0 5 m) jest do przyjęca, jeśl z uzyskaej próby 00-elemetowej otrzymao przecętą wysokość buku rówą 7 m, atomast odchylee stadardowe w próbe wyosło 3 m. H 0 : m5 H : m>5 Z z α 7 5,5,645 00 6 Poeważ Z > z α to hpotezę H 0 ależy odrzucć a rzecz hpotezy alteratywej. Wysokość drzew jest stote wększa od 5 m.