TATYTYKA MATEMATYCZNA WYKŁAD Wadomośc wstępe
tatystyka to dyscypla aukowa, której zadaem jest wykrywae, aalza ops prawdłowośc występujących w procesach masowych.
Populacja to zborowość podlegająca badau statystyczemu. Aby populację określć jedozacze charakteryzujemy ją pod względem: rzeczowym czasowym przestrzeym (terytoralym). 3
Cecha to właścwość elemetów populacj ze względu a którą prowadzmy badae statystycze. Waraty to wartośc cechy (cecha powa meć przyajmej dwa waraty). 4
Przykład Populacja: tudec II semestru Wydzału Elektrok WAT, wg stau a.03.05. Cechy: płeć, wzrost, kolor oczu, ocea a egzame z matematyk po I semestrze, uluboy tygodk, wysokość mesęczych dochodów, czas pośwęcoy a aukę w tygodu poprzedzającym ostatą sesję egzamacyją. 5
Przykład Populacja: amochody osobowe zarejestrowae w Warszawe, wg stau a.09.05. Cechy: kolor karoser, przebeg, średe zużyce palwa a 00 km, marka, czas osągaa prędkośc 00 km/godz. 6
Uproszczoa klasyfkacja cech: 7
Badae statystycze może być: pełe (obejmuje całą populację), częścowe (obejmuje część populacj próbę). 8
Próba powa być reprezetatywa tz. rozkład waratów badaej cechy w próbe powe być zblżoy do rozkładu w całej populacj. 9
George Gallup 90-984 Poer w dzedze badaa op publczej. Rozwął techkę doboru grupy reprezetatywej 0
Rok 936 - wybory prezydecke w UA. Frakl Delao Roosvelt - Parta Demokratycza, Alf Lado - Parta Republkańska. "Lterary Dgest" 0 ml aket (zwrot ok. ml), - eprawdłowa progoza. Gallup 4000 aket (w 935 założył perwszy a śwece stytut badaa op publczej) - prawdłowa progoza. Wyk: Roosvelt - 60,8%, Lado - 36,5%.
Uwaga Badaa pełe e zawsze są możlwe lub celowe (badaa szczące, duża próba, wysoke koszty).
Humor Polsk lata 80-te 3
Lczebość próby. Dla reprezetatywej próby dorosłej lczebośc Polsk zwykle 000 300 osób. Jerzy pława-neyma (894-98) polsk amerykańsk matematyk statystyk. Wprowadzł pojęce przedzału ufośc. 4
ROZKŁADY PODTAWOWYCH TATYTYK zmea losowa odpowedk badaej cechy, (,,..., ) próba losowa (zmea losowa wymarowa, ezależe zmee losowe o takm samym rozkładze jak (taką próbę azywamy próbą prostą). Jeśl x jest wartoścą zmeej ( =,,..., ) to cąg (x, x,..., x ) azywamy realzacją próby (są to dae statystycze). 5
tatystyka to praktycze dowola fukcja od próby Y = g(,,..., ) tatystyka przekształca formację zawartą w próbe czyąc prostszym woskowae o rozkładze cechy w populacj. 6
tatystyka jako fukcja od zmeej losowej jest też zmeą losową możemy mówć o jej rozkładze. tatystyka ma rozkład dokłady, jeśl jest spełoy dla każdego. tatystyka ma rozkład asymptotyczy, jeśl jest spełoy, gdy dąży do eskończoośc. 7
tatystyk podstawowe: średa z próby Gdy mają rozkład zerojedykowy ( sukces, 0 porażka) to średą możemy zapsać w postac Y W gdze Y jest lczbą sukcesów w próbe Te szczególy przypadek średej azywamy średą częstoścą sukcesu. 8
9 waracja z próby Uwaga. odchylee stadardowe z próby V V Współczyk zmeośc (dla cech o waratach dodatch)
0 ˆ ˆ waracja z próby eobcążoa m 0 0 waracja z próby dla daej wartośc oczekwaej m.
Uwaga ˆ zatem dla dużych ˆ ˆ
Momety zwykłe, k M k momet rzędu k cechy (M = k l M kl Y momet rzędu k, l jedocześe badaych cech (, Y). Momety cetrale, k M ~ momet rzędu k cechy. k ). ~ k l M kl Y Y momet rzędu k, l jedocześe badaych cech (, Y).
Rozkłady ektórych statystyk (>): Jeśl cecha ma rozkład N(m, ), to:,, a) statystyka ma rozkład N m m b) statystyka ma rozkład tudeta z - stopam swobody, c) statystyka 0 ma rozkład ch kwadrat z stopam swobody, d) statystyka ma rozkład ch kwadrat z - stopam swobody, d') statystyk są zmeym losowym ezależym (zachodz też własość odwrota), 3
Jeśl cecha ma rozkład N(m, ) a cecha Y ma rozkład N(m, ), (próby ezależe odpowedo elemetowe) to: e) statystyka Y ma rozkład N m m,, gdy ma rozkład N(m, ), Y ma rozkład N(m, ), to Y ( ) e ) statystyka ma rozkład tudeta z + - stopam swobody, f) statystyka ˆ ˆ ( Y ) ( ) ma rozkład edecora F,, 4
5 Ad. a) Zmea losowa jako suma ezależych zmeych losowych o rozkładach ormalych pomożoa przez stałą ma rozkład ormaly. Oblczymy jej parametry korzystając z własośc wartośc oczekwaej waracj. m m m E E E D D D zatem D
Ad. b) wykorzystamy a), d), d'), Poeważ m m ( ) lczk ma rozkład N(0, ) ma rozkład ch kwadrat z - stopam swobody, tatystyk te są ezależe. m Zatem (z defcj) statystyka ma rozkład tudeta z - stopam swobody, 6
7 Ad. a), d, d') Nech (Y, Y,...,Y ) próba losowa dla cechy o rozkładze N(0, ). Nech Y Y Y Y K Aby wykazać a), d, d') wystarczy pokazać, że te statystyk są ezależe mają rozkłady: Y ma rozkład N, 0 K ma rozkład ch kwadrat z - stopam swobody bo ma rozkład tak jak Y a K ma rozkład ( K m m )
. Określamy zmee losowe Z k c k Y, k =,..., za pomocą ortoormalej macerzy C = [c k ]. Perwszy wersz ma jedakowe elemety rówe (taka macerz zawsze steje). Zmee Z k mają rozkład ormaly.. m k = E(Z k ) = 0, cov(z k, Z j ) = 0 dla k j (z ezależośc Y, Y,...,Y ortogoalośc C) Zatem Z, Z,...,Z są ezależe (fukcje merzale ezależych zmeych losowych są ezależe) o rozkładze N(0, ). 3. koro Z cy Y to Z Y, zatem Y ma rozkład N0, 4. Lowe przekształcee ortoormale zachowuje ormę zatem Zatem K Y Z Y. Z Y Z co ozacza z defcj rozkładu ch kwadrat, że K ma rozkład ch kwadrat z - stopam swobody. 5. Y K jako fukcje merzale ezależych zmeych losowych są ezależe. Z 8
Ad. e) Zmea losowa Y jako różca ezależych zmeych losowych o rozkładach ormalych (pukt a)) ma rozkład ormaly. Oblczymy jej parametry korzystając z własośc wartośc oczekwaej waracj. ma rozkład m, N, Y ma rozkład N m, E D Y E EY m m Y D D Y D Y zatem,. 9
30 Ad. f) korzystając z d) mamy, ) ( ) ( ) ( ) ( ) ( ˆ ) ( ˆ F Y Y Y Y Y
Uwaga. ) Cąg średch z próby jest zbeży (wg prawdopodobeństwa) do wartośc oczekwaej m rozpatrywaej cechy (zakładamy, że E = m steje), ) Cąg waracj z próby jest zbeży (wg prawdopodobeństwa) do waracj rozpatrywaej cechy (zakładamy, że D = > 0 steje), 3) Gdy spełoe są założea puktu ) ) to średa ma dla dużych w przyblżeu rozkład N m, (rozkład asymptotyczy) W szczególośc średa częstość sukcesu ma rozkład asymptotyczy p( p) N p,, gdze p prawdopodobeństwo sukcesu. Y W 3
3 Uogólee Jeśl cecha ma momety odpowedo wysokego rzędu to momety te mają rozkłady asymptotycze ormale. Momet M k ma asymptotyczy rozkład m m m N k k k, Momet k M ~ ma asymptotyczy rozkład k k N k k k k k k,
Przykład Dochód mesęczy (zł) w pewej populacj osób ma rozkład ormaly N(600; 300). a) Jake jest prawdopodobeństwo, że śred mesęczy dochód 5 osób z tej populacj wyos mej ż 500 zł? b) Jake jest prawdopodobeństwo, że mesęczy dochód osób z tej populacj wyos mej ż 500 zł? Rozwązae a) 5 śred mesęczy dochód 5 osób, 300 N600, 5 5 N 600,60 5 600 500 600 P( 5 500) P PY 60 60 (,67) (,67) 0,9554 0,04745,67 33
b) wysokość mesęczego dochodu, N600,300 600 500 600 P( 500) P PY 300 300 ( 0,33) (0,33) 0,693 0,3707 0,33 j Wosek Rozkład średej charakteryzuje sę mejszym odchyleem stadardowym ż rozkład badaej cechy. 34
Przykład Błędy pomarów wykoywaych dalmerzem mają rozkład ormaly o odchyleu stadardowym 0, m. Dokoao 5 pomarów odległośc tym dalmerzem. Jake jest prawdopodobeństwo, że odchylee stadardowe z tych pomarów będze wększe ż 0,07 m? 35
Rozwązae 5 tatystyka: 0, ma rozkład ch kwadrat z 5 = 4 stopam swobody Zatem P( 0,07) P( 7,35 0, 9 P Y 4 0,0049) 5 P 0, 5 0,0049 0, 36
Przykład, Y dochody (setk zł) pracowków w frmach A B. Zakładamy, że N(3,4), Y N(5, 3). Oblcz prawdopodobeństwo, że śred dochód 64 wylosowaych pracowków frmy A jest wększy ż śred dochód 36 wylosowaych pracowków frmy B. Rozwązae 4 3 N 3 5,, tatystyka: 64 Y 36 64 36 zatem (3 5) ( ) ( 0) 64 Y36 P 64 Y36 P 64 Y36 P 6 9 64 36 (3 5) 6 9 64 36 PY,86 (,86) 0,9979 0, 00 Zatem szasa, że śred dochód 64 wylosowaych pracowków frmy A jest wększy ż śred dochód 36 wylosowaych pracowków frmy B jest zkomo mała. L.Kowalsk 8.09.07 37