Mary położea rozkładu Wykład 9 Statystyk opsowe Średa z próby, mea(y) : symbol y ozacza lczbę; arytmetyczą średą z obserwacj Symbol Y ozacza pojęce średej z próby Średa jest środkem cężkośc zboru daych 6 Przykład: Przyrost wag owec Dae :, 3, 9,, 0, y =, y =3,, y 6 = y = y + y +... + y = + 3 +... + = 56 6 y = 56 / 6 = 9.33 Odchylea dev = y y dev = y y = 9.33 =.67 Σ dev =? Medaa próbkowa: meda(y) Środkowa obserwacja jeżel jest eparzyste Średa z dwóch środkowych wartośc gdy jest parzyste Przykłady Przykład ( = 5) Dae: 6.3 5.9 7.0 6.9 5.9 Średa z próby = 3/5 = 6. Medaa = Przykład ( = 6) Dae: 366 37 7 9 7 30 Średa z próby = 93.8 Medaa =
Średa a medaa Przykład cd. ( = 5) Dae: 6.3 5.9 7.0 6.9 5.9 Średa = 3/5 = 6. Medaa = 6.3 Błąd w zapse daych: Dae: 6.3 5.9 70 6.9 5.9 Średa = 9 Medaa = 6.3 Średa a medaa Medaa dzel powerzchę hstogramu a połowę Jest odpora e mają a ą wpływu obserwacje odstające Średa to środek cężkośc hstogramu Obserwacje odstające mają duży wpływ a średą średa e jest odpora Średa a medaa Jeżel hstogram jest w przyblżeu symetryczy, to średa medaa są zblżoe. Jeżel hstogram jest skośy a prawo, to średa jest zwykle wększa ż medaa. Obe te mary położea są jedakowo waże. Średa jest częścej wykorzystywaa do testowaa estymacj (o czym późej). Mary położea cd.:kwartyle Quatle(Y) Kwartyle dzelą zbór daych a cztery grupy. Drug kwartyl (Q) to medaa. Perwszy kwartyl (Q) to medaa grupy obserwacj mejszych ż Q. Trzec kwartyl (Q3) to medaa grupy obserwacj wększych ż Q. Przykład Przykład (=5) Dae: 3 5 6 7 7 8 3 5 5 3 5 6 9 3
Rozstęp mędzykwartylowy IQR=Q3-Q (ter-quartle rage) IQR(Y) Wykres ramkowy (Boxplot) Boxplot(Y) Boxplot grafcza reprezetacja: meday, kwartyl, maxmum mmum z daych. Ramka ( pudełko ) powstaje z obrysowaa kwartyl Le ( wąsy ) cągą sę do wartośc ajmejszej ajwększej. BoxPlot Zmodyfkoway Boxplot 0 8 6 0 Obserwacja odstająca: błąd w zapse daych, błąd maszyy, zmaa waruków eksperymetu tp. Kryterum do detyfkacj obserwacj odstających: Dola graca = Q -.5*IQR Góra graca = Q3 +.5*IQR boxplot(y,rage=.5) Przykładowy zmodyfkoway wykres ramkowy (boxplot) Dae : 3 3 5 6 6 7 8 5 6 5 0 5 3
Mary rorzutu: Rozstęp (max m) bardzo wrażlwy a obserwacje odstające, eprzydaty do testowaa Rozstęp mędzykwartylowy (IQR=Q3-Q) rozstęp środkowych 50% obserwacj Stadardowe odchylee / Waracja (sd,var) Współczyk zmeośc Próbkowe odchylee stadardowe (SD, s) Wyrażoe w jedostkach pomarowych Iformuje o le przecęte odległe od średej są obserwacje. ( ) /( ) (defto) s = y y ( y y ) /( ) (calculatos) = W maowku jest -: SS s =,where ( ) SS = y y = y y Próbkowa waracja: s Przecęty kwadrat odległośc od średej próbkowej: s Merzoa w jedostkach będących kwadratem jedostek, w których wyrażoe są dae Dlaczego -? s jest eobcążoym estymatorem waracj w populacj Σ dev =0 stąd dev dev - stop swobody = - jedostek formacj = Mary rozrzutu, cd. Współczyk zmeośc (CV) Przykład CV = s / y Dae : 35., 30.6, 36.9, 9.8 (=) Rozstęp =
Suma obserwacj: Σy = 35. + 30.6 + 36.9 + 9.8 = 3. średa: y s z defcj: SS = waracja: s = s= Uwaga: Proszę zachowywać dużo cyfr zaczących przy rachukach. Zaokrąglamy dopero a koec. Współczyk zmeośc: CV= Ogóle uwag Duże s=duży rozrzut. Małe s=mały rozrzut. Jeżel hstogram (rozkład ) jest w kształce dzwou ( ormaly ), to około: 68% obserwacj jest w odległośc ± s od średej 95% obserwacj jest w odległośc ± s od średej 99% obserwacj jest w odległośc ± 3 s od średej Nerówość Czebyszewa Nawet, gdy rozkład e jest ormaly to co ajmej 75% obserwacj jest w odległośc ± s od średej co ajmej 89% obserwacj jest w odległośc ± 3 s od średej. Przykład cd Przykład 3 3 Średa y =., odchylee stadardowe s =.9. 7 3 9 0 5 3 0 0 8 5
Ocea s z hstogramu Odcek I = ( y s, y + s) zawera około 95 % daych. Przykład (puls po ćwczeach) 95 % pomarów jest pomędzy 75 a 5 Ocea s = (długość I) /. Reguła dzała ajlepej, gdy hstogram jest w kształce dzwou (blsk ormalemu). Faktycze s = 3. Porówae mar rozrzutu położea Mary rozrzutu służą do oszacowaa zmeośc w daych. Odporość: Załóżmy, że mamy dość skupoy dzwoowy (ormaly) zbór daych. Co sę stae, gdy jedą dużą obserwację zastąpmy bardzo dużą wartoścą? Medaa Rozstęp Średa Kwartyle rozstęp mędzykwartylowy Stadardowe odchylee 6