Pla wykładu Aaliza daych Wykład : Statystyka opisowa. Małgorzata Krętowska Wydział Iformatyki Politechika Białostocka. Statystyka opisowa.. Estymacja puktowa. Własości estymatorów.. Rozkłady statystyk z próby.. Przedziały ufości.. Testy istotości. 6. Aaliza regresji. 7. Aaliza wariacji. 8. Testy ieparametrycze. Testy zgodości. e-mail: m.kretowska@pb.edu.pl stroa www: http://aragor.pb.bialystok.pl/~gkret Literatura Krysicki W., Bartos J., i ii., Rachuek prawdopodobieństwa i statystyka matematycza część II, Wydawictwo Naukowe PWN, Warszawa 997. Sobczyk Mieczysław: Statystyka, Wydawictwo Naukowe PWN, Warszawa, 996. Plucińska A., Pluciński E.: Probabilistyka, Wydawictwo Naukowo- Techicze, Warszawa Koroacki J, Mieliczuk J., Statystyka dla studetów kieruków techiczych i przyrodiczych, Wydawictwo Naukowo- Techicze, Warszawa Podstawowe pojęcia Populacja geerala - zbiór elemetów mający przyajmiej jedą właściwość wspólą dla wszystkich jego elemetów kwalifikującą je do tego zbioru oraz przyajmiej jedą właściwość, ze względu a którą elemety tego zbioru mogą się różić między sobą. komplete dostarcza pełej iformacji o badaej cesze, często jest iewykoale, czasochłoe (badaie % populacji) Badaie cechy populacji częściowe wiskowaie o właściwościach populacji a podstawie iformacji z pewego skończoego podzbioru tzw. próby losowej
Próba losowa Próba losowa prosta elemetowa to ciąg iezależych zmieych losowych X, X,.., X o jedakowym rozkładzie, takim jak rozkład zmieej losowej X w populacji. Przykład badaia częściowego? Typy daych Dae ilościowe (mierzale) uzyskae w wyiku pomiaru, wyrażae w skali liczbowej; mogą być ciągłe tz. przyjmują dowole wartości z pewego przedziału liczbowego (p. wiek, wzrost, stężeie cholesterolu całkowitego we krwi) lub dyskrete, gdy przyjmują wartości liczb całkowitych (p. liczba dzieci w rodziie, liczba zachorowań a grypę w roku) Dae jakościowe (iemierzale) określae przez azwę; wyrażae w skali omialej (p. płeć, sta cywily) lub porządkowej (p. wykształceie, samoocea stau zdrowia) Skale pomiarowe omiala dae są azywae (p.: kobiety-męzczyźi, samoti-żyjący w parach); ie ma określoego porządku; etykiety adawae są arbitralie porządkowa ustaloy jest aturaly porządek, ale różica pomiędzy wartościami ie ma zaczeia (p.: samoocea stau zdrowia, poziom wykształceia) iterwałowa ustaloy jest aturaly porządek, ale skala jest stała i ie występuje aturale zero; różica między wartościami ma ses, ale iloraz dwóch wartości ie (p. temperatura zero ustaloe jest arbitralie) (p.: - = -, ale / ie ozacza trzykrotego wzrostu temperatury) ilorazowa ustaloy jest aturaly porządek, skala jest stała i występuje aturale zero (p.:wiek, ciężar ciała, wzrost) Badaie próby losowej Niech x, x,..., x będzie elemetową próbą losową. Gdy wartości próby grupuje się w tzw. klasy - są to przedziały ajczęściej jedakowej długości. Przyjmuje się upraszczające założeie, że wszystkie wartości zajdujące się w daej klasie są idetycze ze środkiem klasy. Liczbę wartości próby zawartych w i-tej klasie azywamy liczością i-tej klasy i. K =, i gdzie K liczba klas W wyiku podziału próbki a klasy otrzymuje się SZEREG ROZDZIELCZY, który staowią pary liczb: środki klas oraz ich liczości. x i, ) ( i
Szereg rozdzielczy Liczba klas zależy od liczby pomiarów : - liczość K- liczba klas -6 6-8 6-7- - 9- Rozkłady empirycze Rozkłady empirycze cechy skokowej cechy ciagłej wielomodale jedomodale jedomodale wielomodale Graficza reprezetacja szeregu rozdzielczego: i histogram Wielobok czestosci symetrycze Rozkłady jedomodale umiarkowaie asymetrycze skrajie asymetrycze ormale leptokurtycze (wysmukłe) platokurtycze (spłaszczoe) prawoskośe lewoskośe prawoskośe lewoskośe x x x x i Modalość Symetria liczosc liczosc liczosc liczosc........ rozklad jedomodaly.......... rozklad dwumodaly....... rozklad symetryczy....... rozklad umiarkowaie asymetryczy prawoskosy liczosc liczosc liczosc........... 6. rozklad wielomodaly..... rozklad amodaly..... rozklad skrajie asymetryczy lewoskosy
Współczyik asymetrii (ag. skewess) Współczyik spłaszczeia (kurtoza) A = ( ( xi s = ( x i )( ) s ( + ) ( xi K = ( )( )( ) s ( ) ( )( ) A= - rozkład symetryczy A> - asymetria prawostroa (rozkład prawoskośy) A< - asymetria lewostroa (rozkład lewoskośy) A > - rozkład skrajie asymetryczy K= - rozkład ormaly K> - rozkład leptokutryczy K< - rozkład platokutryczy leptokutryczy ormaly platokurtyczy x mi - wartość miimala x max - wartość maksymala R=x max - x mi - rozstęp (ag. rage) Miary cetrale: średia arytmetycza - wartość średia z próby x = x i - miary cetrale mediaa -środkowa liczba w uporządkowaej iemalejąco próbce, gdy ieparzyste lub średia arytmetycza dwóch środkowych liczb, gdy parzyste Iterpretacja: x () x ()... x () x( + )/ ieparzyste me = ( x( / ) + x(( / ) + ) ) parzyste co ajmiej % wartości cechy jest me lub co ajmiej % wartości cechy jest me
- miary cetrale domiata (moda, wartość modala) - ajczęściej powtarzająca się wartość w próbce, o ile istieje ie będąca x mi ai x max. Miary zróżicowaia wariacja s = ( x i sˆ = ( x i W przypadku rozkładów symetryczych x śr =me=do. odchyleie stadardowe s = im zróżicowaie elemetów jest większe tym s jest większe. s określa o ile wszystkie jedostki daej zbiorowości różią się średio od średiej arytmetyczej badaej zmieej. s s ˆ = sˆ Możemy wykorzystać je do budowy typowego obszaru zmieości: x s < xtyp < x + s mieści się w im około / wszystkich jedostek. kwartyl doly Q P(X Q ). i P(X Q ).7 Iterpretacja: co ajmiej % wartości cechy jest Q lub co ajmiej 7% wartości cechy jest Q kwartyl góry Q P(X Q ).7 i P(X Q ). Iterpretacja: co ajmiej 7% wartości cechy jest Q lub co ajmiej % wartości cechy jest Q