STATYSTKA I ANALIZA DANYCH LAB I 1. Dae kotaktowe Mateuz Lago (http://www.c.put.poza.pl/mlago) Moka Grabowka (http://www.c.put.poza.pl/mgrabowka) Forma zajęć: przedtawee pojęca, zagadea lub metody + rozwązywae zadań (a kartkach w R) Waże troy: http://ophela.c.put.poza.pl/webdav/ad/tudet/ Zalczee: kolokwum a otatch zajęcach (zadaa + teora). Pla laboratorum I techk tatytyk opowej Op tabelaryczy Grafcza prezetacja wyków Wyzaczee mar rozkładu (położea, zróżcowaa, aymetr, kocetracj) Statytyka opowa Prezetacja daych w poób uporządkoway, proty, z wykorzytaem p. mar tedecj cetralej mar rozprozea. Pomagają oe w redukcj dużej lczby daych do zboru bardzej zwęzłych pojemych mar.. Skale pomarowe Nomala - co ajmej dwe kategore jakoścowe, które umożlwają zupełą rozłączą klayfkację wyków; możlwe relacje rówość lub różość; przykłady: płeć, tatu małżeńk, braża przemyłowa; Porządkowa wyzaczoa przez relację porządkującą ektóre lub wzytke elemety zboru wyków; e moża porówywać odległośc a dokoywać operacj arytmetyczych; przykłady: tatu zawodowy; upodobae do mark hadlowej; Przedzałowa (terwałowa, rówomera) peła właośc uporządkowaa zakłada, że porządkoway zbór wartośc kłada ę z lczb rzeczywtych; dzałaa arytmetycze take jak dodawae odejmowae ą możlwe, ale zero przyjęte jet arbtrale (tąd e moża możyć czy dzelć); przykłady: temperatura w kal Celjuza; cza kaledarzowy; Ilorazowa - poada właośc kal porządkowej, a pomary charakteryzują ę tałym toukam oraz teem bezwzględego zera; moża dokoywać róweż możea dzelea; przykłady: wek; dochody, temperatura w kal Kelva; - 1 -
. Tablce czętośc (zereg rozdzelcze) Szereg rozdzelczy jet tatytyczym poobem prezetacj rozkładu empryczego. Uzykuje ę go dzeląc dae tatytycze a pewe kategore podając lczebość /lub czętość zborów daych przypadających a każdą z tych kategor. Koleje etapy podcza wykoywaa zeregu rozdzelczego prezetuje atępujący algorytm: 1. Porządkujemy (jeśl to możlwe roąco) wartośc daej cechy,. Zlczamy lczość wytąpeń daej cechy w próbe,. Oblczamy czętośc wytępowaa dla każdej wartośc cechy,. Prezetujemy wyk w forme tabel zawerającej wartość cechy oraz towarzyząca jej lczość wytępowaa tej cechy (lczbę obektów, które cechę poadają). Powyżzy algorytm moża toować do cech o charakterze cągłym kokowym, przetrzegając pożzych reguł. Jeśl cecha ma charakter cągły, wtedy dzelmy przedzał wartośc cechy a przedzały klaowe. Lczba rozpętośc przedzałów powy być tak dobrae, aby dawały przejrzyty obraz rozkładu. Rozpętość przedzału w przyblżeu h = ( ma m) / k, gdze k to lczba przedzałów Środek przedzału klaowego Jeśl cecha ma charakter kokowy, ale lczba możlwych wartośc jet bardzo duża, wtedy możemy potąpć podobe jak w przypadku cechy o charakterze cągłym. Czętośc procetowe czętośc względe (lczba obektów, które poadają określoą cechę do lczby wzytkch obektów) wyrażoe w procetach, Czętośc kumulowae dla określoego przedzału jet to uma czętośc wzytkch poprzedch przedzałów aż do daego przedzału włącze, 5. Grafcze przedtawee wyków Bardzej kodeowae poglądowe przedtawee wyków (w porówau do zeregów) Htogram wykre łupkowy w układze wpółrzędych: oś odcętych róże wartośc zmeej, oś rzędych y czętość/lczość (wyokość łupków jet proporcjoala do czętośc/lczośc) 6. Podtawowe tatytyk opowe Podtawowa aalza daych powa przedtawać charakterytyk tereujących a zmeych, co da am obraz całej zborowośc. Trudo ogarąć zbór klkuet daych powedzeć coś a jego temat. Oblczamy wymeoe pożej tatytyk, które dotyczą ajważejzych cech zborowośc. Statytyk opowe taową jedye pewe wkazówk, formacje zagregowae, których eumejęta lub epoprawa aalza może prowadzć do błędych woków. Dlatego zalecae jet toowae ch w połączeu z aalzą p. htogramów. - -
MIARY POŁOŻENIA Wkazują mejce, w którym leży wartość ajlepej reprezetująca welkośc wchodzące w kład zeregu tatytyczego Średa arytmetycza Wartość, wokół której grupują ę pomary, mara tedecj cetralej. 1 Suma wzytkch wartośc podzeloa przez ch lczbę: 1 1 k Dla zeregu rozdzelczego: 1, gdze wartość średa -tego przedzału klaowego. to lczość -tego przedzału klaowego, a Ograczea. Wartośc kraje mają ly wpływ; Ne moża jej polczyć, gdy kraje przedzały zeregu ą otwarte; Dae powy meć rozkład w przyblżeu ymetryczy (trac zaczee dla rozkładów le aymetryczych welomodowych); Neadekwata dla emetryczych kal, prób małolczych. Średa ważoa: Średa geometrycza w 1 k 1 k (w lczku zamat 1 waga k ; w maowku zamat uma wag k ) Stoowaa dla ocey średego tempa zma zjawka w czae:... G 1 Średa harmocza prota Używaa, gdy wartośc zmeej ą podae w jedotkach względych, h 1 p. przecęta prędkość (km/h) wzór w powyżzej potac toujemy bezpośredo tylko, gdy odległośc pokoae z określoym prędkoścam ą rówe 1 MIARY POZYCYJNE Określają pozycję pewego (typowego) przypadku w touku do ych przypadków (ze względu a ch położee w zborowośc). Domata (moda) Najczęścej przyjmowaa wartość pomarowa; wartość o ajwękzym prawdopodobeńtwe wytąpea (wartośc zmeej e muzą być lczbowe zaleta, bo wele mar tego wymaga). Dla zeregu rozdzelczego: mod ( 1 1 ) ( 1 h ) - dola graca przedzału klaowego z ajwękzą czętoścą, h - rozpętość przedzału klaowego zawerającego domatę - czętość odpowadająca przedzałow klaowemu z ajwękzą czętoścą 1 - czętość odpowadająca przedzałow poprzedzającemu 1 - czętość odpowadająca przedzałow atępemu - -
Itucja: jeśl 1 > 1, to mod będze blżej górej gracy rozważaego przedzału. Ograczea. Każda wartość pomarowa jet przyjmowaa welokrote, tz. zbór wartośc pomarów jet zacze mej lczy ż lczba pomarów. Dopuzczale gdy rozkład jedomodaly, a aymetra umarkowaa. W praktyce mów ę też o rozkładach bmodalych, trmodalych, td. Medaa Środkowa wartość pomarowa, tz. taka, że połowa pozotałych wartośc jet mejza, a połowa wękza od ej; dzel zbór pomarów a dwe rówe częśc. Dla uporządkowaego cągu lczb: Dla zeregu rozdzelczego: med (( 1) / ) eparzyte.5 ( ( / ) (( / ) 1) ) parzyte med F - dola graca przedzału klaowego, który zawera perwzych 5% kumulowaych czętośc h - rozpętość przedzału klaowego zawerającego medaę 1 h - czętość odpowadająca przedzałow klaowemu zawerającemu medaę - ogóla lczba oberwacj F 1 - czętość kumulowaa przedzału poprzedzającego Itucja: F 1 - le brakujących do połowy wzytkch lczb jet w rozważaym przedzale Ograczea. Stoowaa w przypadkach rozkładów ymetryczych. Kwatyle Wartośc zmeej, które dzelą dae a częśc pozotające ze obą w odpowedm touku. Najczęścej używae kwatyle to: kwartyle (podzał a częśc) - p. perwzy kwartyl dzel dae a dwe częśc w te poób, że 5% z ch ma wartośc od ego mejze, a 75% wękze; czy zaz już jakś y kwartyl?. decyle (podzał a 1 częśc); percetyle (podzał a 1 częśc). - -
MIARY ROZPROSZENIA (ZMIENNOŚCI, DYSPERSJI) Ocea, czy wartośc cechy ą bardzo rozprozoe lub kocetrowae wokół wartośc przecętej Roztęp Różca ajwękzej ajmejzej wartośc zmeej: R ma m Roztęp ćwartkowy (kwartyly) IQR (tequartle rage) Różca mędzy trzecm perwzym kwartylem (zajduje ę tam 5% wzytkch oberwacj) 1 Odchylee średe: Dm 1 Waracja Średa arytmetycza kwadratów odchyleń pozczególych wartośc zmeej od średej arytmetyczej całego zboru daych (od wartośc oczekwaej). ( 1 1 ) Dla zeregu rozdzelczego: 1 k ( 1 ) Dla próby (etymator eobcążoy): 1 1 ( 1 Zwróć uwagę a różcę w poobe oblczaa waracj dla populacj próby! Ograczea. Dae muzą meć rozkład w przyblżeu ormaly. ) Odchylee tadardowe Mara przecętego odchylea wyków pomarów od średej. Perwatek z waracj, czyl. Tym wękze, m wękzy rozrzut wokół średej (m tym bardzej rozprozoe ą dae) Gdy wzytke pomary rówe, = Ne zmea ę, gdy do wzytkch elemetów dodać tę amą lczbę Pomożee elemetów przez tę amą lczbę prowadz do pomożea przez wartość bezwzględą z tej lczby Ograczea. Dae muza meć rozkład w przyblżeu ormaly. Neodpore a wartośc odtające. Wpółczyk zmeośc Mara względa, zależa od welkośc średej arytmetyczej. Odchylea przez średą: V - 5 -
MIARY ASYMETRII Dotarczają formacj t. aymetr rozkładu lub jej braku. Ta ama wartość średej meday dla powyżzych rozkładów (eutraly) (prawotroe kośy) (lewotroe kośy) Wpółczyk kośośc W zależośc od zaku wpółczyka rozkład jet: prawotroe (dodato) kośy dla dodatch wartośc wpółczyka ma dłużzy prawy ogo, ymetryczy dla rówego zero, lewotroe (ujeme) kośy dla wpółczyka ujemego ma dłużzy lewy ogo. A d dom lub A d Skala kośośc A d : jak daleko jet średa od wartośc ajbardzej prawdopodobej w jedotkach odchylea tadardowego, Ne ma gwaracj, że te wzory będą mały te am zak. med Rozkład prawotroe kośy po prawej troe wojej domaty (mody) maleje wolej ż po lewej (dłużzy prawy ogo); w ogólośc ma średą wękzą od meday domaty. Trzec momet cetraly Suma trzecch potęg odchyleń wartośc cechy od wartośc średej arytmetyczej, podzeloa przez M 1 ( ) 1 Przyjmuje: dla rozkładu ymetryczego wartośc ujeme dla rozkładów o lewotroej ymetr wartośc dodate dla rozkładów o prawotroej ymetr Częto kośość oblcza ę jako: A d M - 6 -
MIARY KONCENTRACJI Wkazują a erówomere rozdypoowae wartośc cechy pomędzy elemety próby loowej. rozkłady ymetrycze, ale różce ą zauważale Kurtoza Mara kupea wokół średej Im wękza jet jej wartość, tym bardzej wartośc zmeej kocetrują ę wokół średej. Jeśl dodata, to rozkład jet bardzej wymukły ( trzelty) ż ormaly. Jeśl jet ujema, to rozkład jet bardzej płazczoy od ormalego. M Kurt 1 ( 1 ) - 7 -