Wykład nr 2. Statystyka opisowa część 2. Plan wykładu

Podobne dokumenty
Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Statystyczny opis danych - parametry

Statystyka powtórzenie (I semestr) Rafał M. Frąk

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Wybrane litery alfabetu greckiego

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

STATYSTYKA OPISOWA WYKŁAD 1 i 2

Statystyka Opisowa. w2: podstawowe miary. Jerzy Stefanowski Instytut Informatyki Politechnika Poznańska. Poznań, 2015/16 aktualizacja 2017

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Statystyka opisowa - dodatek

Zestaw II Odpowiedź: Przeciętna masa ciała w grupie przebadanych szczurów wynosi 186,2 g.

COLLEGIUM MAZOVIA INNOWACYJNA SZKOŁA WYŻSZA WYDZIAŁ NAUK STOSOWANYCH. Kierunek: Finanse i rachunkowość. Robert Bąkowski Nr albumu: 9871

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Histogram: Dystrybuanta:

Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Estymacja przedziałowa

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

Jak obliczać podstawowe wskaźniki statystyczne?

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

Materiały do wykładu 4 ze Statystyki

STATYSTYKA I ANALIZA DANYCH

Statystyka i rachunek prawdopodobieństwa

Podstawowe pojęcia. Próba losowa. Badanie próby losowej

BADANIA DOCHODU I RYZYKA INWESTYCJI

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

INSTRUKCJA NR 06-2 POMIARY TEMPA METABOLIZMU METODĄ TABELARYCZNĄ

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Projekt ze statystyki

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Lista 6. Estymacja punktowa

Elementy modelowania matematycznego

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych (w zakresie materiału przedstawionego na wykładzie organizacyjnym)

ANALIZA DANYCH DYSKRETNYCH

STATYSTKA I ANALIZA DANYCH LAB II

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Statystyka. Katarzyna Chudy Laskowska

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

1 Testy statystyczne. 2 Rodzaje testów

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

STATYSTYKA MATEMATYCZNA

1 Dwuwymiarowa zmienna losowa

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

0.1 ROZKŁADY WYBRANYCH STATYSTYK

Modelowanie i Analiza Danych Przestrzennych

MIANO ROZTWORU TITRANTA. Analiza statystyczna wyników oznaczeń

Statystyczny opis danych - parametry

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Obserwacje odstające mają duży wpływ na średnią średnia nie jest odporna.

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Opracowanie danych pomiarowych. dla studentów realizujących program Pracowni Fizycznej

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Analiza Danych. Jerzy Stefanowski. Wykład dla kierunku Informatyka (1wsze spotkanie) Poznań, 2006/7

1 Podstawy rachunku prawdopodobieństwa

STATYSTYKA MATEMATYCZNA

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

POLITECHNIKA OPOLSKA

Statystyka Wzory I. Analiza struktury

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

STATYSTYCZNA OCENA WYNIKÓW POMIARÓW.

INFORMATYKA W CHEMII Dr Piotr Szczepański

Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny

Średnie. Grażyna Rozmysłowicz, Dorian Śniegocki

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

LABORATORIUM METROLOGII

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Rozkład normalny (Gaussa)

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Parametryczne Testy Istotności

Laboratorium 3 - statystyka opisowa

Statystyka i opracowanie danych W3: Wprowadzenie do statystycznej analizy danych Podstawy wnioskowania statystycznego. Estymacja i estymatory

W1. Wprowadzenie. Statystyka opisowa

Statystyka matematyczna dla leśników

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

Parametry statystyczne

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

ZADANIA NA ĆWICZENIA 3 I 4

Transkrypt:

Wykład r 2 Statystyka opisowa część 2 Pla wykładu 1. Uwagi wstępe 2. Miary tedecji cetralej 2.1. Wartości średie 2.2. Miary pozycyje 2.3. Domiata 3. Miary rozproszeia 4. Miary asymetrii 5. Miary kocetracji 6. Podsumowaie

Statystyka opisowa Cel zwięzłe przedstawieie ogólej charakterystyki istotych właściwości badaej zbiorowości. Podstawowe zadaia: 1. Określeie przeciętego wielkości i rozmieszczeia wartości zmieej miary położeia / tedecji cetralej. 2. Określeie graic zmieości wartości zmieej miary rozproszeia (zmieości, dyspersji). 3. Określeie parametrów rozkładu wartości zmieej miary asymetrii i kocetracji rozkładu oraz podobieństwa struktury. 4. Ocea zmieości zjawisk w czasie. 5. Określeie współzmieości miary współzmieości. Statystyki opisowe w odiesieiu do skal pomiarowych

Miary położeia Miary położeia (przecięte) wskazują miejsce, w którym leży wartość ajlepiej reprezetująca wielkości wchodzące w skład szeregu statystyczego. Miary położeia iformują o przeciętym (średim, typowym) poziomie wartości rozważaej cechy. Typowe miary położeia:

Średia arytmetycza Stosowae dla skal metryczych Średia arytmetycza Defiiowaa jako 1 = i = 1i gdzie i wartość i-tego pomiaru, a liczebość populacji. Przykład: W pewym doświadczeiu medyczym bada się czas su (w miutach) pacjetów. Zmierzoo u = 12 losowo wybraych pacjetów czas: 435, 389, 533, 324, 561, 395, 416, 500, 499, 397, 356 i 398. Średi czas 435 + 389 + K+ 398 = =? 12 Własości średiej arytmetyczej: ( i ) i= 1 ie (miej dogode późiej)

Ie rodzaje średich arytmetyczych Średia ważoa (w i to tzw. wagi): = w i i= 1 w i= 1 Przykład testu psychologiczego: i i A co z szeregami rozdzielczymi? Średia szeregu puktowego: Jeśli wartości wyików, jakie przybiera zmiea w próbie 1, 2,, k występują z liczością 1, 2,, k, to średia arytmetycza jest zdefiiowaa jako: k i i = i= 1, gdzie k jest liczbą różych wartości zmieej, a = k i i= 1.

Przykład: W przedsiębiorstwie zajmującą się produkcją pewych arzędzi badao wydajość pracy (ilość sztuk wyprodukowaych w ciągu dia) 60 pracowików. Ustalmy, jaka jest średia wydajość pracy przypadająca a jedą osobę. Dostępe jest zestawieie:

Średia arytmetycza dla szeregu rozdzielczego przedziałowego zdefiiowaa jako: k i & i i = =1, gdzie k jest liczbą różych wartości zmieej, i liczość i-tego przedziału klasowego, & i wartość średia i-tego przedziału klasowego. Kometarz jest to przybliżoy sposób obliczeń. Przykład 4. Czy dotychczasowe sposoby wyzaczaia średiej są zawsze właściwe? Ograiczeia średiej arytmetyczej: wartości skraje mają sily wpływ a jej wartość, średiej arytmetyczej ie moża policzyć, gdy skraje przedziały szeregu są rozwarte, traci swoją wartość pozawczą w przypadku rozkładów silie asymetryczych i wielomodowych, ieadekwata dla iemetryczych skal, prób małoliczych.

Przykład obliczeia średiej z szeregu Rozważmy rozkład miesięczych zasadiczych wyagrodzeń pracowików zatrudioych w pewej firmie. ( ) Oblicz średie wyagrodzeie pracowika z wyższym wykształceiem.

Ie rodzaje średich Średia uciaa (z parametrem k) : = 1 k = tk 2 k i i k + 1 Średie dla aalizy dyamik zjawisk i stosowae dla skal ilorazowych Średia geometrycza stosowaa dla ocey średiego tempa zmia zjawiska w czasie (oraz gdy w szeregu występują zacze różice między obserwacjami; miej wrażliwa a krańcowe obserwacje odstające ). Zdefiiowaa jako: = K G 1 2 Średie harmoicze: Używaa, gdy wartości zmieej podae są w jedostkach względych, p. przecięta szybkość (w km/godz.), przecięta cea towarów (wyrażoa w liczbie jedostek za jedostkę pieiężą), gęstość zaludieia (os/km 2 ). Średia harmoicza prosta zdefiiowaa jako h = i = 1 1 i

Miary pozycyje Określają pozycję pewego (typowego) przypadku w stosuku do iych przypadków (ze względu a ich położeie w zbiorowości). Mediaa (wartość środkowa) próby Jest to wartość, dla której dokładie połowa wyików w próbie jest od iej miejsza lub rówa, a druga połowa jest od iej większa lub rówa. Jak wyzaczać mediaę? med = ( ( + 1) 2) 0,5 ( ( 2) + ( 2+ 1) ) gdy jest ieparzyste gdy jest parzyste Przykład 9. Zapytao 7 osób o wiek i otrzymao astępujące odpowiedzi: 18, 21, 43, 27, 51, 35, 29 lat. Wyzacz mediaę.

Wyzaczeie mediay z szeregu rozdzielczego: h0 med = 0 + ( F 1 ) 0 2 gdzie: 0 dola graica przedziału klasowego, który zawiera pierwszych 50% skumulowaych częstości. h 0 rozpiętość przedziału klasowego zawierającego mediaę. 0 częstość odpowiadająca przedziałowi klasowemu zawierającego mediaę. ogóla licza obserwacji. F -1 częstość skumulowaa przedziału poprzedzającego przedział klasowego, który zawiera pierwszych 50% skumulowaych częstości. Przykład obliczeń:

Kwatale (decyle, kwartyle, percetyle) Wartości cechy (mierzoej a skali, co ajmiej porządkowej), które dzielą próbę a określoe części pod względem liczby obserwacji. Najczęściej stosowae: kwartale (podział a 4 części), decyle (podział a 10 części), percetyle (podział a 100 części), Ilustracja graficza:

Domiata (wartość modala, moda) Defiicja: jest to ta kategoria zmieej omialej (lub porządkowej czy wartość liczbowa), która występuje ajczęściej. Przykład. Zbadao marki komputerów, które używa 10 osób. Są oe astępujące: HP, Del, Cm, HP, IBM, Cm, Cm, No, Cm, IBM. Wyzaczyć wartość modalą. Wyiki pomiarów powiy być wcześiej pogrupowae w odpowiedie szeregi. Wyzaczaie domiaty jest dopuszczale, gdy rozkład zmieej jest jedomodaly a jego asymetria jest umiarkowaa. Jeśli zbiorowość jest iejedoroda, a rozkład zmieej ma 2,3 lub więcej szczytów to mówimy o rozkładach biomialych, trimodalych, itd.

Wyzaczeie domiaty z szeregu rozdzielczego: 0 1 mod = 0 + h0 ( 0 1) + ( 0 + 1) gdzie: 0 dola graica przedziału klasowego z ajwiększą częstością. h 0 rozpiętość przedziału klasowego zawierającego domiatę 0 częstość odpowiadająca przedziałowi klasowemu z ajwiększą częstością. -1 częstość odpowiadająca przedziałowi poprzedzającemu. +1 częstość odpowiadająca przedziałowi astępemu. Przykład:

Miary rozproszeia Nazywae także miarami zmieości lub dyspersji. Służą do ocey czy wartości cechy są bardzo rozproszoe lub skocetrowae wokół wartości przeciętej.

Miary rozproszei są zależe od skali pomiarowej. Skala przedziałowa Rozstęp (różica między pomiarem ajwyższym i ajiższym). Odchyleie średie R = ma mi D m = i = 1 i Wariacja i odchyleie stadardowe: wariacja w próbie ( ) 2 1 = = s i i 1 odchyleie stadardowe s pierwiastek z wariacji 2 ( ) Różice w obliczaiu dla próby i populacji i s = i= 1 1 2

Przykład: W dwóch grupach chorych zmierzoo ciśieie skurczowe krwi. Otrzymao astępujące wyiki: (Grupa-1 145, 125, 130, 155, 140, 150, 135) (Grupa-2 115, 150, 100, 180, 140, 165, 130). Oblicz podstawowe miary tedecji cetralej i rozproszeia. Własości odchyleia stadardowego: jest tym większe, im większy jest rozrzut wokół średiej, gdyby wszystkie pomiary były sobie rówe, odchyleie stadardowe rówież byłoby rówe zero, w przypadku rozkładu ormalego obowiązuje tzw. reguła trzech sigm. Ie kometarze: żade wskaźik rozproszeia ie powiie zmieiać swej wartości, gdy do wszystkich elemetów próby zostaie dodaa ta sama liczba (dodatią lub ujemą), pomożeie każdego elemetu próby przez tę samą liczbę powio prowadzić do pomożeia wskaźika przez wartość bezwzględą tej liczby, wskaźiki rozproszeia ie są odpore a wartości odstające w próbie.

Wyzaczeie wariacji z szeregu rozdzielczego: s 2 k ( ) 1 = = i & i i 1 2 Przykład:

Ie miary rozproszeia Skala omiala miary iformacji (p. etropia rozkładu daych). Skala porządkowa rozstęp międzykwartylowy - ćwiartkowy (przedział między kwartylem pierwszym a trzecim). IQR = Q 3 Q 1 Skala ilorazowa tzw. względe miary zróżicowaia Współczyik zmieości: s V s = Stosoway w porówywaia siły dyspersji: kilku zbiorowości pod względem tej samej zmieej, jedej zbiorowości, ale ze względu a kilka różych zmieych. Przykład:

Miary asymetrii Po co są potrzebe? Przykład ilustracyjy Badao czas reakcji (w miutach) a lek w trzech grupach 100- osobowych. Dae przedstawioo w poiższej tabeli Czas reakcji Grupa 1 Grupa 2 Grupa 3 10,20 10 5 10 20,30 20 35 25 30,40 40 25 25 40,50 20 25 35 50,60 10 10 5 Średia arytmetycza i wariacja są jedakowe dla wszystkich grup i wyoszą =35 oraz s 2 =120. Ale czy grupy są idetycze? A co z wizualizacją rozkładów? Wykoajmy histogramy!

Grupa1 liczba osób 50 40 30 20 10 0 10,20 20,30 30,40 40,50 50,60 Czas reakcji a lek (mi) Grupa2 Liczba osób 40 35 30 25 20 15 10 5 0 10,20 20,30 30,40 40,50 50,60 Czas reakcji a lek (mi) Grupa3 liczba osób 40 35 30 25 20 15 10 5 0 10,20 20,30 30,40 40,50 50,60 Czas reakcji a lek (mi) Dokoaj iterpretacji!

Miary kocetracji

Podsumowaie Omówioo: Więcej o daych: późiejsze wykłady + literatura. Warto rozszerzyć wiedzę, p. zapozać się z zagadieiami,,