Statystyki opisowe. Marcin Zajenkowski. Marcin Zajenkowski () Statystyki opisowe 1 / 57



Podobne dokumenty
Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

STA T T A YSTYKA Korelacja

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych

Test F- Snedecora. będzie zmienną losową chi-kwadrat o k 1 stopniach swobody a χ

RAPORT z diagnozy Matematyka na starcie

KONKURSY MATEMATYCZNE. Treść zadań

Matematyka:Matematyka I - ćwiczenia/granice funkcji

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności

Efektywność nauczania w Gimnazjum w Lutyni

Test całoroczny z matematyki. Wersja A

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

Statystyka opisowa. Wykªad II. Elementy statystyki opisowej. Edward Kozªowski.

14.Rozwiązywanie zadań tekstowych wykorzystujących równania i nierówności kwadratowe.

Wyklad 1. Analiza danych za pomocą pakietu SAS. Obiekty i zmienne. Rodzaje zmiennych

Przykłady wybranych fragmentów prac egzaminacyjnych z komentarzami Technik ochrony fizycznej osób i mienia 515[01]

1 Granice funkcji. Definicja 1 (Granica w sensie Cauchy ego). Mówimy, że liczba g jest granicą funkcji f(x) w punkcie x = a, co zapisujemy.

TEST WIADOMOŚCI: Równania i układy równań

'()(*+,-./01(23/*4*567/8/23/*98:)2(!."/+)012+3$%-4#"4"$5012#-4#"4-6017%*,4.!"#$!"#%&"!!!"#$%&"#'()%*+,-+

I. LOGICZNE STRUKTURY DRZEWIASTE

Zadanie 3 - (7 punktów) Iloczyn składników Jeśli zapis liczby 22 w postaci sumy zawiera składnik 1, lepiej pogrupować go z innym składnikiem

W. Guzicki Zadanie 23 z Informatora Maturalnego poziom rozszerzony 1

Warszawska Giełda Towarowa S.A.

Klasa I szkoły ponadgimnazjalnej język polski

TWIERDZENIE PITAGORASA

OGÓLNODOSTĘPNE IFORMACJE O WYNIKACH EGZAMINÓW I EFEKTYWNOŚCI NAUCZANIA W GIMNAZJACH przykłady ich wykorzystania i interpretowania

Estymacja przedziałowa

ROZWIĄZANIA ZADAŃ Zestaw P3 Odpowiedzi do zadań zamkniętych

XIII KONKURS MATEMATYCZNY

AUTOR MAGDALENA LACH

Ćwiczenie nr 2 Zbiory rozmyte logika rozmyta Rozmywanie, wnioskowanie, baza reguł, wyostrzanie

KARTY PRACY UCZNIA. Twierdzenie Pitagorasa i jego zastosowanie. samodzielnej pracy ucznia. Zawarte w nich treści są ułożone w taki sposób,

Podstawowe oddziaływania w Naturze

Podejmowanie decyzji. Piotr Wachowiak

3b. Rozwiązywanie zadań ze skali mapy

2.Prawo zachowania masy

1. Rozwiązać układ równań { x 2 = 2y 1

Rozdział 6. Pakowanie plecaka. 6.1 Postawienie problemu

Niegrzeczne dzieciaki na gorącym krześle

Odpowiedzi i schematy oceniania Arkusz 23 Zadania zamknięte. Wskazówki do rozwiązania. Iloczyn dwóch liczb ujemnych jest liczbą dodatnią, zatem

WOJEWÓDZKI KONKURS MATEMATYCZNY DLA SZKÓŁ PODSTAWOWYCH W ROKU SZKOLNYM 2012/2013

Ogólna charakterystyka kontraktów terminowych

PRAWA ZACHOWANIA. Podstawowe terminy. Cia a tworz ce uk ad mechaniczny oddzia ywuj mi dzy sob i z cia ami nie nale cymi do uk adu za pomoc

Analiza wyników egzaminu gimnazjalnego. Test matematyczno-przyrodniczy matematyka. Test GM-M1-122,

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Twierdzenie Bayesa. Indukowane Reguły Decyzyjne Jakub Kuliński Nr albumu: 53623

MATEMATYKA 9. INSTYTUT MEDICUS Kurs przygotowawczy do matury i rekrutacji na studia medyczne Rok 2017/2018 FUNKCJE WYKŁADNICZE, LOGARYTMY

Zagadnienia transportowe

1. Obliczenie SDR pojazdów silnikowych ogółem w punkcie pomiarowym typu P

7. REZONANS W OBWODACH ELEKTRYCZNYCH

KLASA 3 GIMNAZJUM. 1. LICZBY I WYRAŻENIA ALGEBRAICZNE (26 h) 1. Lekcja organizacyjna System dziesiątkowy System rzymski 5-6

Transport Mechaniczny i Pneumatyczny Materiałów Rozdrobnionych. Ćwiczenie 2 Podstawy obliczeń przenośników taśmowych

Zagadnienia do egzaminu ustnego z matematyki dla Uzupełniającego Liceum Ogólnokształcącego dla Dorosłych - III semestr

MATEMATYKA 4 INSTYTUT MEDICUS FUNKCJA KWADRATOWA. Kurs przygotowawczy na studia medyczne. Rok szkolny 2010/2011. tel

Logika I. Wykład 2. Działania na zbiorach

Trenuj przed sprawdzianem! Matematyka Test 4

Kalkulacyjny układ kosztów

Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej

Spis treści. Dokument pochodzi ze strony LICZBY NATURALNE I UŁAMKI

Wiedza niepewna i wnioskowanie (c.d.)

PLAN PRACY KOMISJI PRZYZNAJĄCEJ

Zadanie 1. Liczba szkód w każdym z trzech kolejnych lat dla pewnego ubezpieczonego ma rozkład równomierny:

Kratownice Wieża Eiffel a

Temat: Co to jest optymalizacja? Maksymalizacja objętości naczynia prostopadłościennego za pomocą arkusza kalkulacyjngo.

Zadania. SiOD Cwiczenie 1 ;

Statystyka matematyczna

Mapa umiejętności czytania, interpretacji i posługiwania się mapą Polski.

RAPORT Z 1 BADANIA POZIOMU SATYSFAKCJI KLIENTÓW URZĘDU MIEJSKIEGO W KOLUSZKACH

Matematyka dyskretna. Andrzej Łachwa, UJ, /14

Dokonamy analizy mającej na celu pokazanie czy płeć jest istotnym czynnikiem

Prezentacja dotycząca sytuacji kobiet w regionie Kalabria (Włochy)

PAKIET MathCad - Część III

WYKŁAD 8. Postacie obrazów na różnych etapach procesu przetwarzania

Kurs wyrównawczy dla kandydatów i studentów UTP

WYZNACZANIE PRZYSPIESZENIA ZIEMSKIEGO ZA POMOCĄ WAHADŁA REWERSYJNEGO I MATEMATYCZNEGO

III. GOSPODARSTWA DOMOWE, RODZINY I GOSPODARSTWA ZBIOROWE

Regresja i korelacja. Statystyka w medycynie. Dr inż. Janusz Majewski Katedra Informatyki

PROJEKTY UCHWAŁ NA NADZWYCZAJNE WALNE ZGROMADZENIE HETAN TECHNOLOGIES SPÓŁKA AKCYJNA W DNIU 25 MAJA 2016 ROKU

Nazwa przedmiotu: Rachunek prawdopodobieństwa i statystyka. Nazwa jednostki prowadzącej przedmiot / moduł: WMF Instytut Matematyki

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 5

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

SZCZEGÓŁOWE SPECYFIKACJE TECHNICZNE SST RECYKLING

K P K P R K P R D K P R D W

Objaśnienia do Wieloletniej Prognozy Finansowej na lata

WEWNĄTRZSZKOLNE I ZEWNĘTRZSZKOLNE ZASTOSOWANIE SCHEMATU OCENIANIA NA PRZYKŁADZIE EGZAMINU MATURALNEGO Z GEOGRAFII

Zadania ćwiczeniowe do przedmiotu Makroekonomia I

SPECYFIKACJA TECHNICZNA WYKONANIA I ODBIORU ROBÓT BUDOWLANYCH ROBOTY W ZAKRESIE STOLARKI BUDOWLANEJ

LOGISTYKA DYSTRYBUCJI ćwiczenia 5 ZAPASY ROZPROSZONE ZARZĄDZANIE ZAPASAMI WIELU LOKALIZACJI

RZECZPOSPOLITA POLSKA. Prezydent Miasta na Prawach Powiatu Zarząd Powiatu. wszystkie

KLAUZULE ARBITRAŻOWE

POMOC PSYCHOLOGICZNO-PEDAGOGICZNA Z OPERONEM. Vademecum doradztwa edukacyjno-zawodowego. Akademia

BAZA ZADAŃ KLASA 3 TECHNIKUM LOGARYTMY I FUNKCJA WYKŁADNICZA. 1. Oblicz: a) b) c) d) e)* f) g) h) i) j) k) l) m) n) o) p) r)

Temat: Mnożenie liczby całej przez ułamek. Obliczanie ułamka z danej liczby.

Przedmiotowe zasady oceniania. zgodne z Wewnątrzszkolnymi Zasadami Oceniania. obowiązującymi w XLIV Liceum Ogólnokształcącym.

Pomiary geofizyczne w otworach

Biostatystyka w badaniach medycznych i praktyce klinicznej

KASA EDUKACYJNA INSTRUKCJA. WARIANT I - dla dzieci młodszych

ROZWIĄZANIA PRZYKŁADOWYCH ZADAŃ. KORELACJA zmiennych jakościowych (niemierzalnych)

Przedmiotowy system oceniania z przedmiotu wiedza o społeczeństwie Publicznego Gimnazjum Sióstr Urszulanek UR we Wrocławiu w roku szkolnym 2015/2016

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA

Transkrypt:

Statystyki opisowe Marcin Zajenkowski Marcin Zajenkowski () Statystyki opisowe 1 / 57

Struktura 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 2 / 57

Miary tendencji centralnej Miary tendencji centralnej Jak porównać ze sobą dwa zbiory wyników? Np. oceny dwóch klas licealnych? Można porównać np. średnie ocen w obu klasach. Tendencja centralna oznacza pewną wartość stawnowiącą centralny punkt odniesienia. Wartość ta jest zazwyczaj bliska punktowi największego skupienia pomiarów, czyli jest typowa. Marcin Zajenkowski () Statystyki opisowe 3 / 57

Miary tendencji centralnej Miary tendencji centralnej Jak porównać ze sobą dwa zbiory wyników? Np. oceny dwóch klas licealnych? Można porównać np. średnie ocen w obu klasach. Tendencja centralna oznacza pewną wartość stawnowiącą centralny punkt odniesienia. Wartość ta jest zazwyczaj bliska punktowi największego skupienia pomiarów, czyli jest typowa. Marcin Zajenkowski () Statystyki opisowe 3 / 57

Miary tendencji centralnej Miary tendencji centralnej Jak porównać ze sobą dwa zbiory wyników? Np. oceny dwóch klas licealnych? Można porównać np. średnie ocen w obu klasach. Tendencja centralna oznacza pewną wartość stawnowiącą centralny punkt odniesienia. Wartość ta jest zazwyczaj bliska punktowi największego skupienia pomiarów, czyli jest typowa. Marcin Zajenkowski () Statystyki opisowe 3 / 57

Miary tendencji centralnej Populacja µ - wartość oczekiwana. M - modalna. Me - mediana. Próba X - średnia arytmetyczna. m - modalna. me - mediana. Marcin Zajenkowski () Statystyki opisowe 4 / 57

Outline 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 5 / 57

Średnia arytmetyczna Średnia arytmetyczna to suma pomiarów przez ich liczbę. Np. pomiary: 7, 13, 22, 9, 11, 14. Suma 66, a średnia 11. Wzór: X = X n Marcin Zajenkowski () Statystyki opisowe 6 / 57

Średnia arytmetyczna Średnia arytmetyczna to suma pomiarów przez ich liczbę. Np. pomiary: 7, 13, 22, 9, 11, 14. Suma 66, a średnia 11. Wzór: X = X n Marcin Zajenkowski () Statystyki opisowe 6 / 57

Rozkłady liczebności Dane z badań są często zbiorami liczb. Badaczowi pomocny jest rozkład liczebności. Rozkład liczebności uporządkowanie danych ze względu na liczebności. f liczebność, czyli ile razy wystąpiła dana wartość Przedziały klasowe - dowolnie określone grupy wartości (np. co 5 punktów). Marcin Zajenkowski () Statystyki opisowe 7 / 57

Rozkłady liczebności Gdy mamy zmienną ciągłą należy uwzględnić granice dokładne przedziałów. Np. gdy zapisujemy wyniki z dokładnością do 1 cm, to 16 cm przy zastosowaniu dokładniejszego pomiaru mieści się w granicach 15,5 16, 5. Inny przykład: czas reakcji = 0,196 sek, czyli przedział = 0,1955-0,1965 Liczebność skumulowana dodanie od dołu liczebności. Pozwala powiedzieć w jakiej liczbie przypadków wyniki są niższe lub wyższe od określonej wartości. Skumulowane procenty liczebności otrzymuje się poprzez podzielenie liczebności skumulowanej przez całkowitą liczbę przypadków. I w ten sposób można powiedzieć jaki jest procent wyników większych niż bądź mniejszych niż jakaś wartość. Marcin Zajenkowski () Statystyki opisowe 8 / 57

Obliczanie średniej z rozkładów liczebności W sytuacji gdy różne wartości zmiennej X pojawiają się więcej niż raz, średnią arytmetyczną można obliczyć mnożąc każdą wartość X przez jej liczebność dodając jej iloczyny do siebie i dzieląc przez całkowitą liczbę pomiarów. W przedziałach klasowych większych niż 1, bierze się pod uwagę środek przedziału. Zadanie. Przedstaw rozkład liczebności następujących wyników: 11, 11, 12, 12, 12, 13, 13, 13, 13, 14, 14, 15, 15, 15, 16, 16, 17, 17, 18. Marcin Zajenkowski () Statystyki opisowe 9 / 57

Zadanie 1 Xi fi fixi 18 1 18 17 2 34 16 2 32 15 3 45 14 2 28 13 5 65 12 3 36 11 2 22 Razem 20 280 X = 280 20 = 14 Marcin Zajenkowski () Statystyki opisowe 10 / 57

Zadanie 1 Xi fi fixi 18 1 18 17 2 34 16 2 32 15 3 45 14 2 28 13 5 65 12 3 36 11 2 22 Razem 20 280 X = 280 20 = 14 Marcin Zajenkowski () Statystyki opisowe 10 / 57

Zadanie 2 Oblicz średnią Przedział klasowy Liczebność fi 15 19 2 10 14 34 5 9 23 0 4 5 Marcin Zajenkowski () Statystyki opisowe 11 / 57

Rozwiązanie Przedział klasowy Liczebność fi Środek przedziału Liczebność x środek 15 19 2 17 34 10 14 34 12 408 5 9 23 7 161 0 4 5 2 10 64 613 Marcin Zajenkowski () Statystyki opisowe 12 / 57

Właściwości średniej arytmetycznej 1 Odchylenie od średniej Różnica między pewnym wynikiem a średnią. Suma odchyleń równa się 0. 2 Suma kwadratów odchyleń od średniej arytmetycznej jest mniejsza niż suma kwadratów odchyleń od dowolnej innej wartości. Marcin Zajenkowski () Statystyki opisowe 13 / 57

Przykład Np. 7, 13, 22, 9, 11, 4. Średnia = 11. Kwadraty odchyleń: 16, 4, 121, 4, 0, 49, suma = 194. Weźmy inną wartość np. 13, kwadraty: 36, 0, 81, 16, 4, 81, suma 218. Te cechy pokazują że średnia stanowi centrum, środek ciężkości. Alternatywna definicja średniej arytmetycznej: Jest to taka miara tendencji centralnej od której suma kwadratów odchyleń jest najmniejsza. Marcin Zajenkowski () Statystyki opisowe 14 / 57

Przykład Np. 7, 13, 22, 9, 11, 4. Średnia = 11. Kwadraty odchyleń: 16, 4, 121, 4, 0, 49, suma = 194. Weźmy inną wartość np. 13, kwadraty: 36, 0, 81, 16, 4, 81, suma 218. Te cechy pokazują że średnia stanowi centrum, środek ciężkości. Alternatywna definicja średniej arytmetycznej: Jest to taka miara tendencji centralnej od której suma kwadratów odchyleń jest najmniejsza. Marcin Zajenkowski () Statystyki opisowe 14 / 57

Outline 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 15 / 57

Modalna Modalna (moda, dominanta) - wartość występująca najczęściej. Np. w zbiorze wyników: 5, 8, 8, 4, 2, 1, modalna = 8. Nie da się obliczyć gdy wszystkie wartości mają tę samą liczebność. Np. w zbiorze: 5, 12, 20, 24, 16. Marcin Zajenkowski () Statystyki opisowe 16 / 57

Modalna Gdy dwie sąsiadujące ze sobą wartości występują najczęściej oblicza się średnią z tych dwóch wartości. np. 11 11 12 12 12 13 13 13 13 14 14 14 14 15 15 16 16 17 18 modalna 13,5 Jeżeli dwie nie sąsiadujące ze sobą wartości występują najczęśćiej wtedy obie są modalnymi rozkład dwumodalny. Ale wtedy nie jest to miara tendencji centralnej. Wartość modalną można uważać za miarę tendencji centralnej gdy wartości zmiennej systematycznie maleją, zbiegając ku krańcom. W przedziałach klasowych środek przedziału o największej liczebności. Marcin Zajenkowski () Statystyki opisowe 17 / 57

Modalna Gdy dwie sąsiadujące ze sobą wartości występują najczęściej oblicza się średnią z tych dwóch wartości. np. 11 11 12 12 12 13 13 13 13 14 14 14 14 15 15 16 16 17 18 modalna 13,5 Jeżeli dwie nie sąsiadujące ze sobą wartości występują najczęśćiej wtedy obie są modalnymi rozkład dwumodalny. Ale wtedy nie jest to miara tendencji centralnej. Wartość modalną można uważać za miarę tendencji centralnej gdy wartości zmiennej systematycznie maleją, zbiegając ku krańcom. W przedziałach klasowych środek przedziału o największej liczebności. Marcin Zajenkowski () Statystyki opisowe 17 / 57

Modalna Gdy dwie sąsiadujące ze sobą wartości występują najczęściej oblicza się średnią z tych dwóch wartości. np. 11 11 12 12 12 13 13 13 13 14 14 14 14 15 15 16 16 17 18 modalna 13,5 Jeżeli dwie nie sąsiadujące ze sobą wartości występują najczęśćiej wtedy obie są modalnymi rozkład dwumodalny. Ale wtedy nie jest to miara tendencji centralnej. Wartość modalną można uważać za miarę tendencji centralnej gdy wartości zmiennej systematycznie maleją, zbiegając ku krańcom. W przedziałach klasowych środek przedziału o największej liczebności. Marcin Zajenkowski () Statystyki opisowe 17 / 57

Modalna Gdy dwie sąsiadujące ze sobą wartości występują najczęściej oblicza się średnią z tych dwóch wartości. np. 11 11 12 12 12 13 13 13 13 14 14 14 14 15 15 16 16 17 18 modalna 13,5 Jeżeli dwie nie sąsiadujące ze sobą wartości występują najczęśćiej wtedy obie są modalnymi rozkład dwumodalny. Ale wtedy nie jest to miara tendencji centralnej. Wartość modalną można uważać za miarę tendencji centralnej gdy wartości zmiennej systematycznie maleją, zbiegając ku krańcom. W przedziałach klasowych środek przedziału o największej liczebności. Marcin Zajenkowski () Statystyki opisowe 17 / 57

Przykład Ile wynosi modalna? Przedział klasowy Liczebność fi 15 19 2 10 14 34 5 9 23 0 4 5 Marcin Zajenkowski () Statystyki opisowe 18 / 57

Przykład Ile wynosi modalna? Przedział klasowy Liczebność fi 15 19 2 10 14 34 5 9 23 0 4 5 Modalna = 12 Marcin Zajenkowski () Statystyki opisowe 19 / 57

Outline 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 20 / 57

Mediana Mediana jest wartością dzielącą wszystkie pomiary na pół, tzn. tak że połowa pomiarów jest powyżej niej a połowa poniżej. Np. 2, 7, 16, 19, 20, 25, 27 me = 19 Gdy są parzyste wartości to mediana jest średnią arytmetyczną z dwóch środkowych wartości. Np. 2, 7, 16, 19, 20, 25, 27, 31 Mediana (19 + 20)/2 Marcin Zajenkowski () Statystyki opisowe 21 / 57

Mediana Mediana jest wartością dzielącą wszystkie pomiary na pół, tzn. tak że połowa pomiarów jest powyżej niej a połowa poniżej. Np. 2, 7, 16, 19, 20, 25, 27 me = 19 Gdy są parzyste wartości to mediana jest średnią arytmetyczną z dwóch środkowych wartości. Np. 2, 7, 16, 19, 20, 25, 27, 31 Mediana (19 + 20)/2 Marcin Zajenkowski () Statystyki opisowe 21 / 57

Mediana Mediana jest wartością dzielącą wszystkie pomiary na pół, tzn. tak że połowa pomiarów jest powyżej niej a połowa poniżej. Np. 2, 7, 16, 19, 20, 25, 27 me = 19 Gdy są parzyste wartości to mediana jest średnią arytmetyczną z dwóch środkowych wartości. Np. 2, 7, 16, 19, 20, 25, 27, 31 Mediana (19 + 20)/2 Marcin Zajenkowski () Statystyki opisowe 21 / 57

Mediana Mediana jest wartością dzielącą wszystkie pomiary na pół, tzn. tak że połowa pomiarów jest powyżej niej a połowa poniżej. Np. 2, 7, 16, 19, 20, 25, 27 me = 19 Gdy są parzyste wartości to mediana jest średnią arytmetyczną z dwóch środkowych wartości. Np. 2, 7, 16, 19, 20, 25, 27, 31 Mediana (19 + 20)/2 Marcin Zajenkowski () Statystyki opisowe 21 / 57

Mediana dla rozkładów liczebności zmiennej ciągłej me = X d i + ( n 2 f c i 1 f i ) h i X d i - dokładna dolna granica przedziału, w którym jest mediana f c i 1 - liczebność skumulowana klasy wcześniejszej niż mediana f i - liczebność klasy medialnej h i - długość przedziału klasowego Marcin Zajenkowski () Statystyki opisowe 22 / 57

Przykład Oblicz medianę dla rozkładu liczebności zmiennej ciągłej. Przedział klasowy Liczebność fi 15 19 33 10 14 45 5 9 102 0 4 0 Marcin Zajenkowski () Statystyki opisowe 23 / 57

Przykład Podział klasowy Liczebność Liczebność skumulowana 15 19 33 180 10 14 45 147 5 9 102 102 0 4 0 0 180 180 me = 4,5 + ( 180 2 0 102 ) 5 = 4,5 + 4,4,41 = 8,91 Marcin Zajenkowski () Statystyki opisowe 24 / 57

Przykład 2 Oblicz medianę dla rozkładu liczebności zmiennej ciągłej. Przedziały klasowe Liczebność 45-49 1 40-44 2 35-39 3 30-34 6 25-29 8 20-24 17 15-19 26 10-14 11 5-9 2 0-4 0 Razem 76 Marcin Zajenkowski () Statystyki opisowe 25 / 57

Rozwiązanie Oblicz medianę dla rozkładu liczebności zmiennej ciągłej. Przedziały klasowe Liczebność 45-49 1 40-44 2 35-39 3 30-34 6 25-29 8 20-24 17 15-19 26 10-14 11 5-9 2 0-4 0 Razem 76 me = 14,5 + ( 76 2 13 26 ) 5 = 19,31 Marcin Zajenkowski () Statystyki opisowe 26 / 57

Zadanie Podaj średnią, modalną i medianę (zmienna ciągła) dla następującego zbioru danych: Przedział klasowy Liczebność 15-19 56 10-14 76 5-9 46 0-4 2 Marcin Zajenkowski () Statystyki opisowe 27 / 57

Porównanie miar tendencji centralnej Średnia dobra dla zmiennych przedziałowych i stosunkowych Mediana przedziałowych Modalna nominalnych Marcin Zajenkowski () Statystyki opisowe 28 / 57

Porównanie miar tendencji centralnej Średnia punkt równowagi rozkładu Mediana dzieli rozkład na dwie równe części Modalna odpowiada najwyższemu punktowi na krzywej. Jeżeli rozkład jest symetryczny to wszystkie 3 zbiegają się w jednym punkcie. Marcin Zajenkowski () Statystyki opisowe 29 / 57

Porównanie miar tendencji centralnej Średnia punkt równowagi rozkładu Mediana dzieli rozkład na dwie równe części Modalna odpowiada najwyższemu punktowi na krzywej. Jeżeli rozkład jest symetryczny to wszystkie 3 zbiegają się w jednym punkcie. Marcin Zajenkowski () Statystyki opisowe 29 / 57

Struktura 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 30 / 57

1 Mamy dwa zbiory wyników: A: 2, 5, 8, 10, 15 B: 7, 8, 8, 8, 9 2 W obu zbiorach średnia i mediana wynosi 8. Co różni te dwa zbiory? 3 Statystyka to badanie zróżnicowania, czyli zmienności Marcin Zajenkowski () Statystyki opisowe 31 / 57

1 Mamy dwa zbiory wyników: A: 2, 5, 8, 10, 15 B: 7, 8, 8, 8, 9 2 W obu zbiorach średnia i mediana wynosi 8. Co różni te dwa zbiory? 3 Statystyka to badanie zróżnicowania, czyli zmienności Marcin Zajenkowski () Statystyki opisowe 31 / 57

1 Mamy dwa zbiory wyników: A: 2, 5, 8, 10, 15 B: 7, 8, 8, 8, 9 2 W obu zbiorach średnia i mediana wynosi 8. Co różni te dwa zbiory? 3 Statystyka to badanie zróżnicowania, czyli zmienności Marcin Zajenkowski () Statystyki opisowe 31 / 57

Outline 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 32 / 57

Rozstęp Rozstęp to szerokość przedziału, w którym znalazły się wyniki w danej próbie Inaczej: Rozstęp = X max - X min Marcin Zajenkowski () Statystyki opisowe 33 / 57

Przykłady Ile wynoszą rozstępy w tych zbiorach? A: 2, 5, 8, 10, 15 B: 7, 8, 8, 8, 9 C: 2.10 2.12 2.56 2.78 2.88 3.12 3.43 Marcin Zajenkowski () Statystyki opisowe 34 / 57

Outline 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 35 / 57

Wariancja Wariancja to średni kwadrat odchyleń od średniej. Wzór k σ 2 = j=1 (X µ) 2 N Marcin Zajenkowski () Statystyki opisowe 36 / 57

Wariancja Wariancja w próbie: k s 2 = j=1 (X X ) 2 n - 1 Inaczej: Wariancja jest to średnia arytmetyczna z kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej całej zbiorowości. Marcin Zajenkowski () Statystyki opisowe 37 / 57

Outline 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 38 / 57

Odchylenie standardowe Odchylenie standardowe to pierwiastek z wariancji. Daje zatem oszacowanie bez kwadratu, czyli w jednostkach w których pierwotnie były podawane wartości. Wzór: (X X ) 2 s = n - 1 Marcin Zajenkowski () Statystyki opisowe 39 / 57

Przykład Zważono 10 losowo wybranych główek czosnku otrzymując dane (w gramach): 14, 24, 19, 18, 21, 22, 25, 20, 17, 20 Ile wynosi odchylenie standardowe? Marcin Zajenkowski () Statystyki opisowe 40 / 57

Rozwiązanie X X - X (X X ) 2 14-6 36 24 4 16 19-1 1 18-2 4 21 1 1 22 2 4 25 5 25 20 0 0 17 3 9 20 0 0 Średnia 20 s = 96 9 = 3,26 Marcin Zajenkowski () Statystyki opisowe 41 / 57

Odchylenie standardowe Co oznacza wynik z przykładu? Wagi czosnku w wybranej próbie wahają się w granicach + - 3,26 od średniej Marcin Zajenkowski () Statystyki opisowe 42 / 57

Odchylenie standardowe - zadanie Piekielny Piotruś wybrał się na targ i kupił główkę czosnku z poprzedniego zbioru o wadze 14 Czy dobrze zrobił? Nie, ponieważ wielkość jego czosnku znajduje się 2 odchylenia standardowe poniżej średniej. Marcin Zajenkowski () Statystyki opisowe 43 / 57

Odchylenie standardowe - zadanie Piekielny Piotruś wybrał się na targ i kupił główkę czosnku z poprzedniego zbioru o wadze 14 Czy dobrze zrobił? Nie, ponieważ wielkość jego czosnku znajduje się 2 odchylenia standardowe poniżej średniej. Marcin Zajenkowski () Statystyki opisowe 43 / 57

Odchylenie standardowe - zadanie Piekielny Piotruś wybrał się na targ i kupił główkę czosnku z poprzedniego zbioru o wadze 14 Czy dobrze zrobił? Nie, ponieważ wielkość jego czosnku znajduje się 2 odchylenia standardowe poniżej średniej. Marcin Zajenkowski () Statystyki opisowe 43 / 57

Struktura 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 44 / 57

Czym różnią się następujące rozkłady ocen w klasach? Klasa 1 Ocena Liczebność 2 5 3 15 4 15 5 5 Klasa 2 Ocena Liczebność 2 20 3 10 4 5 5 5 Klasa 3 Ocena Liczebność 2 5 3 5 4 10 5 20 Marcin Zajenkowski () Statystyki opisowe 45 / 57

Momenty średniej Momenty średniej pojęcie z mechaniki. Rozważając rozkłady liczebności można posłużyć się analogią do punktu oparcia dźwigni liczebności różnych przedziałów są analogiczne do sił działających na dźwignię z różnych odległości punktu odniesienia. Marcin Zajenkowski () Statystyki opisowe 46 / 57

Momenty średniej m 1 = (X X ) n m 2 = (X - X ) 2 n m 3 = (X - X ) 3 n m 4 = (X - X ) 4 n m r = (X - X ) r n Marcin Zajenkowski () Statystyki opisowe 47 / 57

Outline 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 48 / 57

Skośność Wskaźnik asymetrii rozkładu wokół średniej. Zawiera informacje o możliwych różnicach pomiędzy dodatnimi i ujemnymi odchyleniami od wartości średniej. Wzór: g 1 = m 3 m 2 m2 Marcin Zajenkowski () Statystyki opisowe 49 / 57

Skośność g 1 = 0 rozkład symetryczny g 1 < 0, czyli ujemny - rozkład lewoskośny, skośny ujemnie. Przewaga wysokich wyników g 1 > 0, czyli dodatni - rozkład prawoskośny. Przewaga niskich wyników Marcin Zajenkowski () Statystyki opisowe 50 / 57

Marcin Zajenkowski () Statystyki opisowe 51 / 57

Zadanie Oblicz skośność dla następujących wyników: A: 1, 3, 5, 8, 13 B: 1, 2, 10, 12, 15 Marcin Zajenkowski () Statystyki opisowe 52 / 57

Outline 1 Miary tendencji centralnej Średnia arytmetyczna Wartość modalna Mediana 2 Miary rozproszenia Roztęp Wariancja Odchylenie standardowe 3 Miary badające kształt rozkładu Skośność Kurtoza Marcin Zajenkowski () Statystyki opisowe 53 / 57

Kurtoza Wskaźnik informujący o tym, czy rozkład jest wysmukły (leptokurtyczny), czy spłaszczony (platokurtyczny). Wzór: g 2 = m 4 m 2 2 Marcin Zajenkowski () Statystyki opisowe 54 / 57

Kurtoza g 2 = 0 rozkład normalny g 2 < 0 - rozkład platykurtyczny (rozpłaszczony) g 2 > 0 - rozkład leptokurtyczny (spiczasty) Marcin Zajenkowski () Statystyki opisowe 55 / 57

Marcin Zajenkowski () Statystyki opisowe 56 / 57

Zadanie Ile wynosi kurtoza w grupie wyników: 6 8 10 12 14 Marcin Zajenkowski () Statystyki opisowe 57 / 57