Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Podobne dokumenty
MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

1 Podstawy rachunku prawdopodobieństwa

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Statystyka. Opisowa analiza zjawisk masowych

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Parametry statystyczne

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Próba własności i parametry

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Opisowa analiza struktury zjawisk statystycznych

Miary statystyczne w badaniach pedagogicznych

Wykład 5: Statystyki opisowe (część 2)

Statystyczne metody analizy danych

Analiza struktury i przeciętnego poziomu cechy

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Pozyskiwanie wiedzy z danych

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Podstawy statystyki - ćwiczenia r.

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

W1. Wprowadzenie. Statystyka opisowa

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Analiza zróżnicowania, asymetrii i koncentracji

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Zadania ze statystyki, cz.6

Statystyka matematyczna dla leśników

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Laboratorium 3 - statystyka opisowa

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Wykład 4: Statystyki opisowe (część 1)

Statystyka Matematyczna Anna Janicka

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Zakład Ubezpieczeń Społecznych Departament Statystyki. Struktura wysokości emerytur i rent wypłacanych przez ZUS po waloryzacji w marcu 2010 roku.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

4.2. Statystyczne opracowanie zebranego materiału

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

Biostatystyka, # 1 /Weterynaria I/

Analiza statystyczna w naukach przyrodniczych

RAPORT ZBIORCZY z diagnozy umiejętności matematycznych

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Inteligentna analiza danych

INFORMACJE O WYNIKACH EGZAMINU ZAWODOWEGO W KWALIFIKACJI M.11. EKSPLOATACJA ZŁÓŻ PODZIEMNYCH

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Xi B ni B

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyki opisowe i szeregi rozdzielcze

RAPORT z diagnozy Matematyka na starcie

Podstawowe definicje statystyczne

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Porównywanie populacji

Statystyka opisowa. Robert Pietrzykowski.

RAPORT z diagnozy umiejętności matematycznych

ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Pobieranie prób i rozkład z próby

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

STATYSTYKA OPISOWA. Dr Alina Gleska. 28 września Instytut Matematyki WE PP

Graficzna prezentacja danych statystycznych

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE ZAWODOWE w województwie śląskim

Estymacja punktowa i przedziałowa

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

1 Estymacja przedziałowa

Transkrypt:

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1

Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy Miary opisujące rozkład badanej cechy statystycznej, które obliczamy na podstawie tylko niektórych wartości cechy, zajmujących szczególną pozycję w szeregu statystycznym Podział ze względu na opisywane cechy rozkładu Opisują średni lub typowy poziom wartości cechy. Określają tą wartość cechy, wokół której skupiają się wszystkie pozostałe wartości badanej cechy. Wśród nich można wyróżnić miary tendencji centralnej wskazujące położenie centralnych (przeciętnych) wartości cechy w rozkładzie (rozproszenia, rozrzutu, dyspersji) miary opisujące jak bardzo zróżnicowane są wartości cechy w zbiorowości (skośności) miary opisujące asymetrię rozkładu cechy w zbiorowości 2

Miary klasyczne Miary pozycyjne Miary tendencji centralnej Miary zróżnicowania średnia arytmetyczna średnia geometryczna średnia harmoniczna inne średnie odchylnie przeciętne wariancja odchylenie standardowe klasyczny współczynnik zmienności dominanta mediana kwantyle Rozstęp (max-min) pozycyjny współczynnik zmienności Miary skośności klasyczny współczynnik asymetrii pozycyjny współczynnik asymetrii kurtoza Klasyczno-pozycyjny współczynnik skośności Pearsona x Suma wszystkich wartości cechy (zmiennej) podzielona przez liczbę wszystkich jednostek zbiorowości x i i-ta wartość cechy (zmiennej) N liczebność 3

może być obliczona tylko dla zmiennych ilościowych wielkość abstrakcyjna, tzn. jej wartość nie musi występować w szeregu statystycznym na podstawie którego była wyznaczana (badany o średnim wzroście nie istnieje ) jest wielkością mianowaną wyrażoną w takich jednostkach miary jak badana cecha (średnia zarobków jest wyrażona np. w zł, tak jak wartości zmiennej płaca) spełniona jest relacja minimum < średnia < maksimum jest wrażliwa na wartości odstające Średnia 6 7 8 3 2 4 5 5, 6 7 8 3 2 4 5 11,4 Średniej arytmetycznej nie należy wyznaczać jeśli: zbiorowość jest niejednorodna czyli nie wszystkie badane jednostki posiadają badaną cechę występują wartości odstające, nietypowe (ekstremalne) rozkłady są skrajnie asymetryczne, siodłowe lub wielomodalne - większość wartości cechy jest wtedy stosunkowo odległa od średniej 4

D Wartość najczęściej występująca w zbiorze wartości cechy charakteryzuje typowe jednostki w zbiorowości jedyna miara położenia, którą można wyznaczyć dla zmiennych nominalnych w zbiorze wartości może występować więcej niż jedna wartość dominanty jeśli nie można wyznaczyć średniej (np. z powodu występowania wartości odstających) wyznacza się wartość dominanty Liczba nb N 1 1 12 2 4 3 3 4 1 Wyniki sprawdzianu Niedostateczny 5 Dopuszczający 4 Studenci najczęściej opuścili jedne zajęcia (D =1). N Dostateczny 7 Dobry 1 Bardzo dobry 1 Wykształcenie N Zawodowe 7 Średnie 3 Wyższe 22 Typowy badany ma wykształcenie wyższe (D = Wyższe ) Uczniowie najczęściej otrzymali ocenę dobrą lub bardzo dobrą (dwie wartości modalne) (D = dobry, D = bardzo dobry ) 5

Me Taka wartość cechy (zmiennej), że co najmniej połowa jednostek zbiorowości ma wartości nie większe (czyli mniejsze lub równe) od tej wartości i równocześnie co najmniej połowa jednostek zbiorowości ma wartości nie mniejsze (większe lub równe) od tej wartości Wartość cechy (zmiennej) w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji Egzamin PJ (9,5): 3, 5, 6, 7, 11, 15 16, 17, 18 Me=11 Co najmniej połowa zdających uzyskała co najwyżej 11 punktów, co najmniej połowa zdających uzyskała przynajmniej 11 punktów Jeśli liczba obserwacji w próbie jest parzysta, wówczas mediana jest wyznaczana jako średnia z dwóch wartości leżących pośrodku Egzamin PJ (1,5-6): 1, 3, 5, 6, 7, 11, 15 16, 17, 18 Me=9 Połowa zdających uzyskała mniej niż 9 punktów, druga połowa zdających uzyskała więcej niż 9 punktów 6

Interpretacja mediany jako wartości, która dzieli zbiorowość na pół czyli dwie równoliczne części (mówimy, że połowa wartości jest mniejsza, połowa wartości większa od mediany) jest uproszczeniem! 1) nie da się podzielić zbiorowości o nieparzystej liczbie jednostek na pół 2) wartość mediany może występować w zbiorze wielokrotnie Me=11 Egzamin PJ (16,8-9): 1, 3, 4, 4, 5, 6, 7, 11, 11, 11, 11, 13, 15 16, 17, 18 W praktyce, kiedy zbiory danych są liczne dopuszcza się taką interpretację 7

Wartości jednostek Liczba jednostek Wartości cechy (zmiennej), które dzielą zbiorowość na określone części pod względem liczby jednostek dzielą zbiorowość na 4 części dzielą zbiorowość na 1 części dzielą zbiorowość na 1 części Q Dzielą zbiorowość na 4 części: Pierwszy kwartyl (Q1), taka wartość jednostki, która dzieli zbiorowość, tak, że 25% jednostek jest od niej mniejszych, 75% większych Drugi kwartyl (Q2), wartość jednostki, że 5% jednostek jest od niej mniejszych, 5% większych (mediana!) Trzeci kwartyl (Q3), taka wartość jednostki, że 75% jednostek jest od niej mniejszych, 25% większych min Q1 Q2 Q3 max 25% 5% 75% 8

9

Dzieci Podstawowe Średnie Wyższe 3 1 2 1 1 2 2 3 3 2 1 4 2 1 3 Podstawowe Średnie Wyższe Średnia 2 2 2 Mediana 3 2 1 Dominanta 2 4 Niezależnie od wykształcenia średnia liczba dzieci jest taka sama Im wyższe wykształcenie, tym badani mają mniej dzieci Im wyższe wykształcenie tym większa typowa (najczęściej występująca) liczba dzieci 1

d 7 Zarobki w zespole A 6 5 4 Odchylenie przeciętne (163zł) Średnia (45zł) 3 2 1 1 2 3 4 5 6 7 8 9 1 11 7 Zarobki w zespole B 6 5 4 Odchylenie przeciętne (56zł) Średnia (45zł) 3 2 1 1 2 3 4 5 6 7 8 9 1 11 d 18 16 14 12 1 8 6 4 15 1 12 14 Res. 1 Res. 2 Res. 3 Res. 4 Res. 5 Res. 6 Res. 7 Res. 8 N=8 x i Res. 1 15 Res. 2 1 Res. 3 12 Res. 4 14 Res. 5 16 Res. 6 8 Res. 7 15 Res. 8 6 Suma 96 Średnia 12 x i -x 3-2 2 4-4 3-6 16 x i -x 3 2 2 4 4 3 6 24 3 8 15 6 x=12 d=3 11

d Średnia arytmetyczna wartości bezwzględnych odchyleń (różnic) poszczególnych wartości cechy od średniej Odchylenie przeciętne jest miarą rozrzutu. Mówi o tym, o jaką wartość różnią się przeciętnie wartości cechy (zmiennej) od średniej. Im większa wartość odchylenia tym większe zróżnicowanie wartości zmiennej S 2 Średnia arytmetyczna kwadratów odchyleń (różnic) poszczególnych wartości cechy od średniej 12

S Odchylenie standardowe jest pierwiastkiem kwadratowym z wariancji S 7 6 5 4 3 2 1 Zarobki w zespole A Odchylenie standardowe (195zł) Odchylenie przeciętne (163zł) Średnia (45zł) 1 2 3 4 5 6 7 8 9 1 11 7 6 5 4 3 2 1 Zarobki w zespole B Odchylenie standardowe (76 zł) Odchylenie przeciętne (56zł) Średnia (45zł) 1 2 3 4 5 6 7 8 9 1 11 13

S Odchylenie standardowe jest miarą rozrzutu. Mówi o tym, jak wartości cechy (zmiennej) są rozrzucone wokół średniej. Im większa wartość odchylenia tym większe zróżnicowanie wartości zmiennej, im mniejsze odchylenie tym mniejsze zróżnicowanie Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej, im większa wartość odchylenia tym obserwacje są bardziej oddalone od średniej 1 zł zł średnia Odchylenie od średniej Odchylenie standardowe 5 zł 5 zł średnia Odchylenie od średniej Odchylenie standardowe 28 14

S Rozkład temperatur latem Rozkład temperatur w ciągu roku Wzrost wśród pierwszaków Wzrost wśród studentów Oszczędności Kobiety: x=1zł, s=1zł Mężczyźni: x=15zł, s=1zł Wynik testu 1) x=6%, s=1% 2) x=6%, s=25% 1) x=5%, d=3% 2) x=5%, d=6% 1) x=6%, M=7% 2) x=6%, M=4% V S V S klasyczny współczynnik zmienności S - odchylenie standardowe x - średnia Klasyczny współczynnik zmienności informuje jaki procent średniej arytmetycznej stanowi odchylenie standardowe Wartość KWZ Zróżnicowanie cechy -2% Słabe 2-4% Umiarkowane 4-6% Silne Powyżej 6% Bardzo silne Silne lub bardzo silne zróżnicowanie cechy wskazuje, że zbiorowość jest niejednorodna, w takiej sytuacji średnia arytmetyczna jest niemiarodajną miarą ma małą wartość poznawczą. 15

7 6 5 4 3 2 1 Zarobki w zespole A Odchylenie standardowe (195zł) Średnia (45zł) Klasyczny współczynnik zmienności 48% 1 2 3 4 5 6 7 8 9 1 11 7 6 5 4 3 2 1 Zarobki w zespole B Odchylenie standardowe (76 zł) Średnia (45zł) Klasyczny współczynnik zmienności 19% 1 2 3 4 5 6 7 8 9 1 11 Reguła trzech sigm (odchyleń standardowych) mówi, że dla rozkładu normalnego: 68,3% wartości cechy leży w odległości jednego odchylenia standardowego od średniej arytmetycznej 95,5% wartości cechy leży w odległości dwóch odchyleń od średniej 99,7% wartości cechy leży w odległości trzech odchyleń standardowych od średniej arytmetycznej 16

średnia: µ= 1 odchylenie standardowe: =15 68,3% populacji ma iloraz inteligencji mieszczący się w przedziale 85-115 (1±15) 95,5% populacji ma iloraz inteligencji mieszczący się w przedziale 7-13 (1±2*15) 99,7% populacji ma iloraz inteligencji mieszczący się w przedziale 55-145 (1±3*15) średnia: µ= 4, odchylenie standardowe: =,3 68,3% studentów ma średnią z sesji mieszczącą się w przedziale 3,7-4,3 95,5% studentów ma średnią z sesji mieszczącą się w przedziale 3,4-4,6 99,7% studentów ma średnią z sesji mieszczącą się w przedziale 3,1-4,9 17