Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Podobne dokumenty
Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyka. Opisowa analiza zjawisk masowych

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Opisowa analiza struktury zjawisk statystycznych

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

W1. Wprowadzenie. Statystyka opisowa

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Próba własności i parametry

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

1 Podstawy rachunku prawdopodobieństwa

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyczne metody analizy danych

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Ćwiczenia 1-2 Analiza rozkładu empirycznego

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Miary statystyczne w badaniach pedagogicznych

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka Matematyczna Anna Janicka

Analiza struktury i przeciętnego poziomu cechy

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Parametry statystyczne

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Statystyka matematyczna i ekonometria

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Matematyka stosowana i metody numeryczne

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Podstawowe pojęcia statystyczne

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Pozyskiwanie wiedzy z danych

Biostatystyka, # 1 /Weterynaria I/

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka w pracy badawczej nauczyciela

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Statystyka opisowa. Robert Pietrzykowski.

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Podstawowe pojęcia cd. Etapy badania statystycznego

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Wykład ze statystyki. Maciej Wolny

Estymacja punktowa i przedziałowa

4.2. Statystyczne opracowanie zebranego materiału

Graficzna prezentacja danych statystycznych

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

STATYSTYKA OPISOWA. Dr Alina Gleska. 28 września Instytut Matematyki WE PP

Zmienne losowe. Statystyka w 3

99 wybranych pytań ze statystyki i odpowiedzi na nie

Transport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Studia stacjonarne (stacjonarne / niestacjonarne)

Policealna Szkoła Handlowa Rok I Wymiar godzin: 30 jednostek dydaktycznych Nr programu nauczania: 341(06)/SP/MEN/ (technik rachunkowości)

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

You created this PDF from an application that is not licensed to print to novapdf printer (

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

Wykład 5: Statystyki opisowe (część 2)

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Biostatystyka, # 3 /Weterynaria I/

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Wykład 4: Statystyki opisowe (część 1)

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Analiza zróżnicowania, asymetrii i koncentracji

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Rozkłady zmiennych losowych

Transkrypt:

Statystyka Opisowa WK1.2017 Andrzej Pawlak Intended Audience: PWR

POJĘCIA STATYSTYKI 1. Zbiór danych liczbowych pokazujących kształtowanie się określonych zjawisk i procesów (roczniki statystyczne). 2. Nazwy charakterystyk liczbowych obliczanych na podstawie zbiorowości próbnych (średnia arytmetyczna z próby, odchylenie standardowe). 2013 SAP AG. All rights reserved. Confidential 2

PRZEDMIOT, ZADANIA I CELE STATYSTYKI Statystyka to dyscyplina naukowa, której przedmiotem są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska masowe w celu uzyskania uogólnionych informacji na temat zjawisk, których te dane dotyczą. 2013 SAP AG. All rights reserved. Confidential 3

Zastosowania inżynierskie W zastosowaniach inżynierskich dla poznania zjawiska lub potwierdzenia teorii posługujemy się eksperymentem. Inżynierowi potrzebny jest wtedy zestaw narzędzi oraz metod, które umożliwią mu pozyskiwanie zbiorów danych oraz operowanie na nich, w celu sformułowania odpowiednich wniosków. 2013 SAP AG. All rights reserved. Confidential 4

Metody analiz danych. analiza wariancji analiza korelacji analiza regresji analiza czynnikowa analiza dyskryminacyjna analiza szeregów czasowych 2013 SAP AG. All rights reserved. Confidential 5

Statystyka stosowana Biometria Demografia Ekonometria Fizyka statystyczna Termodynamika statystyczna Teoria eksperymentu 2013 SAP AG. All rights reserved. Confidential 6

PODSTAWOWE POJĘCIA STATYSTYCZNE Zbiorowość (populacja) statystyczna. 1. Są to zbiory dowolnych elementów materialnych lub zjawisk podobnych pod względem określonych właściwości. 2. Jeżeli przedmiotem badania są wszystkie jednostki zbiorowości to zbiorowość nazywamy zbiorowością generalną. 2013 SAP AG. All rights reserved. Confidential 7

Jednostki statystyczne Elementy składowe zbiorowości to jednostki statystyczne lub jednostki badania. Zbiorowości statystyczne powinny być ściśle określone pod względem: 1. rzeczowym, kto lub co jest przedmiotem badania, 2. przestrzennym, lokalizacja zbiorowości, 3. czasowym, jakiego momentu lub okresu dotyczą badania 2013 SAP AG. All rights reserved. Confidential 8

Próba losowa Podzbiór populacji generalnej obejmujący część jej elementów wybranych (wylosowanych) wg określonego schematu nosi nazwę zbiorowości próbnej (próby). Jeżeli pobrana w sposób losowy próba jest dostatecznie liczna to jest to próba reprezentatywna. 2013 SAP AG. All rights reserved. Confidential 9

Cechy statystyczne. Badaniu statystycznemu podlegają właściwości jednostek statystycznych zwane cechami. Biorąc pod uwagę liczbę cech poddanych badaniu zbiorowości statystyczne dzielimy na jedno- i wielowymiarowe. 2013 SAP AG. All rights reserved. Confidential 10

Przykłady cech statystycznych A. Zbiorowość tej sali różni się pod względem płci, wzrostu, koloru oczu, miejsc zamieszkania, średniej za ostatni semestr. B. Zbiorowość stężeń ścieków dopływających do oczyszczalni różni się pod względem natężenia dopływy, BZT5, CHZT, mętności, ładunku zanieczyszczeń, stężenia metali ciężkich. 2013 SAP AG. All rights reserved. Confidential 11

Statystyka opisowa. Problemami: 1. zorganizowania badań statystycznych, 2. opracowania i prezentacji materiału statystycznego oraz 3. sumarycznym opisem danych statystycznych zajmuje się statystyka opisowa. 2013 SAP AG. All rights reserved. Confidential 12

Pozyskiwanie danych a) Badanie statystyczne (proces) b) Obserwacja statystyczna (pomiar, zliczenie) c) Zbiór (skończony lub nie) d) Elementy zbioru (materialne lub nie) e) Cechy (właściwości mierzalne lub nie) f) Badania (pełne lub częściowe) g) Losowy dobór prób 2013 SAP AG. All rights reserved. Confidential 13

Opracowanie materiału statystycznego Obejmuje czynność grupowania i zliczania. Pogrupowany lub zliczony materiał statystyczny jest prezentowany w postaci: 1. szeregów, 2. tablic lub 3. wykresów statystycznych. 2013 SAP AG. All rights reserved. Confidential 14

SZEREGI STATYSTYCZNE SZEREGI STATYSTYCZNE Szczegółowe Rozdzielcze Przestrzenne Czasowe cech mierzalnych cech niemierzalnych momentów okresów punktowe przedziałowe 2013 SAP AG. All rights reserved. Confidential 15

Szeregi szczegółowe Szczegółowe (wyliczające) przy niewielkiej liczbie jednostek uporządkowany ciąg wartości badanej cechy tworzy szereg szczegółowy. Np. x 1 >=x 2 >=x 3 >=.>=x n. 2013 SAP AG. All rights reserved. Confidential 16

Szeregi rozdzielcze 1 Zbiór wartości liczbowych uporządkowanych wg wariantów badanej cechy, przy czym poszczególnym wariantom przyporządkowuje się odpowiadające im liczebności. Budując szeregi dla cechy skokowej (dyskretnej) warianty możemy podać punktowo (np. liczba awarii na rurociągu) lub przedziałowo. 2013 SAP AG. All rights reserved. Confidential 17

Szeregi rozdzielcze 2 Dla cech ciągłych buduje się szeregi rozdzielcze przedziałowe (zużycie wody na mieszkańca). Zestawienie wyników w postaci szeregu rozdzielczego nazywamy rozkładem empirycznym. 2013 SAP AG. All rights reserved. Confidential 18

Liczba przedziałów Liczba przedziałów (klas) w szeregu zależna jest od obszaru zmienności cechy, od liczebności zbiorowości i od celu badania. W praktyce proponuje się, aby liczba klas mieściła się w granicach 5-30. 2013 SAP AG. All rights reserved. Confidential 19

Rozpiętość przedziału Rozpiętość przedziału (interwał) i = (x max -x min )/k. Interwały klasowe powinny być jednakowe. 2013 SAP AG. All rights reserved. Confidential 20

Wskaźniki struktury W szeregach rozdzielczych dla określenia rozkładu, czyli struktury badanej zbiorowości, stosuje się obok liczebności bezwzględnych, wskaźniki struktury zwane częstością, liczebnością względną lub frakcją). w i = n i /N, 0<=w i <=1 S w i =1; S n i =N. 2013 SAP AG. All rights reserved. Confidential 21

Przykład 1 W ciągu roku na 20 wybranych rurociągach wystąpiła następująca liczba awarii: 0,3,1,1,2,2,0,0,3,5,0,1,2,2,1,1,0,1,1,1 2013 SAP AG. All rights reserved. Confidential 22

Przykład 1 Zbiorowością jest tu 20 wybranych rurociągów, a badaną cechą liczba awarii w ciągu roku. Cecha ta może przyjmować następujące wartości (warianty): 0,1,2,3,4,5. Cecha tego typu (przyjmująca wartości ze zbioru przeliczalnego) jest cechą dyskretną (skokową). 2013 SAP AG. All rights reserved. Confidential 23

Przykład 1. Szereg rozdzielczy Liczba awarii Liczba rur Częstość 0 5 0,25 1 8 0,4 2 4 0,2 3 2 0,1 4 0 0 5 1 0,05 2013 SAP AG. All rights reserved. Confidential 24

Przykład 1. Szereg skumulowany Liczba awarii Liczba skumulowana rur Częstość skumulow ana 0 5 0,25 1 13 0,65 2 17 0,85 3 19 0,95 4 19 0,95 5 20 1 2013 SAP AG. All rights reserved. Confidential 25

Przykład 2. Badając wskaźnik zużycia wody na mieszkańca na dobę przebadano 1393 gospodarstwa domowe. Zarejestrowano zmienność zużycia w granicach od 10 do 70 l/mk/dobę. Wyniki zestawiono w postaci szeregów rozdzielczych. 2013 SAP AG. All rights reserved. Confidential 26

Przykład 2. Szereg rozdzielczy ciągły. Zużycie Liczba Wskaźnik wody gospodarstw struktury 10-20 204 14,64 20-30 264 18,95 30-40 356 25,56 40-50 320 22,97 50-60 201 14,43 60-70 48 3,45 2013 SAP AG. All rights reserved. Confidential 27

Przykład 2. Szereg rozdzielczy ciągły skumulowany. Zużycie Liczba Wskaźnik wody gospodarstw struktury 10-20 204 14,64 20-30 468 33,60 30-40 824 59,15 40-50 1144 82,12 50-60 1345 96,55 60-70 1393 100,00 2013 SAP AG. All rights reserved. Confidential 28

Dystrybuanta empiryczna Przyporządkowanie kolejnym wartościom cechy statystycznej odpowiadających im częstości skumulowanych (zsumowanych) nazywamy dystrybuantą empiryczną. 2013 SAP AG. All rights reserved. Confidential 29

GRAFICZNA PREZENTACJA ROZKŁADU EMPIRYCZNEGO Do prezentacji materiału statystycznego wykorzystywane są również wykresy statystyczne. Rodzaje wykresów : 1. histogramów (wykresów słupkowych), 2. diagramów (wieloboków liczebności), 3. krzywych liczebności (częstości). 2013 SAP AG. All rights reserved. Confidential 30

Wykresy statystyczne Jeśli przy sporządzaniu wykresów korzysta się z układu współrzędnych to: 1. na osi odciętych x odkłada się zazwyczaj wartości cechy, 2. a na osi rzędnych y liczebności występowania wariantów cech lub ich częstości. 2013 SAP AG. All rights reserved. Confidential 31

Liczba przewodów Histogram 1 Histogram rozkładu awarii 9 8 Empiryczny rozkład liczby awarii na przewodzie 8 7 6 5 4 5 4 3 2 1 0 2 1 0 0 1 2 3 4 5 Liczba awarii na przewodzie 2013 SAP AG. All rights reserved. Confidential 32

F Histogram 2 1,2 Dystrybuanta empiryczna liczby awarii na przewodzie 1 0,95 0,95 1 0,85 0,8 0,65 0,6 0,4 0,25 0,2 0 0 1 2 3 4 5 Liczba awarii na przewodzie 2013 SAP AG. All rights reserved. Confidential 33

Liczba gospodarstw Histogram 3 Histogram z równymi przedziałami 400 350 300 250 200 150 100 50 0 356 320 264 204 201 48 10-20 20-30 30-40 40-50 50-60 60-70 Klasy zużycia wody Series1 2013 SAP AG. All rights reserved. Confidential 34

Wielobok liczebności Wielobok liczebności Liczba gospodarstw 400 350 300 250 200 150 100 50 0 356 320 264 204 201 48 15 25 35 45 55 65 Series1 Zużycie wody 2013 SAP AG. All rights reserved. Confidential 35

Krzywa liczebności Krzywa liczebności Liczba gospodarstw 400 350 300 250 200 150 100 50 0 356 320 264 204 201 48 0 20 40 60 80 Series1 Zużycie wody 2013 SAP AG. All rights reserved. Confidential 36

Szeregi zużycia wody 10-20 204 14,64 10 10-20 204 14,64 10 20-30 264 18,95 10 20-30 264 18,95 10 30-40 356 25,56 10 30-40 356 25,56 10 40-50 320 22,97 10 40-50 320 22,97 10 50-60 201 14,43 10 50-70 249 17,88 20 60-70 48 3,45 10 2013 SAP AG. All rights reserved. Confidential 37

Histogram 4 Histogram przy nierównych przedziałach Liczba gospodarstw 400 350 300 250 200 150 100 50 0 356 320 264 249 204 10-20 20-30 30-40 40-50 50-70 Series1 Klasy zużycia wody 2013 SAP AG. All rights reserved. Confidential 38

Standaryzacja wykresu Rozpiętość Standary zacja n i w i % i n i /i w i /i Pole 10-20 204 14,64 10 20,40 0,0146 0,1464 20-30 264 18,95 10 26,40 0,0190 0,1895 30-40 356 25,56 10 35,60 0,0256 0,2556 40-50 320 22,97 10 32,00 0,0230 0,2297 50-70 249 17,88 20 12,45 0,0089 0,1788 1393 100,00 1,0000 2013 SAP AG. All rights reserved. Confidential 39

Liczba gospodarstw Histogram standaryzowany 0,0300 0,0250 0,0256 0,0230 0,0200 0,0190 0,0150 0,0146 Series5 0,0100 0,0089 0,0050 0,0000 10-20 20-30 30-40 40-50 50-70 400 350 300 250 200 150 204 264 356 320 249 Series1 100 50 0 10-20 20-30 30-40 40-50 50-70 2013 SAP AG. All rights reserved. Confidential 40

Charakterystyki rozkładu cechy Do opisu rozkładu badanej cechy wykorzystuje się: A. miary położenia, B. miary zróżnicowania (zmienności, rozproszenia, dyspersji), C. miary asymetrii (skośności), D. miary koncentracji (w analizach ekonomicznych). 2013 SAP AG. All rights reserved. Confidential 41

MIARY POŁOŻENIA A. Średnia: 1. Arytmetyczna 2. Średnia ważona B. Dominanta C. Kwantyle: 1. Mediana 2. Decyle 3. Centyle 2013 SAP AG. All rights reserved. Confidential 42

Średnia arytmetyczna Najbardziej znaną miarą położenia jest średnia arytmetyczna. gdzie: n- liczba obserwacji, x i - indywidualne obserwacje (warianty cechy). 2013 SAP AG. All rights reserved. Confidential 43

Średnia ważona 1 Przy wyznaczaniu średniej w rozkładzie empirycznym cechy ciągłej dysponujemy szeregiem rozdzielczym i nie mamy informacji o konkretnych wartościach cechy, lecz jedynie o przedziałach jej wartości (np. zużycie wody oddo). W tej sytuacji średnią wyznacza się w sposób przybliżony wychodząc z założenia, że średnia wartość cechy w każdym z przedziałów jest równa środkowi przedziału. 2013 SAP AG. All rights reserved. Confidential 44

Średnia ważona 2 Liczona jest ze wzoru: x 1 n k i1 * xi ni lub, gdy warianty zmiennej opisane są częstotliwością (wskaźnikiem struktury), to obliczamy wówczas średnią ważoną wzorem: x k i1 * xi wi 2013 SAP AG. All rights reserved. Confidential 45

x Własności średniej 1 1. x min <x< x max, 2. Suma odchyleń poszczególnych wartości zmiennej od średniej arytmetycznej jest równa zeru, czyli: n i1 k i1 k i1 ( xi x) ( x ( xˆ i x) i ni x) n i 0 0 0 dla szeregu wyliczającego, dla szeregu rozdzielczego dyskretnego, dla szeregu rozdzielczego przedziałowego, 2013 SAP AG. All rights reserved. Confidential 46

Własności średniej 2 3. Średnia arytmetyczna sumy (różnicy) zmiennych równa się sumie (różnicy) ich średnich arytmetycznych, 4. Jeżeli wszystkie wartości zmiennej powiększymy (pomniejszymy, pomnożymy, podzielimy) o pewną stałą, to średnia arytmetyczna będzie równa sumie (różnicy, iloczynowi, ilorazowi) średniej arytmetycznej wyjściowych zmiennych i tej stałej, 2013 SAP AG. All rights reserved. Confidential 47

Średnia harmoniczna Średnią harmoniczną n liczb x 1,x 2,...,x n (w jednostkach względnych np.: km/h) nazywamy liczbę H, gdzie n i to wagi H = 1 x1 n 1... x2 1 xn H = n1 n1 x1 n n 2 2 x2... nn nn... xn 2013 SAP AG. All rights reserved. Confidential 48

Średnia geometryczna Średnią geometryczną n dodatnich liczb x 1,x 2,...,x n nazywamy liczbę n G x1* x2 *...* xn 2013 SAP AG. All rights reserved. Confidential 49

Dominanta Dominanta (modalna, wartość najczęstsza) jest to taka wartość cechy, która w danym rozkładzie empirycznym występuje najczęściej. W szeregach rozdzielczych przedziałowych bezpośrednio można określić tylko przedział, w którym występuje dominanta (jest to przedział o największej liczebności). 2013 SAP AG. All rights reserved. Confidential 50

Dominanta x od dolna granica klasy, w której znajduje się dominanta, n d liczebność przedziału dominanty, n d-1 liczebność przedziału poprzedzającego przedział dominanty, n d+1 liczebność przedziału następującego po przedziale dominanty, h d rozpiętość przedziału dominanty, 2013 SAP AG. All rights reserved. Confidential 51

Graficzna metoda wyznaczania dominanty Graficzna metoda wyznaczania dominanty sprowadza się do wykreślenia histogramu liczebności z trzech przedziałów klasowych. 2013 SAP AG. All rights reserved. Confidential 52

Warunki wyznaczania dominanty Wyznaczanie dominanty jest uzasadnione wówczas, gdy szereg spełnia następujące warunki: 1. rozkład posiada jeden ośrodek dominujący (jednomodalny), 2. asymetria rozkładu jest umiarkowana, 3. przedział klasowy zawierający dominantę i przedziały sąsiednie posiadają jednakowe rozpiętości. 2013 SAP AG. All rights reserved. Confidential 53

Kwantyle Każdy kwantyl dzieli dzieli zbiorowość uporządkowaną na dwie części pod względem liczebności. Wyróżniamy: Kwartyle: 1 2 3 Decyle, Centyle. 2013 SAP AG. All rights reserved. Confidential 54

Mediana Medianą rozkładu empirycznego M e nazywamy taką wartość cechy w szeregu uporządkowanym, która dzieli ogólną liczbę jednostek zbiorowości na połowy. M e = x (N+1)/2, gdy N jest nieparzyste (x N/2 + x (N/2+1) )/2, gdy N jest parzyste 2013 SAP AG. All rights reserved. Confidential 55

Wyznaczanie mediany Do wyznaczenia mediany można użyć szeregu skumulowanego lub dystrybuanty empirycznej. Mianowicie, medianę można określić jako taką pierwszą wartość cechy, dla której zachodzi n(x)>=n/2, czyli skumulowana liczebność rozkładu osiąga wartość n/2 lub F(Me)>=1/2, czyli dystrybuanta empiryczna przyjmuje wartość ½. 2013 SAP AG. All rights reserved. Confidential 56

Mediana cechy ciągłej W przypadku cechy ciągłej niezbędna jest interpolacja do wyznaczenia wartości mediany : x om - dolna granica przedziału, w którym znajduje się wartość mediany, n(x om ) liczebność skumulowana dla dolnej granicy przedziału mediany, h m /n m rozpiętość i liczebność przedziału mediany, n liczebność całkowita. 2013 SAP AG. All rights reserved. Confidential 57

Miary zróżnicowania Zróżnicowanie (dyspersja) wartości cechy w zbiorze jest następną ważną charakterystyką rozkładu. Miarami klasycznymi są : A. Wariancja B. Odchylenie standardowe 2013 SAP AG. All rights reserved. Confidential 58

2013 SAP AG. All rights reserved. 59 Confidential Wariancja Wariancją dla zbioru danych nazywamy wyrażenia : j k j j n x x n s 2 1 2 ) ( 1 j k j j n x x n s 2 1 2 ) ( ˆ 1

Własności wariancji Wariancja jest różnicą pomiędzy średnią arytmetyczną kwadratów wartości cechy i kwadratem średniej arytmetycznej tej cechy. s 2 1 n n i1 x 2 i x 2 2013 SAP AG. All rights reserved. Confidential 60

Równość wariancyjna Jeżeli zbiorowość podzielimy na k grup, to wariancja dla całej zbiorowości będzie sumą dwóch składników: s 2 1 n k i1 s A. średniej arytmetycznej z wariancji obliczonych dla populacji cząstkowych (wariancji wewnątrzgrupowej) oraz 2 i B. wariancji średnich grupowych (wariancji międzygrupowej) n i 1 n k i1 ( x i x) 2 n i 2013 SAP AG. All rights reserved. Confidential 61

Odchylenie standardowe Wariancja jest wielkością kwadratową. Aby uzyskać miarę zróżnicowania w jednostkach zgodnych z jednostkami badanej cechy należy obliczyć pierwiastek kwadratowy z wariancji. W wyniku pierwiastkowania uzyskamy miarę zwaną odchyleniem standardowym. s = sqr(s 2 ) 2013 SAP AG. All rights reserved. Confidential 62

Przykład 1 Dokonano pomiaru długości rur kanalizacyjnych produkowanych przez producentów A i B. Na podstawie pomiarów rozstrzygnąć, który producent powinien być dostawcą rur. 2013 SAP AG. All rights reserved. Confidential 63

Przykład 2 Wykonano odczyty zużycia wody w trzech kolejnych dniach z różnych liczników. W dniu 1 odczytano 150 liczników otrzymując średnią wartość odczytu = 172 litry z odchyleniem standardowym 7 litrów. W dniu 2 odczytano 100 liczników otrzymując średnią wartość odczytu = 170 litry z odchyleniem standardowym 4 litrów. W dniu 3 odczytano 50 liczników otrzymując średnią wartość odczytu = 168 litry z odchyleniem standardowym 8 litrów. Należy przy wykorzystaniu równości wariancyjnej zbadać zróżnicowanie wskazań liczników we wszystkich 3 dniach łącznie. 2013 SAP AG. All rights reserved. Confidential 64

Standaryzacja zmiennych Cechy mogą być przekształcone, z użyciem średniej arytmetycznej i odchylenia standardowego do postaci standardowej. Niech x będzie obserwacją należącą do zbioru danych o średniej x i odchyleniu standardowym s. Wartością standaryzowaną odpowiadającą obserwacji x i jest wartość u i otrzymana z przekształcenia u ( x x) / i i s 2013 SAP AG. All rights reserved. Confidential 65

Parametry zmiennych unormowanych Dla każdego zbioru danych x i zbiór odpowiadających im wartości unormowanych u i spełnia warunki u śr = 0 s u = 1 2013 SAP AG. All rights reserved. Confidential 66

Współczynnik zmienności Współczynnik zmienności wyrażony procentowo mówi jaki procent poziomu średniej stanowi odchylenie standardowe. V Współczynnik zmienności jest stosowany najczęściej przy porównywaniu zróżnicowania cechy w dwóch różnych rozkładach. V>20% świadczy o dużym zróżnicowaniu zbiorowości pod względem badanej cechy. s x 2013 SAP AG. All rights reserved. Confidential 67

MIARY ASYMETRII Z punktu widzenia potrzeb analizy statystycznej istotny jest nie tylko przeciętny poziom i wewnętrzne zróżnicowanie zbiorowości, ale również fakt, czy przeważająca liczba jednostek znajduje się powyżej czy poniżej przeciętnego poziomu badanej cechy. Problem ten wiąże się z oceną asymetrii rozkładu. 2013 SAP AG. All rights reserved. Confidential 68

Asymetria rozkładu Asymetrię rozkładu określamy na drodze porównywania dominanty, mediany i średniej arytmetycznej. W rozkładach symetrycznych wszystkie miary położenia (x śr, D, Me) są sobie równe. x śr > Me > D, to rozkład charakteryzuje się asymetrią prawostronną, x śr < Me < D, to rozkład charakteryzuje się asymetrią lewostronną. 2013 SAP AG. All rights reserved. Confidential 69

Miary asymetrii 1 Najprostszą miarą asymetrii jest wskaźnik skośności określony wzorem: Ws = x śr D. W przypadku asymetrii lewostronnej wskaźnik skośności jest ujemny, a prawostronnej dodatni. Określa on kierunek asymetrii. 2013 SAP AG. All rights reserved. Confidential 70

Miary asymetrii 2 Miarą określającą zarówno kierunek jak i siłę asymetrii jest współczynnik asymetrii. As = (x śr D)/s 2013 SAP AG. All rights reserved. Confidential 71

Miary asymetrii 3 Współczynnik asymetrii można również obliczyć jako iloraz momentu centralnego 3 rzędu i sześcianu odchylenia standardowego. As = m 3 /s 3 2013 SAP AG. All rights reserved. Confidential 72

2013 SAP AG. All rights reserved. 73 Confidential Momenty centralne Moment centralny l-tego rzędu jest średnią arytmetyczną l-tych potęg odchyleń zmiennych od wartości średniej l n i i l x x n m ) ( 1 1 i l k i i l n x x n m ) ( 1 1 i l k i i l n x x n m ) ( ˆ 1 1

Miara koncentracji Współczynnik koncentracji można obliczyć jako iloraz momentu centralnego 4 rzędu i potęgi 4 odchylenia standardowego. K = m 4 /s 4 2013 SAP AG. All rights reserved. Confidential 74

Przykład Przykład pokazujący wykorzystanie momentów do opisu różnic w rozkładach cech.. Liczebność Szereg 1 Szereg 2 Szereg 3 Szereg 4 Środki klas 1 0 2 0 2 2 6 2 2 4 3 12 10 20 10 4 14 22 12 12 5 12 10 10 20 6 6 2 4 2 7 0 2 2 0 50 50 50 50 2013 SAP AG. All rights reserved. Confidential 75

Andrzej Pawlak Politechnika Wrocławska pok. 236e-D2 Plac Grunwaldzki 9 53-333 Wrocław M +48 608 621 583 mailto:andrzej.pawlak@pwr.wroc.pl