STATYSTYKA OPISOWA. Dr Alina Gleska. 28 września Instytut Matematyki WE PP

Podobne dokumenty
Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Opisowa analiza struktury zjawisk statystycznych

Statystyka. Opisowa analiza zjawisk masowych

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Analiza struktury i przeciętnego poziomu cechy

1 Podstawy rachunku prawdopodobieństwa

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Miary statystyczne w badaniach pedagogicznych

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Próba własności i parametry

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Parametry statystyczne

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Pozyskiwanie wiedzy z danych

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

W1. Wprowadzenie. Statystyka opisowa

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Statystyka Matematyczna Anna Janicka

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Miary koncentracji STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyczne metody analizy danych

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Wykład 5: Statystyki opisowe (część 2)

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Wykład 4: Statystyki opisowe (część 1)

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Matematyka stosowana i metody numeryczne

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

4.2. Statystyczne opracowanie zebranego materiału

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Biostatystyka, # 1 /Weterynaria I/

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Analiza zróżnicowania, asymetrii i koncentracji

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

Zmienne losowe. Statystyka w 3

Zakład Ubezpieczeń Społecznych Departament Statystyki. Struktura wysokości emerytur i rent wypłacanych przez ZUS po waloryzacji w marcu 2010 roku.

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Xi B ni B

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Statystyka. Wykład 6. Magdalena Alama-Bućko. 9 kwietnia Magdalena Alama-Bućko Statystyka 9 kwietnia / 36

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Statystyka. Wykład 1. Magdalena Alama-Bućko. 26 lutego Magdalena Alama-Bućko Statystyka 26 lutego / 34

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Statystyka matematyczna i ekonometria

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Laboratorium 3 - statystyka opisowa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Analiza dynamiki zjawisk STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018

Graficzna prezentacja danych statystycznych

Zawartość. Zawartość

Analiza statystyczna w naukach przyrodniczych

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

Statystyka opisowa- cd.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Estymacja punktowa i przedziałowa

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Statystyka opisowa. Robert Pietrzykowski.

Transkrypt:

STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 28 września 2018

1 2

Wyróżniamy następujace miary statystyczne: POŁOŻENIA, które służa do określenia takiej wartości cechy, wokół której skupiaja się wszystkie pozostałe wartości tej cechy; ZMIENNOŚCI (ROZPROSZENIA, DYSPERSJI), które określaja stopień zróżnicowania wartości badanej cechy; ASYMETRII (SKOŚNOŚCI), które sa wykorzystywane do badania kierunku i stopnia nierównomierności rozmieszczenia jednostek zbiorowości ze względu na wartości badanej cechy na całym obszarze jej zmienności; KONCENTRACJI (KURTOZY), które określaja stopień nierównomierności rozłożenia ogólnej sumy wartości cechy pomiędzy poszczególne jednostki zbiorowości lub ukazuja stopień skupienia poszczególnych jednostek wokół średniej;

PODOBIEŃSTWA I ZRÓŻNICOWANIA STRUKTUR, które sa używane w analizach przestrzennych lub dynamicznych do badania stopnia zgodności lub odmienności dwóch struktur rozumianych jako udziały poszczególnych składników struktury (grup jednostek) w badanej całości; LOKALIZACJI, służace do określania stopnia podobieństwa rozkładu dwóch różnych cech w układzie jednostek przestrzennych. Wymienione statystyki opisowe pozwalaja w sposób syntetyczny określić właściwości badanych rozkładów empirycznych i dokonać ich porównania. W szczególności można wyróżnić dwa typy porównań: porównanie rozkładów dla różnych zbiorowości względem tej samej cechy, porównanie rozkładów dla różnych cech dotycz acych jednej zbiorowości.

Wyróżniamy dwa podstawowe rodzaje miar położenia: KLASYCZNE i POZYCYJNE. Klasyczne miary położenia oblicza się na podstawie wszystkich wartości cechy i zaliczamy do nich: średnia arytmetyczna, średnia harmoniczna i średnia geometryczna. Pozycyjne miary położenia otrzymuje się w wyniku uznania wartości cechy dla pewnej jednostki za wyróżniona z punktu widzenia pozycji tej jednostki, jaka zajmuje ona w uporzadkowanym szeregu statystycznym. Do pozycyjnych miar położenia zaliczamy dominantę (zwana też moda) oraz kwantyle, spośród których wyróżniamy: kwartyl pierwszy, medianę (czyli kwartyl drugi), kwartyl trzeci, decyle i centyle.

ŚREDNIA ARYTMETYCZNA - suma wartości cechy mierzalnej podzielona przez liczbę jednostek skończonej zbiorowości statystycznej lub próby. Rozróżniamy różne postacie średniej arytmetycznej: (I) średnia prosta, która oblicza się z wartości cechy przedstawionej w postaci szeregu szczegółowego: x = 1 n n i=1 gdzie x i jest wartościa cechy w i-tej jednostce, a n - liczebnościa próby, x i,

(II) średnia ważona, która wyznacza się z wartości cechy pogrupowanych w szeregach rozdzielczych punktowych i przedziałowych: przy czym x = 1 n k i=1 x i n i, a) dla szeregu rozdzielczego punktowego x i jest i-ta wartościa cechy skokowej o liczebności n i, która przyjmuje k wartości,

b) dla szeregu rozdzielczego przedziałowego x i jest środkiem i-tego przedziału klasowego (często oznaczanym jako xi 0 ) o liczebności n i, a k oznacza liczbę przedziałów klasowych. Zauważmy, że jeżeli nie znamy liczebności klas, a jedynie wskaźniki struktury tych klas, czyli ich udziały procentowe, to stosujemy wzory dla szeregów punktowych: x = k x i ω i lub x = i=1 k i=1 x i p i 100, dla szeregów przedziałowych: x = k xi 0 ω i lub x = i=1 k i=1 xi 0 p i 100.

ŚREDNIA ARYTMETYCZNA ma następujace właściwości: suma wartości cechy jest równa iloczynowi średniej arytmetycznej i liczebności zbiorowości lub próby: n i=1 x i = nx, suma odchyleń poszczególnych wartości od ich średniej równa się zeru: n (x i x) = 0, i=1 suma kwadratów odchyleń poszczególnych wartości od ich średniej jest minimalna: n i=1 (x i x) 2 = min.

UWAGI : szereg przedziałowy pozwala tylko na obliczenie przybliżonej wartości średniej, ponieważ cały przedział klasowy reprezentowany jest tylko jedna liczba - środkiem przedziału, a przecież obserwacje w danym przedziale nie musza być rozłożone równomiernie, środek przedziału NIE JEST średnia wartościa cechy - różnice między tymi wartościami moga być znaczne, tym większe, im bardziej nierównomiernie rozłożone sa obserwacje,

średnia arytmetyczna oblicza się w zasadzie dla szeregów o domkniętych przedziałach klasowych, lecz jeśli liczebność w otwartym przedziale klasowym stanowi niewielki odsetek badanej zbiorowości (do 5 %), to możliwe jest domknięcie tych przedziałów, a więc i obliczenie średniej. NIE WOLNO obliczać średniej w szeregach przedziałowych, w których jednostki sa skupione w przedziałach skrajnych, a one sa nieograniczone, średnia arytmetyczna jest wrażliwa na skrajne wartości cechy, tzw. obserwacje odstajace. Jeśli one występuja, to średnia nie odzwierciedla prawidłowo przeciętnego poziomu zjawiska i w takich sytuacjach należy stosować medianę.

(III) średnia ważona jako tzw. średnia ze średnich x = 1 n k i=1 x i n i, gdzie x to średnia arytmetyczna całej zbiorowości (tj. wszystkich grup łacznie), x i to średnia arytmetyczna i-tej grupy, n i to liczebność i-tej grupy, a k to liczba grup, na jakie podzielono cała zbiorowość; (IV) średnia dla wielkości stosunkowych, nazywanych wskaźnikami natężenia (prędkość pojazdu, gęstość zaludnienia, plony, ceny, wydajność pracy itp.). Obliczamy ja ze wzoru: x = 1 n k i=1 x i n i, przy czym wagami n i będa te wielkości, których jednostki miary sa w mianowniku.

PRZYKŁAD: spróbujemy obliczyć średnia gęstość zaludnienia dla dwóch regionów: Region X Region Y gęstość zal. 650 osób na km2 gęstość zal. 80 osób na km2 pow. 3800 km2 pow. 10500 km2 x = 650 3800 + 80 10500 3800 + 10500 = 2470000 + 840000 14300 = 3310000 14300 231.5

PODSUMOWUJAC: średnia arytmetyczna jest miara odpowiednia dla oceny przeciętnego poziomu cechy w sytuacjach, gdy: a) zbiorowość jest jednorodna, czyli nie występuja wartości skrajne, znacznie różniace się od pozostałych, a rozkład jest symetryczny albo umiarkowanie asymetryczny (tzn. zbliżony do symetrycznego), b) rozkład jest jednomodalny (ma jedno wyraźnie zaznaczone maksimum), średnia arytmetyczna nie znajduje zastosowania w przypadku, gdy: a) występuje bardzo silna asymetria, b) rozkład jest dwumodalny lub wielomodalny, c) rozkład jest siodłowy (w kształcie litery U - wówczas bowiem średnia arytmetyczna odpowiada takiej wartości cechy, wokół której skupia się stosunkowo najmniejsza część zbiorowości, podczas gdy my oczekujemy, aby średnia obrazowała taka wartość, która można uznać za typowa, czyli taka, wokół której skupia się duża część jednostek).

ŚREDNIA GEOMETRYCZNA jest miara klasyczna, wykorzystywana jednak w zagadnieniach szczególnych, jak np. analiza szeregów czasowych. Jeśli poszczególne wartości cechy oznaczymy jako: x 1,x 2,...,x n, a średnia geometryczna przez x g, to wyrażamy ja wzorem: x g = n x 1 x 2...x n. Za pomoc a średniej geometrycznej oblicza się średnie tempo zmian zjawisk w czasie.

ŚREDNIA HARMONICZNA - stosuje się ja wówczas, kiedy wartości cechy podane sa w jednostkach stosunkowych (tzw. łamanych), czyli jeśli cecha wyrażona jest w przeliczeniu na jednostkę innej cechy, np. gęstość zaludnienia (wyrażona jako liczba osób na km 2 ), dochód na osobę (wyrażony w zł na 1 osobę), cena (w zł za 1 kg lub w zł za 1 szt), prędkość (w km na godzinę). Średnia harmoniczna oblicza się według wzoru: x H = n. n 1 x i i=1 Miara ta jest stosowana bardzo rzadko. Dla dodatnich wartości cechy zachodza zwiazki między średnimi: x H x g x.

DOMINANTA (inaczej: MODA lub WARTOŚĆ MODALNA) jest najczęściej stosowana pozycyjna miara położenia. Oznaczenia: Mo, Do, D. Jedyna miara położenia, która ma sens w przypadku analizy cech jakościowych. Dominanta jest to taka wartość cechy (lub wariant w przypadku cech jakościowych), która w danej zbiorowości występuje najczęściej (dominuje). UWAGA: dominanta to wartość cechy, a nie jej liczba wystapień!

Przy definiowaniu dominanty należy wprowadzić następujace rozróżnienie: dla cechy skokowej dominanta jest to taka wartość cechy, która w danej zbiorowości występuje najczęściej, dla cechy ciagłej dominanta to taka wartość cechy, wokół której oscyluje (jest zgrupowanych) najwięcej pomiarów. W szeregach rozdzielczych przedziałowych można wskazać przedział, w którym dominanta występuje, zaś jej wartość przybliżona obliczyć za pomoca wzoru interpolacyjnego Do = Mo = x ld + (n s n s 1 ) (n s n s 1 ) + (n s n s+1 ) d, gdzie: s - numer przedziału klasowego o największej liczebności, x ld - dolna granica s-tego przedziału klasowego, d - długość przedziału klasowego, n s - liczebność s-tego przedziału klasowego.

Przy obliczaniu dominanty na podstawie szeregu rozdzielczego przedziałowego należy przestrzegać następujacych zasad praktycznych: wyznaczanie dominanty ma sens wtedy, kiedy rozkład empiryczny jest jednomodalny, czyli kiedy w szeregu występuje jedno wyraźnie zaznaczone maksimum, przedział, w którym występuje dominanta (przedział o największej liczebności) oraz dwa sasiaduj ace z nim przedziały musza mieć takie same rozpiętości; w przeciwnym razie dominanty nie obliczamy, gdyż w szeregach o różnej długości przedziałów klasowych duża liczebność może być spowodowana większa rozpiętościa przedziału w stosunku do innych przedziałów,

obliczanie dominanty jest nieuzasadnione, gdy rozkład empiryczny jest wielomodalny, wartość dominanty nie zmieni się, gdy we wzorze interpolacyjnym zamiast liczebności wprowadzimy częstości. Graficzny sposób wyznaczania dominanty - po sporzadzeniu odpowiedniego histogramu (lub części histogramu dla przedziału dominanty i dwóch przedziałów sasiaduj acych z nim) postępujemy następujaco: z górnych wierzchołków najwyższego prostokata wykreślamy dwa odcinki łacz ace bliższe wierzchołki sasiednich prostokatów, zaznaczamy punkt przecięcia tych odcinków i rzutujemy ten punkt na oś X (oś wartości cechy), rzut ten wskazuje nam wartość dominanty, która odczytujemy na osi X z pewnym przybliżeniem.

MEDIANA (ozn. Me) - tę miarę można wyznaczać dla cech wyrażonych w dowolnej skali z wyjatkiem nominalnej. Mediana jest wartościa cechy, jaka ma jednostka leżaca w środku uporzadkowanego ciagu obserwacji. Z tego względu mediana nazywana jest często WARTOŚCIA ŚRODKOWA. Numer jednostki środkowej nazywa się pozycja mediany. Upraszczajac zagadnienie można powiedzieć, że mediana dzieli zbiorowość statystyczna na dwie równe części w ten sposób, że połowa jednostek zbiorowości przyjmuje wartości mniejsze od mediany, natomiast druga połowa - wartości większe od mediany. W przypadku cech skokowych należałoby stwierdzić, że przynajmniej połowa jednostek przyjmuje wartości MNIEJSZE lub RÓWNE medianie i przynajmniej połowa jednostek przyjmuje wartości WIEKSZE lub RÓWNE medianie.

JAK ZNALEŹĆ MEDIANE? Schemat postępowania w przypadku szeregu szczegółowego A) Przypadek nieparzystej liczby obserwacji. 1) Porzadkujemy wartości cechy (od najmniejszej do największej lub odwrotnie). 2) Wyznaczamy pozycję mediany według wzoru poz(me) = n + 1 2, gdzie n oznacza liczbę obserwacji (czyli liczebność zbiorowości), 3) Odczytujemy z szeregu, jaka wartość cechy ma jednostka na wyznaczonej przez nas pozycji. Ta wartość jest mediana. Me = x n+1 2

B) Przypadek parzystej liczby obserwacji. 1) Porzadkujemy wartości cechy (od najmniejszej do największej lub odwrotnie). 2) Wyznaczamy pozycję mediany, która w przypadku, gdy n jest parzyste znajduje się między dwiema środkowymi obserwacjami. Oznaczmy te obserwacje L1 i L2. Ich pozycje określimy według następujacych wzorów: poz(l1) = n 2, poz(l2) = n 2 + 1.

3) Odczytujemy z szeregu wartości L1 i L2, a następnie obliczamy wartość mediany jako średnia arytmetyczna wskazanych liczb, czyli: Me = L1 + L2. 2 Tak więc w przypadku parzystej liczby obserwacji mediana jest średnia arytmetyczna dwóch środkowych wartości cechy. Można to również zapisać tak: Me = x n + x 2 n 2 +1. 2

UWAGA 1: częstym błędem jest mylenie mediany z jej pozycja. Należy pamiętać, że mediana jest wartościa cechy środkowej jednostki, a nie pozycja tej jednostki. UWAGA 2: zaleta mediany jest to, że jest nieczuła na zmianę wartości ekstremalnych (a właśnie wartości ekstremalne uzyskane z pomiaru sa najbardziej niepewne). Mediana, w odróżnieniu od średniej arytmetycznej, nie zmieni się, gdy wartości ekstremalne zmienia się lub znikna. UWAGA 3: w przypadku rozkładów asymetrycznych mediana dobrze informuje o przeciętnym poziomie cechy. Jej wartość, w odróżnieniu od średniej arytmetycznej, będzie zbliżona do większości pomiarów.

UWAGA 4: jak już zostało powiedziane, pole powierzchni pod krzywa liczebności równe jest n, czyli liczebności zbiorowości. Ponieważ mediana dzieli zbiorowość na dwie części o takich samych liczebnościach, więc graficznie medianie odpowiada taka wartość cechy (na osi X), dla której pole powierzchni pod krzywa (liczebności lub częstości) jest podzielone na połowy (rys).

Schemat postępowania w przypadku szeregu punktowego Podobnie jak poprzednio: 1) wyznaczamy numer jednostki środkowej jako n 2 dla szeregów o nieparzystej liczbie obserwacji), (lub n+1 2 2) ustalamy, w której klasie szeregu punktowego znajduje się jednostka środkowa; będzie to ta klasa, w której po raz pierwszy liczebność skumulowana osiagnie lub przekroczy n 2, 3) odczytujemy bezpośrednio z szeregu punktowego wartość cechy w ustalonej klasie. Jest to wartość mediany. Jeżeli zamiast liczebności mamy wskaźniki struktury, to szukamy klasy, w której po raz pierwszy skumulowany wskaźnik struktury przekroczy 0,5.

Schemat postępowania w przypadku szeregu przedziałowego Aby wyznaczyć medianę korzystamy ze wzorów interpolacyjnych: lub lub Me = x lm + Me = x lm + Me = x lm + n 2 nskum m 1 d m n m 0.5 ωskum m 1 ω m d m 50 pskum m 1 p m d m, gdzie Me - mediana, x lm - lewy koniec przedziału mediany, n - liczebność zbiorowości, n m - liczebność przedziału mediany, nm 1 skum - liczebność skumulowana przedziału poprzedzaj acego przedział mediany, d m - długość przedziału mediany.

Graficzny sposób wyznaczania mediany W tym celu należy sporzadzić łamana liczebności skumulowanej (lub łamana częstości skumulowanej), a następnie: 1) na osi Y zaznaczyć punkt określajacy pozycję mediany, czyli n 2 (w przypadku łamanej częstości skumulowanej będzie to punkt 0,5 czyli 50%), 2) na sporzadzonej łamanej znajdujemy punkt odpowiadajacy wyznaczonej pozycji, czyli prowadzimy linię pozioma przecinajac a oś Y w punkcie n 2, 3) punkt znaleziony na łamanej rzutujemy na oś X (oś wartości cechy), 4) rzut ten wskazuje nam wartość mediany, któr a odczytujemy na osi X z pewnym przybliżeniem (rys).

Pomiędzy średnia arytmetyczna, dominanta i mediana istnieje ustalony zwiazek w zależności od typu rozkładu. A) W rozkładzie symetrycznym jednomodalnym (z jednym ekstremum) wszystkie trzy miary: średnia arytmetyczna, mediana i dominanta, sa równe. x = Do = Me. B) W rozkładzie o asymetrii prawostronnej (dodatniej) dominanta przyjmuje wartość najmniejsza, większa od niej jest mediana,a największa jest średnia arytmetyczna. Do < Me < x. C) W rozkładzie o asymetrii lewostronnej (ujemnej) najniższa wartość przyjmuje średnia arytmetyczna, większa od niej jest mediana, a największa dominanta. x < Me < Do.

Obok powyższych zależności między średnia arytmetyczna, mediana i dominanta istnieje zależność zwana równaniem Pearsona: Do = 3Me 2x. Zależność ta jest prawdziwa tylko w przypadku, gdy rozkład badanej cechy jest symetryczny, słabo asymetryczny, ewentualnie umiarkowanie asymetryczny. Na wykładzie o miarach asymetrii rozkładu będzie wyjaśnione, kiedy rozkład jest słabo, umiarkowanie czy silnie asymetryczny.

KWANTYLE sa pozycyjnymi miarami położenia. Sa takimi wartościami cechy, które dziela zbiorowość na określone części pod względem liczby jednostek. Części te pozostaja względem siebie w określonych proporcjach. Najczęściej używanymi kwantylami sa: kwartyle, które dziela zbiorowość na cztery liczebnie równe części (po 25% jednostek każda), decyle, które dziela zbiorowość na dziesięć liczebnie równych części (po 10% jednostek każda), percentyle (inaczej: centyle), które dziela zbiorowość na sto liczebnie równych części (po 1% jednostek każda). Należy podkreślić, że kwantyle, a w szczególności decyle i centyle, stosuje się tylko w przypadku, gdy liczebność zbiorowości jest dostatecznie duża.

KWARTYLE sa takimi wartościami cechy, które dziela uporzadkowany ciag obserwacji na cztery liczebnie równe części zwane grupami kwartylowymi. Podział na cztery części daje nam trzy kwartyle: kwartyl pierwszy Q 1 (tzw. kwartyl dolny) dzieli zbiorowość na dwie części - w pierwszej znajduje się 25% jednostek o wartościach mniejszych od niego, a w drugiej 75% jednostek o wartościach większych od niego, kwartyl drugi to mediana, kwartyl trzeci Q 3 (tzw. kwartyl górny) dzieli zbiorowość na dwie części - w pierwszej znajduje się 75% jednostek o wartościach mniejszych od niego, a w drugiej 25% jednostek o wartościach większych od niego.

W literaturze nie ma zgodności co do sposobu wyznaczania i interpretacji kwartyli. Najczęściej przyjmuje się następujace schematy dla szeregu szczegółowego Q 1 to wartość cechy na pozycji n/4, a Q 3 to wartość cechy na pozycji 3n/4 (jeżeli któraś z tych pozycji przypada między obserwacjami, to bierzemy średnia arytmetyczna tych dwóch sasiednich obserwacji), dla szeregu rozdzielczego punktowego postępujemy podobnie jak w przypadku mediany - określamy klasy, w których liczebność skumulowana po raz pierwszy osiagnie lub przekroczy n/4 i 3n/4, a potem odczytujemy kwartyle, dla szeregu rozdzielczego przedziałowego korzystamy ze wzorów interpolacyjnych:

lub lub Q 1 = x lq1 + Q 1 = x lq1 + Q 1 = x lq1 + n 4 nskum q 1 1 d q1 n q1 0.25 ωskum q 1 1 d q1 ω q1 25 pskum q 1 1 p q1 d q1, gdzie Q 1 - kwartyl dolny, x lq1 - lewy koniec przedziału pierwszego kwartyla, n - liczebność zbiorowości, n q1 - liczebność przedziału pierwszego kwartyla, nq skum 1 1 - liczebność skumulowana przedziału poprzedzajacego przedział pierwszego kwartyla, d q1 - długość przedziału pierwszego kwartyla;

lub lub Q 3 = x lq3 + Q 3 = x lq3 + Q 3 = x lq3 + 3n 4 nskum q 3 1 d q3 n q3 0.75 ωskum q 3 1 d q3 ω q3 75 pskum q 3 1 p q3 d q3, gdzie Q 3 - kwartyl górny, x lq3 - lewy koniec przedziału trzeciego kwartyla, n - liczebność zbiorowości, n q3 - liczebność przedziału trzeciego kwartyla, nq skum 3 1 - liczebność skumulowana przedziału poprzedzajacego przedział trzeciego kwartyla, d q3 - długość przedziału trzeciego kwartyla.

GRAFICZNY sposób wyznaczania kwartyli jest taki sam, jak w przypadku mediany. DECYLE to takie wartości cechy, które dziela uporzadkowany ciag obserwacji na dziesięć liczebnie równych części, po 10% jednostek zbiorowości każda. Podział ten daje dziewięć decyli. Podział decylowy wykorzystywany jest m.in. w badaniach poziomu życia ludności i w analizie wynagrodzeń. CENTYLE (inaczej: percentyle) to wartości cechy uzyskiwane przy podziale zbiorowości na sto liczebnie równych części, po 1% jednostek zbiorowości każda. Podział taki daje 99 centyli. Podział centylowy stosowany jest przy analizie wielu kwestii społecznych, ale jego najbardziej znanym zastosowaniem sa siatki centylowe obrazujace wysokość ciała, masę ciała i obwód głowy dzieci (oddzielnie chłopców i dziewczat).