Przedmiot statystyki. Graficzne przedstawienie danych.

Podobne dokumenty
2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Estymacja parametrów w modelu normalnym

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Laboratorium 3 - statystyka opisowa

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyka Matematyczna Anna Janicka

1 Podstawy rachunku prawdopodobieństwa

Przedmiot statystyki. Graficzne przedstawienie danych.

Wykład 5: Statystyki opisowe (część 2)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyczne metody analizy danych

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka opisowa- cd.

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Pozyskiwanie wiedzy z danych

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Wykład 4: Statystyki opisowe (część 1)

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Xi B ni B

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

3. Podstawowe pojęcia statystyki matematycznej i rachunku prawdopodobieństwa wykład z Populacja i próba

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Dyskretne zmienne losowe

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Wykład 10: Elementy statystyki

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Analiza statystyczna w naukach przyrodniczych

Biostatystyka, # 1 /Weterynaria I/

You created this PDF from an application that is not licensed to print to novapdf printer (

Próba własności i parametry

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Statystyki opisowe i szeregi rozdzielcze

Testowanie hipotez statystycznych.

Nowoczesne techniki matematyczne, statystyczne i informatyczne

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

Laboratorium nr Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby:

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Parametry statystyczne

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Statystyka to nauka o metodach badań (liczbowo wyrażalnych) własności zbiorowości. Próba. Próba Populacja. Próba

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Testowanie hipotez statystycznych.

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Biostatystyka, # 3 /Weterynaria I/

Ekstrema globalne funkcji

Środowisko R wprowadzenie. Wykład R1; Pakiety statystyczne

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

W1. Wprowadzenie. Statystyka opisowa

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Pochodna funkcji: definicja, podstawowe własności wykład 5

Wykład 3. Rozkład normalny

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Wykłady 14 i 15. Zmienne losowe typu ciągłego

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Wykład: 20 godz., ćwiczenia: 20 godz. Zasady zaliczenia: zaliczenie ćwiczeń na ocenę, zaliczenie wykładu - egzamin (pisemne).

Statystyka matematyczna i ekonometria

Funkcje: wielomianowa, wykładnicza, logarytmiczna wykład 2

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Pochodna funkcji: definicja, podstawowe własności wykład 6

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Transkrypt:

Przedmiot statystyki. Graficzne przedstawienie danych. dr Mariusz Grządziel 2 marca 2009 Populacja i próba Populacja- zbiorowość skończona lub nieskończona, w stosunku do której mają być formułowane wnioski. Próba- skończony podzbiór populacji podlegający szczegółowemu badaniu. Rozważane zbiory danych można je interpretować jako próby z pewnych popualcji; w dalszym ciągu-terminy próba i zbiór danych będą używane zamiennie. Wskaźniki sumaryczne Histogram sugestywny środek syntezy informacji zawartej w zbiorze danych; wskaźniki sumaryczne miary liczbowe pozwalające na zwięzły opis zbioru danych lub populacji (zbiorowości), z której ten zbiór danych został wybrany. Wskaźniki: -położenia określają centrum zbioru danych; -rozproszenia określają rozproszenie cechy wokół wskaźnika położenia. Wskaźniki położenia Niech x 1, x 2,..., x n oznacza próbę o liczności n. Definicja 1. Wartościa średnia w próbie, oznaczana x, nazywamy średnia arytmetyczna x = 1 n x i. n Dla danych dotyczacych cen mieszkań w dzielnicy B wartość średnia wynosi: i=1 x = 1 (420 + 350 +... + 299) 290,71 17 Mediana Średnia w próbie sensowna, gdy histogram jest w przybliżeniu symetryczny (tak jak w przypadku histogramu dla danych dotyczących cen mieszkań w dzielnicy B). Przykład. Wynagrodznie pracowników w pewnej firmie: 2400 zł (1 osoba), 2900 zł (9 osób), 3100 zł (6 osób), 3400 zł (5 osób), 4100 zł (4 osoby), 4800 zł (2 osoby), 6000 zł (2 osoby), 6500 zł (1 osoba), 14000 zł (1 osoba). Średnia wynagrodzenie wynosi: 2400+9 2900+6 3100+5 3400+4 41002 4800+2 6000+14000 31 3954,84 Można oczekiwać, że histogram dla tych danych nie będzie symetryczny. 1

histogram dla zbioru danych PENSJE 0 2 4 6 8 10 2000 4000 6000 8000 10000 12000 14000 pensje Rysunek 1: Histogram dla danych PENSJE Mediana c.d. Histogram dla danych PENSJE nie jest symetryczny ma prawy ogon dłuższy niż lewy ogon. Nawiązując do terminologii z książki J. Koronackiego i J. Mielniczuka (Rozdz. 1.2) jest on prawostronnie skośny. Analogicznie określamy lewostronna skośność histogramu. W tym przypadku bardziej sensownym wskaźnikiem położenia będzie tzw. mediana. Mediana definicja Uprządkowane niemalejąco elementy próby x 1, x 2,..., x n oznaczmy przez x (1), x (2),..., x (n 1), x (n), gdzie x (1) x (2)... x (n 1) x (n). Dla danych PENSJE: x (1) = 2400; x (2) = x (3) =... = x (10) = 2900; x (11) = x (12) =... = x (16) = 3100; x (17) = x (18) =... = x (21) = 3400... x (30) = 6500 x (31) = 14000 Definicja 2. Mediana w próbie (lub mediana próby), oznaczna x med nazywamy następujac a wielkość x ((n+1)/2), jeśli n jest nieparzyste, x med = 1 2 (x (n/2) + x (n/2+1) ), jeśli n jest parzyste. Cechą mediany jest odporność na obserwacje odstajace, czyli wartości bardzo wyraźnie odstające od innych obserwacji w próbie. Jeśli w danych PENSJE 14000 zamienić na 140000, wartość mediany się nie zmieni! Inne odporne wskaźniki położenia Średnia ucinana (z parametrem k). Otrzymujemy ją odrzucając k najmniejszych i k największych obserwacji w próbie, a następnie obliczając średnią dla pozostałych elementów próby. Średnia winsorowska z parametrem k. Otrzymujemy ją zastępując k najmiejszych elementów próby elementem x (k+1) a k największych elementem x (n k) i obliczając dla tak zmodyfikowanej próby średnią. 2

Wskaźniki rozproszenia Definicja 3. Rozstępem próby o liczności n, oznaczanym przez R, nazywamy różnicę R = x (n) x (1) gdzie x (1) i x (n) sa, odpowiednio, najmniejszym i największym elementem w próbie. Definicja 4. Wariancję w próbie, oznaczana przez s 2, określamy wzorem s 2 = 1 n 1 n (x i x) 2, i=1 gdzie x oznacza średnia w próbie. Pierwiastek z wariancji nazywamy odchyleniem standardowym w próbie; oznaczamy go przez s. Kwartyle i rozstęp międzykwartylowy Uprządkowane niemalejąco elementy próby x 1, x 2,..., x n oznaczamy przez Niech m = 1 + 0,25 (n 1). x (1), x (2),..., x (n 1), x (n). Definicja 5. Kwartyl dolny Q 1 określamy wzorem x (m), jeśli m jest całkowite, Q 1 = (1 w)x (d) + w x (d+1), jeśli m nie jest całkowite, gdzie d = E(m) (d jest równa części całkowitej z m) a w = m d. Kwartyl górny określamy analogicznie, przyjmując m = 1 + 0,75 (n 1). Definicja 6. Rozstępem międzykwartylowym IQR nazywamy różnicę IQR = Q 3 Q 1. Uwagi o innych definicjach kwartyli W środowisku R kwartyle są obliczane wg. wyżej podanej definicji (jeżeli użyta jest opcja domyślna). W książce [1] kwartyl dolny definowany jest jako mediana dla podpróby składającej się z obserwacji mniejszych niż mediana; analogicznie jest tam definiowany kwartyl górny. Niektórzy autorzy zamiast kwartyli obliczają tzw. zawiasy (ang. hinges). Zawiasy dolny i górny będziemy oznaczać przez, odpowiednio, Q 1 i Q 3. Q 1 jest w przybliżeniu równe Q 1 a Q 3 jest w przybliżeniu równe Q 3 dokładne definicje znajdują się na liście zadań nr 2! 3

Wykres ramkowy Dla danych dotyczących cen mieszkań w osiedlu B mamy: MIN = 198; Q1 = Q 1 = 270; x med = 277; Q 3 = Q 3 = 327; MAX = 420; gdzie M IN i M AX oznaczają, odpowiednio, minimalną i maksymalną obserwację w próbie (zbiorze danych). Wykres ramkowy składa się z ramki -dolna podstawa ramki ma współrzędną y-wą równą Q 1, współrzędna górnej podstawy ramki jest równa Q 3 ; poziomy odcinek wewnątrz ramki odpowiada medianie w próbie. Wykres ramkowy c.d. Określamy ĨQR := Q 3 Q 1. Odcinek wychodzący z górnej podstawy ramki kończy się linią poziomą o współrzednej pionowej równej: MAX, jeśli MAX m 1 = Q 3 + 1,5 ĨQR, MAX0, jeśli MAX > Q 3 + 1,5 ĨQR, gdzie M AX0 oznacza największą onserwację ze zbioru obserwacji mniejszych lub równych Q 3 + 1,5 ĨQR. Jeśli MAX > Q 3 + 1,5 ĨQR, to zaznaczamy na wykresie wszystkie obserwacje większe niż Q 3 + 1,5 ĨQR. Analogicznie, odcinek wychodzący z dolnej podstawy ramki kończy się linią poziomą o współrzednej y-wej równej: MIN, jeśli MIN m 2 = Q 1 1,5 ĨQR, MIN0, jeśli MIN < Q 1 1,5 ĨQR, gdzie M IN 0 oznacza najmniejszą obserwację ze zbioru obserwacji większych lub równych Q 1 1,5 ĨQR. Jeśli MIN < Q 1 1,5 ĨQR, to zaznaczamy na wykresie wszystkie obserwacje mniejsze niż Q 1 1,5 ĨQR. Literatura [1] Koronacki, J., Mielniczuk, J. Statystyka dla studentów kierunków technicznych i przyrodniczych. WNT. Warszawa 2001. 4

200 250 300 350 400 B Rysunek 2: Wykres ramkowy dla danych dotyczących cen mieszkań w B 100 150 200 250 300 350 400 A B Rysunek 3: Wykresy ramkowy dla danych dotyczących cen mieszkań w A i B 5