Opisowe charakterystyki rozkładów cech statystycznych. Descriptive Characteristics of Distributions of Statistical Variables

Podobne dokumenty
Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

Wybrane statystyki nieparametryczne. Selected Nonparametric Statistics

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

W1. Wprowadzenie. Statystyka opisowa

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyczne metody analizy danych

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Wykład 4: Statystyki opisowe (część 1)

TESTY ANOVA JAKO NARZĘDZIE WSPOMAGAJĄCE WERYFIKACJĘ HIPOTEZ STATYSTYCZNYCH ANOVA TESTS AS A TOOL TO ASSIST IN VERIFYING STATISTICAL HYPOTHESIS

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Pozyskiwanie wiedzy z danych

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

You created this PDF from an application that is not licensed to print to novapdf printer (

Wykład 5: Statystyki opisowe (część 2)

Próba własności i parametry

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Statystyka matematyczna i ekonometria

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Statystyka Matematyczna Anna Janicka

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

1 Podstawy rachunku prawdopodobieństwa

Statystyka. Opisowa analiza zjawisk masowych

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Statystyka opisowa SYLABUS A. Informacje ogólne

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Transport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Studia stacjonarne (stacjonarne / niestacjonarne)

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

Statystyka opisowa. Robert Pietrzykowski.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

laboratoria 24 zaliczenie z oceną

PRZEWODNIK PO PRZEDMIOCIE. Statystyka opisowa. Zarządzanie. niestacjonarne. I stopnia. dr Agnieszka Strzelecka. ogólnoakademicki.

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Biostatystyka, # 1 /Weterynaria I/

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

ĆWICZENIE 1 Statystyka opisowa. Testowanie zgodności STATYSTYKA OPISOWA wstępna analiza danych I. Miary położenia: Mediana Moda

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Ekonomii i Finansów Dr Katarzyna Brzozowska-Rup

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF

Statystyki opisowe i szeregi rozdzielcze

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, mgr

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2013/2014

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

przedmiot podstawowy obowiązkowy polski drugi

Wykład 7 Testowanie zgodności z rozkładem normalnym

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Przedmiot statystyki. Graficzne przedstawienie danych.

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

ćwiczenia Katedra Rozwoju Regionalnego i Metod Ilościowych

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Wykład ze statystyki. Maciej Wolny

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

PRZEWODNIK PO PRZEDMIOCIE

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Dr Roman Sosnowski

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Rachunek prawdopodobieństwa i statystyka

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

WNIOSKOWANIE STATYSTYCZNE SYLABUS A. Informacje ogólne

Parametry statystyczne

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Kilka uwag o testowaniu istotności współczynnika korelacji

Z-LOGN1-006 Statystyka Statistics

Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Przedmiot statystyki. Graficzne przedstawienie danych.

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Transkrypt:

Wydawnictwo UR 2018 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 3/25/2018 www.eti.rzeszow.pl DOI: 10.15584/eti.2018.3.46 WIESŁAWA MALSKA Opisowe charakterystyki rozkładów cech statystycznych Descriptive Characteristics of Distributions of Statistical Variables Doktor inżynier, Politechnika Rzeszowska, Wydział Elektrotechniki i Informatyki, Katedra Energoelektroniki i Elektroenergetyki, Polska Streszczenie W dziale statystyki opisowej często wyznacza się pewne charakterystyki opisujące właściwości rozkładu badanej cechy zarówno ilościowej (mierzalnej) i jakościowej (niemierzalnej). Dla zmiennych (danych) ilościowych, jeżeli dane pochodzą z próby losowej (małej o liczebności n 30 lub dużej o liczebności n >30) charakterystyki te często nazywa się statystykami (miarami z próby losowej), w przypadku gdy dane dotyczą całej populacji generalnej wówczas charakterystyki te nazywamy parametrami. W dydaktyce przedmiotów związanych ze statystyką opisową i statystyką matematyczną ważna jest świadomość różnicy między poszczególnymi kategoriami miar. Przedstawienie własności rozkładu cech statystycznych za pomocą miar określa się także jako parametryczny opis rozkładu w próbie. Ocena rozkładu za pomocą parametrów lub statystyk (miar z próby) może być związana z położeniem cechy, jej zróżnicowaniem, symetrią (lub niesymetrią), a także koncentracją (skupieniem). W artykule zaprezentowano możliwość wykorzystania programu komputerowego STATISTICA do obliczeń i prezentacji opisowych charakterystyk rozkładów cech statystycznych. Wykorzystanie dedykowanych modułów do obliczeń i graficznej prezentacji rozkładów powinno być pomocne w procesie dydaktycznym. Słowa kluczowe: miary położenia, miary zmienności, miary skośności, miary koncentracji, rozkłady zmiennych, statystyka opisowa Abstract In the section of descriptive statistics, some characteristics are often defined describing the distribution properties of the tested feature both quantitative (measurable) and qualitative (nonmeasurable). For quantitative variables (data), if the data comes from a random sample (small size n 30 or large number n> 30), these characteristics are often referred to as statistics (random sample measures), when the data concern the whole general population then the characteristics these are called parameters. In the didactics of subjects related to descriptive statistics and mathematical statistics, it is important to be aware of the difference between particular categories of measures. The presentation of the distribution properties of statistical features by means of measures is also referred to as a parametric description of the distribution in the sample. Evaluation of the distribution using parameters or statistics (measurements from the sample) may be related to the location of the feature, its differentiation, symmetry (or asymmetry), as well as con- 321

centration (focus). The article presents the possibility of using the STATISTICA computer program for the calculation and presentation of descriptive characteristics of distributions of statistical features. The use of dedicated modules for calculations and graphical presentation of distributions should be helpful in the didactic process. Keywords: location measures, measures of variability, measures of skewness, measures of concentration, distributions of variables, descriptive statistics Wstęp Metody mające na celu przedstawienie charakterystyk danej cechy nazywane są metodami opisu statystycznego. Opis statystyczny sprowadza się do wyznaczania pewnych liczbowych parametrów, określających badany zbiór danych (Rabiej, 2012; Jóźwiak, 2009). Opis statystyczny jest badaniem zamkniętym, jeżeli analizujemy dane dla populacji generalnej (dla wszystkich wartości) i wówczas otrzymane wyniki są parametrami. W przypadku, gdy zbiór danych stanowi próbę losową, opis statystyczny może być podstawą do wnioskowania w działach statystyki matematycznej (Luszniewicz, Słaby, 2001). Pełna analiza danych statystycznych powinna doprowadzić do zwięzłego zaprezentowania wyników badań za pomocą odpowiednich charakterystyk liczbowych. Syntetyczna charakterystyka danej zbiorowości nie oznacza określenia tylko jednego parametru. Im mniej parametrów wykorzystujemy do opisu statystycznego, tym więcej tracimy informacji o strukturze zbiorowości. Często znajomość rozkładu cechy statystycznej (jej obraz graficzny) pozwala na dobór odpowiednich miar. Opisowe charakterystyki rozkładów Pierwszą kategorię stanowią miary położenia, które służą do określenia tej wartości zmiennej opisanej przez rozkład, wokół której skupiają się pozostałe wartości zmiennej (Ostasiewicz, Rusnak, Siedlecka, 2011; Sobczyk, 2007). Wśród miar położenia najczęściej rozpatrywane są tzw. miary tendencji centralnej. Jest to wartość średnia, wartość modalna i mediana (wartość środkowa). Miary rozproszenia, często zwane miarami zmienności, służą do badania stopnia zróżnicowania wartości zmiennej. Najczęściej wyznacza się wariancję, odchylenie standardowe, odchylenie przeciętne, klasyczne współczynniki zmienności, a także rozstęp. Miary niesymetrii (skośności) służą do badania kierunku zróżnicowania wartości zmiennej. Ostatnią grupę stanowią miary koncentracji (skupienia) służące do analizy stopnia skupienia wartości zmiennej wokół średniej. Współczynnik skośności służy do badania symetrii rozkładu cechy statystycznej. Jeżeli współczynnik ten jest równy zero, to rozkład jest symetryczny. Przy ujemnej wartości współczynnika mówimy, że skośność jest lewostronna, a przy wartości dodatniej mówimy, że skośność jest prawostronna. Analogicznie interpretujemy współczynnik niesymetrii (asymetrii). W ostatnich latach najczęściej 322

wyznaczaną miarą koncentracji jest kurtoza i eksces. Kurtoza jest miarą tzw. smukłości rozkładu. Dane wykorzystane w przykładzie obliczeniowym dotyczą prędkości wiatru. Prędkość wiatru na danym terenie jest istotnym parametrem, od którego zależy produkcja energii elektrycznej w farmie wiatrowej. W programie STATISTICA można też sprawdzić rozkład zmiennej, wykorzystując przykładowo moduł Statystyka/Statystyki podstawowe i tabele/tabele liczności (rys. 1). Rysunek 1. Widok modułu Statystyka/Statystyki podstawowe i tabele/tabele liczności Rysunek 2. Histogram analizowanej zmiennej prędkość wiatru 323

Korzystając z modułu Tabele liczności i wykresu w postaci histogramu można w przejrzysty sposób przedstawić rozkład empiryczny rozważanej cechy, w tym przypadku prędkości wiatru. Przedstawiony na rys. 2 histogram prędkości wiatru świadczy o niesymetrycznym rozkładzie, z niesymetrią prawostronną. Dodatkowo na histogramie naniesiony jest wykres funkcji gęstości rozkładu normalnego (tzw. oczekiwana normalna) wraz z wynikiem testu normalności Shapiro-Wilka. Wartość p (p prawdopodobieństwo testowe w programie STATISTICA) jest mniejsza od współczynnika istotności (α = 0,05), stąd możemy uznać, że rozkład prędkości wiatru nie jest zgodny z rozkładem normalnym (z rozkładem Gaussa). Do pełnego opisu wykorzystuje się miary, które można obliczyć, korzystając z modułu Statystyka/Statystyki podstawowe i tabele/ Statystyki opisowe i kartę Więcej (rys. 3). Korzystając z tego modułu, można wyznaczyć potrzebne miary do pełnego opisu statystycznego. Rysunek 3. Widok okna modułu Statystyka/Statystyki podstawowe i tabele/statystyki opisowe karta Więcej Rysunek 4. Wyniki miar dla zmiennej prędkość wiatru fragment arkusza Na rys. 4 zaprezentowano fragment arkusza wynikowego dla analizowanej zmiennej prędkość wiatru. Otrzymane wartości tzw. miar tendencji centralnej, tj. średnia arytmetyczna, moda i mediana dla zmiennej prędkość wiatru, mają różne wartości, a to świadczyć może o niesymetrycznym rozkładzie. Do prezentacji 324

pozycyjnych miar położenia tzw. kwartyli (z podziałem danej zborowości na 4 równe części) w statystyce dedykowany jest odpowiedni typ wykresu, tzw. wykres ramka-wąsy. Dla rozważanej zmiennej wykres ramka-wąsy przedstawiono na rys. 5. Wykres ten oprócz prezentacji poszczególnych kwartyli świadczy również o niesymetrycznym rozkładzie analizowanej zmiennej. W tym przypadku świadczy o niesymetrii prawostronnej. Wartość współczynnika skośności ma wartość dodatnią, co również wskazuje na niesymetrię prawostronną (wartość ujemna może świadczyć o niesymetrii lewostronnej). Rysunek 5. Wykres ramka-wąsy dla zmiennej prędkość wiatru W przypadku konieczności obliczenia wartości odchylenia przeciętnego należy wykorzystać moduł dostępny w Statystyka/Statystyki nieparametryczne/ Statystyki opisowe (rys. 6). Rysunek 6. Widok okna modułu Statystyka/Statystyki nieparametryczne/statystyki opisowe 325

W module przedstawionym na rys. 6 można obliczyć wszystkie miary, które mogą służyć do pełnego opisu statystycznego struktury danej populacji generalnej (w tym module nie ma możliwości wyboru poszczególnych interesujących nas miar, obliczane są wszystkie miary). Zaprezentowane wybrane moduły dostępne w programie STATISTICA nie są jedynymi modułami, które można wykorzystać do wyznaczania charakterystyk i pełnego opisu statystycznego. Można w tym celu wykorzystać także inne moduły dedykowane do tej tematyki (np. moduł analizy przekrojowej Tabele wielodzielcze). Aby we właściwy sposób dokonać interpretacji, potrzebna jest także wiedza teoretyczna dotycząca zagadnień związanych z opisem i charakterystykami cech rozkładów empirycznych analizowanych cech statystycznych. Podsumowanie Wykorzystując wspomaganie komputerowe w procesie dydaktycznym oraz w nauczaniu przedmiotów związanych ze statystyką opisową, z prezentacją danych itp., należy w opisie statystycznym pamiętać, czy dane dotyczą całej zbiorowości statystycznej czy dotyczą tylko wyników badań częściowych dla małej lub dla dużej próby losowej. Dedykowane wykresy i moduły w programie STATISTICA do wyznaczania charakterystyk rozkładów cech mogą być pomocne w procesie dydaktycznym. Interpretacja otrzymanych wyników analiz i obliczeń rozważanych cech statystycznych powinna przyczynić się do właściwej prezentacji rozkładów i właściwej charakterystyki rozkładów. Literatura http:// www.statsoft.pl (4.05.2018). Jóźwiak, J., Podgórski, J. (2009). Statystyka od podstaw. Warszawa: PWE. Luszniewicz, A., Słaby, T. (2001). Statystyka z pakietem komputerowym STATISTICA. Warszawa: C.H. Beck. Ostasiewicz, S., Rusnak, Z., Siedlecka, U. (2011). Statystka. Elementy teorii i zadania. Wrocław: Wyd. AE we Wrocławiu. Rabiej, M. (2012). Statystyka z programem STATISTICA. Gliwice: Helion. Sobczyk, M. (2007). Statystyka. Warszawa: PWN. 326