Wykład 3: Prezentacja danych statystycznych

Podobne dokumenty
Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wykład 4: Statystyki opisowe (część 1)

Sposoby prezentacji problemów w statystyce

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Wykład 1: O statystyce i analizie danych. Arkusz danych w programie STATISTICA

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Podstawowe pojęcia cd. Etapy badania statystycznego

You created this PDF from an application that is not licensed to print to novapdf printer (

Wykład z dnia 8 lub 15 października 2014 roku

Wykład 1: O statystyce i analizie danych

Podstawowe pojęcia statystyczne

Grupowanie materiału statystycznego

Wykład 2: Arkusz danych w programie STATISTICA

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

Statystyka matematyczna i ekonometria

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Badania Statystyczne

Przygotowanie danych

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

W1. Wprowadzenie. Statystyka opisowa

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

Wprowadzenie do analizy dyskryminacyjnej

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Statystyka w pracy badawczej nauczyciela

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Wykład ze statystyki. Maciej Wolny

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Wykład 5: Statystyki opisowe (część 2)

Idea wnioskowania statystycznego

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki Cz. 1. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Wykład 6/7/8: Graficzna analiza danych

Jak korzystać z przeglądarki danych ESS SoftReport

Planowanie zajęć równoległych i mieszanych

Wykład 1. Wprowadzenie w tematykę zajęć

Statystyka Matematyczna Anna Janicka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Graficzna prezentacja danych statystycznych

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

EXCEL TABELE PRZESTAWNE

Pozyskiwanie wiedzy z danych

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

MS Excell 2007 Kurs podstawowy Filtrowanie raportu tabeli przestawnej

Statystyka matematyczna dla leśników

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Estymacja parametrów rozkładu cechy

Analiza struktury i przeciętnego poziomu cechy

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Metodyka wykonania kartogramu z podziałem na klasy wg punktów charakterystycznych wraz z opracowaniem kartogramicznej legendy.

Program szkolenia EXCEL PRZEKROJOWY ZAAWANSOWANY.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Statystyka. Wykład 1. Magdalena Alama-Bućko. 26 lutego Magdalena Alama-Bućko Statystyka 26 lutego / 34

Statystyka opisowa. Wykład VI. Analiza danych jakośiowych

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

ĆWICZENIE 1 Statystyka opisowa. Testowanie zgodności STATYSTYKA OPISOWA wstępna analiza danych I. Miary położenia: Mediana Moda

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Sytuacja osób po 50 roku życia na śląskim rynku pracy. Konferencja Kariera zaczyna się po 50-tce Katowice 27 stycznia 2012 r.

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Próba własności i parametry

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Sposób tworzenia tabeli przestawnej pokażę na przykładzie listy krajów z podstawowymi informacjami o nich.

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Wykład 2. Internetowe źródła danych międzynarodowych Przygotowanie arkusza danych do analiz

Zmiany bezrobocia w województwie zachodniopomorskim w 2018 roku

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

XXXI MARATON WARSZAWSKI Warszawa,

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

1. Mechanizm alokacji kwot

ECDL/ICDL Zaawansowane arkusze kalkulacyjne Moduł A2 Sylabus, wersja 2.0

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Podstawy statystyki medycznej Laboratorium. Zajęcia 5 wprowadzenie do programu Statistica

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

6.4. Efekty specjalne

Wykład 6: Analiza danych czasowych Wykresy, indeksy dynamiki

SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Miary statystyczne w badaniach pedagogicznych

Transkrypt:

Wykład 3: Prezentacja danych statystycznych

Dobór metody prezentacji danych Dobór metody prezentacji danych zależy od: charakteru danych statystycznych (inne metody wybierzemy dla danych przekrojowych, inne dla czasowych, inne dla danych ankietowych); liczby analizowanych przypadków innych metod prezentacji danych wymaga zbiór danych przekrojowych o powiatach w Polsce (kilkaset przypadków) a innych o państwach UE (27 przypadków); charakteru cechy statystycznej inne narzędzia można zastosować do pogrupowania danych o charakterze liczbowych, a inne do danych o charakterze nominalnym ( tekstowym ).

Rodzaje szeregów statystycznych (dane ankietowe, cecha nominalna) SZEREG SZCZEGÓŁOWY (NIEUPORZĄDKOWANY) SZEREG SZCZEGÓŁOWY (UPORZĄDKOWANY) SZEREG ROZDZIELCZY (PUNKTOWY)...... Płeć (x i ) n i 10 5 % i 67% 33% n = 15 (wielkość próby) x i wartości cechy, n i liczność, % i udział procentowy

Rodzaje szeregów statystycznych (dane ankietowe, cecha mierzalna) SZEREGI SZCZEGÓŁOWE SZEREG ROZDZIELCZY (PUNKTOWY) SZEREG ROZDZIELCZY (PRZEDZIAŁOWY) WIEK 23 25 31 24 34 44 51 27 38 19 45 61 WIEK 19 19 19 19 20 20 20 Wiek (x i ) 19. 64 65 n i 15 10 5 3 % i 5,0% 3,3% 1,7% 1,0% Wiek (x i ) -24 25-34 35-44 45-54 55-65 n i 100 60 50 50 40 % i 33,3% 20,0% 16,7% 16,7% 13,3% n = 300 (wielkość próby) x i wartości cechy, n i liczność, % i udział procentowy

Rodzaje szeregów statystycznych (dane przekrojowe, cecha mierzalna) SZEREG SZCZEGÓŁOWY (NIEUPORZĄDKOWANY) SZEREG SZCZEGÓŁOWY (UPORZĄDKOWANY) Państwo Stopa bezrobocia 2007 Państwo Stopa bezrobocia 2007 Austria 4,4 Dania 3,8 Belgia 7,5 Cypr 4 Bułgaria 6,9 Austria 4,4 Cypr 4 Estonia 4,7 Czechy 5,3 Czechy 5,3 Dania 3,8 Bułgaria 6,9 Estonia 4,7 Finlandia 6,9 Finlandia 6,9 Belgia 7,5 Francja 8,4 Francja 8,4 n = 27 (wielkość próby) x i wartości cechy

Rodzaje szeregów statystycznych (dane czasowe, cecha mierzalna) SZEREG SZCZEGÓŁOWY (NIEUPORZĄDKOWANY) Rok 1998 1999 2000 2001 2002 2003 2004 2005 Wskaźnik rodności w Polsce 10,23 9,88 9,79 9,53 9,16 9,36 9,55 9,72 Prezentacja danych czasowych nie wymaga zwykle żadnych przekształceń wyjściowego ciągu danych (o ile oczywiście jest on uporządkowany chronologicznie). W żadnym razie nie sortujemy danych czasowych według wartości poszczególnych cech! 2006 9,85 n = 9 (wielkość próby) x i wartości cechy

Grupowanie danych - tabele liczności Narzędzia analiz statystycznych w programie STATISTICA są dostępne za pomocą dwóch poleceń STATYSTYKA i WYKRESY. Aby dokonać grupowania danych należy posłużyć się analizą TABELE LICZNOŚCI.

Rodzaje grupowania W oknie TABELE LICZNOŚCI istnieje możliwość ustawienia różnych sposobów grupowania w zakładce WIĘCEJ. Poniżej opisano najważniejsze sposoby grupowania (kategoryzacji) wartości zmiennych. Wyszczególnienie wszystkich wartości: dla cech nominalnych i mierzalnych (o nielicznych wartościach) Szereg przedziałowy o zadanej z góry (lub przybliżonej) liczbie przedziałów Szereg przedziałowy określony w pełni przez użytkownika Grupowanie wybranych wartości w podanej kolejności Rozpiętość przedziału Początek pierwszego przedziału

Przykłady grupowania Przykład dotyczy pliku Opinie o integracji z UE (2004). Celem analizy jest przedstawienie odpowiedzi na pytania dotyczące skutku integracji dla Polski (zmienna 7) i sposoby głosowania respondentów w referendum akcesyjnym (zmienna 6). Ponieważ obie zmienne mają ten sam charakter (nominalny) grupowanie możemy przeprowadzić jednocześnie, wybierając za pomocą przycisku ZMIENNE obie cechy i ustalając odpowiednio sposób grupowania. Po naciśnięciu przycisku PODSUMOWANIE otrzymujemy dwie tabele oddzielne wyniki grupowania dla obu cech. Wszystkie wyniki kolejnych analiz będę dodawane do otworzonego właśnie skoroszytu wyników.

Opis wyników grupowania Tabele z wynikami grupowania zawierają następujące informacje: warianty badanej cechy; liczbę przypadków dla każdego wariantu; skumulowaną liczbę przypadków (opis na rysunku) procentowy udział danego wariantu cechy; skumulowane procenty. UWAGA!!! Wartości skumulowane mają sens tylko wtedy, gdy grupowane warianty są w logiczny sposób uporządkowane (a więc dla cech porządkowych lub liczbowych). W roboczej tabeli wyników należy pozostawić tylko te wartości, które się da zinterpretować. Należy także dokonać formatowania wartości.

Występowanie braków danych Przy domyślnych ustawieniach opcji grupowania, w tabelach wyszczególniona jest także informacja o brakach danych. W rozpatrywanym przykładzie są one zapewne równoważne stwierdzeniu faktu, iż ktoś nie wziął udziału w referendum akcesyjnym. Brak udziału w referendum W pewnych sytuacjach chcemy poznać strukturę danych po wykluczeniu z rozważań braków odpowiedzi. W omawianym przykładzie ma to sens, gdyż w ten sposób dowiadujemy się informacji o wynikach referendum w badanej zbiorowości. W oknie TABELE LICZNOŚCI w zakładce OPCJE wyłączamy Otrzymujemy informacje o strukturze procentowej tylko w grupie osób, które wzięły udział w głosowaniu.

Grupowanie danych liczbowych Kontynuując analizę danych ankietowych z pliku Opinie o integracji z UE (2004) zbadamy strukturę wieku respondentów. Tego typu zestawienia umieszcza się w części Charakterystyka badanej zbiorowości kwestia ta jest o tyle ważna, że poglądy na pewne zjawiska społeczne i polityczne są zwykle odmienne dla różnych grup wiekowych. Należy więc stwierdzić, czy badana grupa jest reprezentatywną próbką z populacji dorosłych mieszkańców woj. podkarpackiego, czy też może odzwierciedla przede wszystkim poglądy osób młodszych.

Prezentacja rozkładu wieku respondentów Po wybraniu analizy TABELE LICZNOŚCI i sporządzeniu (bez zmiany ustawień) szeregu rozdzielczego, okazuje się, że wyniki nie są zbyt czytelne Widać to zarówno podczas próby analizy informacji zawartych w tabeli liczności jak i na przykładzie graficznej prezentacji w postaci HISTOGRAMU.

Prezentacja rozkładu wieku respondentów Przy tak dużej złożoności danych, należy je przedstawić w postaci szeregu przedziałowego, na przykład w następującej postaci Wiek (x i ) -24 25-34 35-44 n i 87 102 47 % i 29,0% 34,0% 19,0% W tym celu wykorzystana zostanie opcja KROK umożliwiająca sporządzenie szeregu o jednakowej rozpiętości przedziałów. Zostaną one następnie ręcznie skorygowane tak, by odpowiadały wzorcowi tabeli. 45-54 27 9,0% 55-64 14 4,7% 65-75 13 4,3%