4.2. Statystyczne opracowanie zebranego materiału



Podobne dokumenty
Analiza współzależności dwóch cech I

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Miary statystyczne w badaniach pedagogicznych

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Statystyka. Opisowa analiza zjawisk masowych

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Analiza struktury i przeciętnego poziomu cechy

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Graficzna prezentacja danych statystycznych

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Parametry statystyczne

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

1 Podstawy rachunku prawdopodobieństwa

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Pozyskiwanie wiedzy z danych

W1. Wprowadzenie. Statystyka opisowa

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Statystyczne metody analizy danych

Metodologia badań psychologicznych. Wykład 12. Korelacje

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Wykład 5: Statystyki opisowe (część 2)

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Analiza Współzależności

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Próba własności i parametry

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Testy nieparametryczne

Analiza współzależności zjawisk

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Policealna Szkoła Handlowa Rok I Wymiar godzin: 30 jednostek dydaktycznych Nr programu nauczania: 341(06)/SP/MEN/ (technik rachunkowości)

Podstawowe pojęcia statystyczne

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Statystyka w pracy badawczej nauczyciela

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka Matematyczna Anna Janicka

Inteligentna analiza danych

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Dane i ich struktura Skale pomiarowe i ich przekształcanie. Mariusz Dacko

R-PEARSONA Zależność liniowa

ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Analiza statystyczna w naukach przyrodniczych

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Zadania ze statystyki, cz.6

TREŚCI NAUCZANIA z przedmiotu pracowania ekonomiczno - informatyczna na podstawie programu nr 341[02]/MEN/ klasa 3 TE

Statystyka opisowa SYLABUS A. Informacje ogólne

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym.

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Statystyczne metody analizy danych

Porównywanie populacji

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

KORELACJE I REGRESJA LINIOWA

Przygotowanie danych

Rozdział 1. Analiza Struktury. Jan Żółtowski. Problem 1.1. Lp. Pytanie Odpowiedź

Wykład 4: Statystyki opisowe (część 1)

Badanie zależności skala nominalna

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Zakład Ubezpieczeń Społecznych Departament Statystyki. Struktura wysokości emerytur i rent wypłacanych przez ZUS po waloryzacji w marcu 2010 roku.

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Załącznik Nr 1 KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Elementy statystyki i demografii. 2. KIERUNEK: Pedagogika. 3. POZIOM STUDIÓW: I stopień

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Transkrypt:

4.2. Statystyczne opracowanie zebranego materiału Zebrany i pogrupowany materiał badawczy należy poddać analizie statystycznej w celu dokonania pełnej i szczegółowej charakterystyki interesujących badacza zjawisk. Zdaniem K. Zająca (1974, s. 14),,,dokonując za pomocą metod statystycznych pewnych uogólnień w opisie statystycznym, wprowadzamy jednocześnie porządek w pozornym chaosie przypadkowych zmian, a więc wykrywamy prawidłowości występujące w zjawiskach masowych. W zależności od badanych zjawisk w analizie wyników stosuje się odpowiednią metodę statystyczną. Zastosowanie wybranej metody powinno zawsze łączyć się z właściwą interpretacją wyników (potwierdza to jej zrozumienie). Metody statystyczne służą do porządkowania materiału, do jego opisu traktowanego jako przygotowanie do analizy jakościowej i wnioskowania. Wykaz możliwych metod i technik opracowania zebranego materiału zamieszczono w tabeli 5. Tabela 5. Metody i techniki opracowywania materiału empirycznego Metoda Metody statystyczne/ /kwantytatywne Technika Rozkład liczbowy przedziały klasowe Miary tendencji centralnej: średnia arytmetyczna, modalna, mediana Miary zmienności: rozpiętość, odchylenia standardowe, proporcje, procenty, korelacje Miary rzetelności (błędy wnioskowania statystycznego) Testy istotności statystycznej Źródło: opracowanie własne. 120 Pierwszą czynnością w opracowaniu statystycznym jest ujęcie w liczby podstawowej charakterystyki badań, odnoszącej się do wielkości próby pod kątem cech demograficznych i społecznych. Podstawowe znaczenie dla późniejszego wyboru metod ma precyzyjne zdefiniowanie cech statystycznych oraz określenie skal pomiaru. Szeroko akceptowane jest przyjęcie czterech skal pomiaru: nominalnej, porządkowej, interwałowej i ilorazowej. Skala pomiaru determinuje wybór metody przy analizie współzależności zjawisk. Według T. Pilcha (1995, s. 98),,skala jest szeregiem zdań ułożonych według określonego porządku wyczerpujących możliwe określenia badanego zjawiska, cechy lub układu. Skala zakłada istnienie pewnego ciągu logicznego stopni oznaczających natężenie pewnego zjawiska. Skala powinna być:

wyczerpuja ca uwzględniać wszystkie możliwe określenia danej sytuacji, rzetelna dająca możliwość uzyskania takich samych wyników przy kolejnych badaniach tej samej próby, trafna poszczególne stopnie skali powinny być logicznie dopasowane do rzeczywistości. Na skali nominalnej możemy obliczyć zmienną najczęściej występującą, rozkład częstości dla danej zmiennej, jaki procent z całości stanowi dany pomiar. Przykładem zmiennej obliczanej na skali nominalnej jest np. płeć (kobieta, mężczyzna), pora roku (wiosna, lato, jesień, zima), kolor oczu (piwne, niebieskie, itp.). Skala nominalna może być zastosowana do wstępnej klasyfikacji zbioru badanego i jest raczej narzędziem badania niż jego efektem. Zmienne na skali porządkowej mogą dotyczyć np. wykształcenia (podstawowe, zawodowe, średnie, wyższe), wielkości miejscowości, w których badani mieszkają (wieś, miasto), stanowiska pracy (pracownik biurowy, dyrektor, pracownik fizyczny). Służy do ułożenia w porządku elementów jakiegoś zbioru ze względu na wybraną cechę. Dla zmiennej na skali porządkowej możemy obliczyć zmienną najczęściej występującą, uszeregować zmienne od najniższej do najwyższej, natomiast nie możemy obliczyć odchylenia standardowego ani wariancji. Skala interwałowa zawiera informacje z dwóch poprzednio wymienionych skal, czyli wyróżnia elementy zbioru, układa elementy zbioru w porządku od największego do najmniejszego. Oprócz tego określa odległość (interwał) między elementami zbioru na umownej skali liniowej. Zmienne na skali ilorazowej mogą dotyczyć wieku, wzrostu, czasu trwania leczenia, czasu trwania nauki. Na skali ilorazowej możemy wyznaczyć dominantę, medianę, odchylenie standardowe, wariancję i wiele innych statystyk. Po ustaleniu skal pomiaru możliwe jest dokonanie dalszych obliczeń statystycznych za pomocą miar średnich (średnia arytmetyczna, modalna, kwartyle) i miar zróżnicowania (zmienności, rozproszenia, dyspersji). Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości badanej cechy. Są to średnie (arytmetyczne, geometryczne, harmoniczne) o symbolu x, modalna o symbol Mo i kwantyle. Najczęściej stosowana jest średnia arytmetyczna, która stanowi sumę poszczególnych wartości badanej cechy wszystkich jednostek badanej próby podzieloną przez liczebność tej próby. Na wartość średniej arytmetycznej duży wpływ wywierają najmniejsze i największe wartości badanej cechy, czyli wartości skrajne. Modalna jest to najczęściej występująca wartość badanej cechy, dlatego nazywana jest dominantą (oznaczamy ją symbolem Do). Stosujemy ją wtedy, gdy chcemy za pomocą jednej liczby wyrazić wariant lub 121

122 wartość cechy najbardziej typowe, najczęściej spotykane. Sposób wyznaczania dominanty zależy od typu szeregu statystycznego, z którym mamy do czynienia. Jeżeli dane przedstawione są w postaci szeregu szczegółowego lub rozdzielczego, dominanta jest wartością cechy, której odpowiada największa liczebność, wobec czego wystarczy ją wskazać. Jeżeli dane są wprowadzone do arkusza kalkulacyjnego Excel, dominantę wyznaczamy, wybierając funkcję,,wys. najczęściej. Mediana (oznaczamy ją symbolem Me) jest to wartość znajdująca się w środku, gdy zbiorowość jest uporządkowana pod względem wielkości jej elementów, tzn. od wartości najmniejszej do wartości największej. Mediana dzieli zbiorowość na dwie równe części w ten sposób, że połowa jednostek statystycznych ma wartość cechy niższą lub równą medianie, a połowa ma wartości równe lub wyższe od Me. Aby wyznaczyć medianę w arkuszu kalkulacyjnym Excel, wybieramy funkcję,,mediana. Jeżeli konieczna jest bardziej szczegółowa analiza właściwości strukturalnych, oprócz mediany, która jest kwartylem drugim, znajdują zastosowanie kwartyle pierwszy i trzeci. Kwartyle należą do miar statystycznych ogólnie zwanych kwantylami, które dzielą zbiorowość statystyczną w określonej proporcji. Kwartyl pierwszy (symbol Q1) jest wartością cechy, która dzieli próbę tak, że 25% jednostek ma wartości od niej nie większe, a 75% nie mniejsze. Kwartyl trzeci (symbol Q3) jest wartością cechy jednostki, która dzieli próbę tak, że 75% jednostek ma od niej wartości nie większe, a 25% nie mniejsze. Kwartyle wyznacza się w sposób analogiczny jak w przypadku mediany, z tym że należy uwzględnić numer kwantyla. Miary zróżnicowania (zmienności, rozproszenia, dyspersji) informują, jak duże są różnice (odchylenia) między wartościami cech poszczególnych a średnią, najczęściej arytmetyczną. Do tej grupy miar należą rozstęp, wariancja i odchylenie standardowe. Rozstęp wyraża różnicę między największą a najmniejszą wartością cechy. Wariancja jest średnią arytmetyczną kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej całej próby. Odchylenie standardowe (symbol SD) jest najczęściej stosowaną miarą obok średniej. SD jest pierwiastkiem kwadratowym z wariancji. Wystarczy wiedzieć, że odchylenie standardowe jest tym większe, im cechy jednostek są bardziej zróżnicowane, i odwrotnie małe odchylenie standardowe świadczy o niskim zróżnicowaniu poszczególnych wartości badanej cechy. Wyliczenie średniej wartości cechy i rozproszenia wartości nie pozwala ocenić asymetrii rozkładu wartości. Dla uchwycenia pełnego obrazu różnic między szeregami danej cechy stosuje się współczynnik asymetrii, symbol As. Współczynnik asymetrii równy zeru wskazuje, że rozkład wartości jest symetryczny, współczyn-

nik dodatni oznacza asymetrię prawostronną, a ujemny asymetrię lewostronną. Jeśli próbę studentów podzielimy na trzy podgrupy: studenci I, II, III roku studiów, to może okazać się, że rozkłady wartości badanej cechy (oceny egzaminów z pielęgniarstwa) się różnią. W celu stwierdzenia występowania współzależności między dwiema cechami wykorzystujemy analizę korelacyjną, oceniając siłę i kierunek zależności. Wykrycie zależności jest możliwe, jeżeli materiał empiryczny jest przedstawiony w postaci szeregu korelacyjnego, inaczej prostego, lub tablicy korelacyjnej. Szereg korelacyjny zawiera uporządkowane parami warianty dwóch cech jednocześnie, stanowi zestawienie dwóch szeregów szczegółowych (tabela 6). Tabela 6. Schemat szeregu korelacyjnego Wariant zmiennej zależnej (X) Wariant zmiennej niezależnej (Y) X 1 Y 1 X 2 Y 2........ X 0 Y 0 Źródło: Starzyńska W.: Analiza współzależności dwóch cech. W: Podstawy statystyki (red. W. Starzyńska). Edukacja Difin, Warszawa 2006. Wybór miernika współzależności zależy od tego, jak dane są uporządkowane: czy w szeregu korelacyjnym (patrz tabela), czy w tablicy korelacyjnej. Istnieje wiele miar współzależności dla szeregu korelacyjnego. W tym rozdziale zostaną omówione dwa: współczynnik korelacji liniowej Pearsonsa i współczynnik korelacji rang Spearmana oraz empiryczna funkcja regresji zmiennej zależnej względem zmiennej niezależnej. Wymienione współczynniki pozwalają badać korelacje między dwoma cechami mierzalnymi, natomiast funkcja regresji pozwala na ustalenie związków przyczynowo-skutkowych. Współczynnik korelacji liniowej Pearsona (ryx) umożliwia zbadanie zależności między dwiema cechami mierzalnymi, między którymi ma miejsce zależność liniowa, tzn. jednostkowym przyrostom jednej cechy towarzyszy, średnio biorąc, stały przyrost lub spadek drugiej cechy. Współczynnik oblicza się według wzoru lub za pomocą arkusza Excel i funkcji,,wsp. korelacji. Po uaktywnieniu tego polecenia zaznaczamy jako,,tablice obszary (kolumny) ze zmiennymi (w dowolnej kolejności, np. tablicy 1 odpowiadają wartości zmiennej Y, a tablicy 2 wartości zmiennej X). Przed automatycznym obliczeniem współczynnika należy sprawdzić, czy spełnione są założenia jego wyznaczania. 123

124 Współczynnik liniowy Pearsona przyjmuje zawsze wartości z przedziału od 1 do +1. Dodatni znak współczynnika korelacji wskazuje na dodatnią korelację między zmiennymi, co oznacza, że wzrostowi jednej cechy towarzyszy na ogół wzrost wartości drugiej cechy. Ujemny znak współczynnika korelacji wskazuje na ujemną korelację między zmiennymi, co oznacza, że wzrostowi jednej cechy towarzyszy na ogół spadek wartości drugiej cechy. Współczynnik korelacji równy 0 świadczyć może o zupełnym braku związku korelacyjnego między badanymi zmiennymi. Orientacyjnie przyjmuje się, że siła korelacji między dwoma cechami jest: niewyraźna, gdy ryx <0,2, wyraźna, ale niska, gdy 0,2 < ryx <0,4, umiarkowana, gdy 0,4 < ryx <0,7, znacząca, gdy 0,7 < ryx <0,9, bardzo silna, gdy ryx >0,9. Współczynnik korelacji rang Spearmana służy do badania zależności dwóch cech przedstawionych w szeregu korelacyjnym. Cechy mogą być mierzalne i niemierzalne, ale dające się uporządkować przez nadanie im kolejnego numeru. To uporządkowanie określa się mianem rangi, a procedurę rangowaniem. Współczynnik rang Spearmana oblicza się ze wzoru. Przyjmuje on wartość z przedziału od 1 do 1. Im wartość jest bliższa 1, tym silniejsza ujemna korelacja między badanymi cechami, a z kolei im bliższa +1, tym silniejsza jest korelacja dodatnia. Wartość bliska 0 wskazuje na słabą zależność. W celu ustalenia wpływu zmiennych uznanych za niezależne na zmienną uznaną za zależną wykorzystuje się analizę regresji i oblicza współczynnik regresji. Współczynnik regresji dodatni oznacza, że wraz ze wzrostem zmiennej niezależnej o jednostkę zmienna zależna wzrośnie o b jednostek. Funkcja regresji jest rosnąca. Współczynnik regresji ujemny wskazuje na to, że pod wpływem wzrostu zmiennej niezależnej o jednostkę zmienna zależna zmaleje średnio o b jednostek. Funkcja regresji jest malejąca. Współczynnik regresji równy 0 świadczy o tym, że zmienna niezależna nie wywiera żadnego wpływu na zmienną zależną. Funkcja regresji jest stała (Zając 1974; Dudkiewicz 2000; Starzyńska 2006). Te podstawowe informacje na temat opisu statystycznego mają jedynie ułatwić zrozumienie artykułów w piśmiennictwie naukowym, do czego znajomość wzorów i umiejętność obliczeń nie jest konieczna. Natomiast osoby zainteresowane poszerzeniem wiedzy z zakresu statystyki odsyłamy do piśmiennictwa (patrz: Podgórski 2001; Wierzbiński 2000; Jóźwiak, Podgórski 1997; Starzyńska 2000; Apanowicz, Kubielski 1999; Ferguson, Takane 1999).