ZMIENNE Cechy fizyczne Środowisko rodzinne Sprawność PŁEĆ WZROST... Liczba RODZ.

Wielkość: px
Rozpocząć pokaz od strony:

Download "ZMIENNE Cechy fizyczne Środowisko rodzinne Sprawność PŁEĆ WZROST... Liczba RODZ."

Transkrypt

1 Tabelaryczna i graficzna prezentacja struktury zbiorowości Wstępna analiza statystyczna obejmuje szereg czynności związanych z porządkowaniem, prezentacją i opisową charakterystyką zbioru danych. Polega ona, najogólniej mówiąc, na przekształceniu szczegółowych danych dotyczących poszczególnych osób (rzeczy, zjawisk, procesów) na syntetyczną informację o całej badanej zbiorowości, czyli na przedstawieniu i opisie struktury tej zbiorowości. Tabela wyników surowych arkusz danych Dane zebrane wpisz w arkusz danych, aby porządek był zachowany Zgromadzony w trakcie badań materiał wypełnione ankiety, rozwiązane testy, dane z przeprowadzonych wywiadów, itp. musi zostać uporządkowany w tabeli wyników surowych. Tabela wyników surowych to zapisane - w uporządkowaniu wyznaczonym schematem tabeli - dane z badań. A więc, na przykład, dane dotyczące płci, wykształcenia, odpowiedzi poszczególnych osób na pytania ankiety, kwestionariusza, wyniki wykonywanych lub rozwiązywanych przez nich testów, jak też inne wyznaczone celem badań pomiary. Identyfikator ZMIENNE Cechy fizyczne Środowisko rodzinne Sprawność PŁEĆ WZROST Liczba RODZ TEST1 TEST Rys.1. Schemat tabeli wyników surowych przykład Pierwsza kolumna tabeli wyników surowych boczek tabeli zawiera identyfikatory jednostek badania. Identyfikatorem mogą być dowolne nazwy lub symbole pozwalające rozróżnić poszczególne jednostki. Mogą to być, na przykład, po prostu liczby porządkowe. W główce tabeli wyników surowych zapisujemy w hierarchicznym uporządkowaniu właściwości wyznaczone przedmiotem badań (zmienne badane). Zmiennymi są na przykład takie właściwości osób jak: płeć, wzrost, liczba rodzeństwa, poziom wykształcenia, preferowany rodzaj wypoczynku, poziom inteligencji. W komórki tabeli wyników surowych wpisujemy zaobserwowane wartości wyróżnionych zmiennych. I tak wartości zmiennej płeć, to: płeć męska (mężczyzna), płeć żeńska (kobieta); wartości zmiennej preferowany rodzaj wypoczynku, to na przykład: wypoczynek bierny, wypoczynek czynny; wartości zmiennej liczba rodzeństwa, to liczby: 0 rodzeństwa, 1 rodzeństwo, 2 rodzeństwa,... Każdy wiersz tabeli zawiera te wartości wyróżnionych zmiennych, które charakteryzują osobę (jednostkę) oznaczoną identyfikatorem w tym wierszu umieszczonym. Jeżeli, na przykład, identyfikator 1 został przyporządkowany Annie Abackiej, to w wierszu o numerze 1 wpiszemy wszystkie zebrane dane dotyczące Anny Abackiej. W kolumnie natomiast umieszczamy dane zebrane od wszystkich osób, ale dotyczące tylko jednej z badanych właściwości, np. liczby rodzeństwa. Tabela rozkładu jednej zmiennej Zgromadzenie i uporządkowanie w tabeli wyników surowych materiału z badań to, można powiedzieć, wstępny etap wstępnej analizy statystycznej. Kolejnym etapem jest rozpoznanie struktury danych, a tym samym struktury badanej zbiorowości ze względu na różne, interesujące nas zmienne. Szukamy na przykład odpowiedzi na pytania: Ile w badanej zbiorowości uczniów jest dziewcząt, a ilu chłopców?; Jaki procent badanej zbiorowości stanowią dziewczęta, a jaki chłopcy? (jest to pytanie o wskaźniki struktury); Jak licznie reprezentowane są poszczególne postawy dzieci względem rodziców?; Która z tych postaw jest reprezentowana najczęściej? (jest to pytanie o wartość modalną, dominantę); Jaki jest rozkład wyników testu sprawności w badanej grupie młodzieży?

2 Odpowiedzi na te i podobne pytania można uzyskać poddając zgromadzone dane odpowiedniemu grupowaniu. Czynność ta prowadzi do wyodrębnienia w badanej zbiorowości względnie jednorodnych grup, tzn. takich, że osoby (jednostki) zaliczone do jednej grupy mają co najmniej jedną własność wspólną, bądź różnią się ze względu na tę własność nieznacznie. Tak więc wyróżnimy, na przykład, grupę chłopców i grupę dziewcząt, jeżeli za podstawę wyodrębnienia grup przyjmiemy zmienną płeć ; albo grupy młodzieży, które uzyskały w teście sprawności wyniki 0p-5p, 6p-10p, itd.; albo grupy chłopców o wynikach odpowiednio 0p-5p, 6p-10p, itd. i grupy dziewcząt o takichże wynikach. Ogólnie, jakie to mają być grupy wynika przede wszystkim z celów badań. Natomiast samo grupowanie musi spełniać określone warunki formalne. Po pierwsze, otrzymane grupy muszą być rozłączne, czyli nie mogą mieć elementów wspólnych. Po drugie, wszystkie podlegające grupowaniu elementy muszą zostać przyporządkowane do tworzonych grup. STRUKTURĘ danych przedstawisz najlepiej w tabeli lub na wykresie. Taka struktura, ROZKŁADEM ZMIENNEJ zwana, prezentuje zbiorowość pod względem cechy wybranej do badania. Po utworzeniu grup określamy liczebność każdej grupy, tzn. zliczamy ile jednostek do każdej z grup należy. Ustalamy tym samym następujące przyporządkowanie: 1.wartość zmiennej x 1 liczba n 1 danych równych wartości x 1 2.wartość zmiennej x 2 liczba n 2 danych równych wartości x Takie przyporządkowanie nazywamy rozkładem liczebności badanej zbiorowości według wartości zmiennej, krótko: rozkładem empirycznym zmiennej. Rozkład zmiennej obrazuje strukturę badanej zbiorowości pod względem badanej zmiennej (cechy) i może być przedstawiony w tabeli liczebności lub na wykresie. Wartość zmiennej X n i względna p i % x 1 n 1 p 1 x 2 n 2 p Σ N 100 Rys. 2. Schemat tabeli przedstawiającej rozkład zmiennej Symbol N oznacza tu liczebność badanej zbiorowości, zaś n i liczebności wyodrębnionych grup. Suma liczebności wyodrębnionych grup równa jest liczebności badanej zbiorowości: n 1 + n n k = N, gdzie k oznacza tu liczbę wartości zmiennej. ni Liczebności względne pi =, to wskaźniki struktury. Wskaźnik struktury informuje o tym, jaka część N zbiorowości charakteryzuje się własnością (wartością zmiennej), dla której wskaźnik struktury został obliczony. Dla wskaźników struktury spełniona jest równość: p 1 + p p k = 1 Wskaźniki struktury można też podawać w procentach. Wówczas mamy równość: p 1 + p p k = 100%

3 Przykład 1: W ramach prac związanych z przygotowaniem projektu przeciwdziałania bezrobociu w pewnym regionie, należało poznać strukturę wykształcenia osób bezrobotnych. Pobrano 500-osobową próbę osób zarejestrowanych w urzędach pracy tego regionu i sprawdzono, jaki poziom wykształcenia ma każda z nich. Tabela 1. przedstawia otrzymany szereg rozdzielczy (rozkład zmiennej: poziom wykształcenia w badanej grupie osób). Tabela 1. osób bezrobotnych zarejestrowanych w... Poziom wykształcenia n i względna p i Zawodowe 335 0,670 Średnie 121 0,242 Wyższe 44 0,088 Σn i 500 1,000 Źródło: Dane umowne Dla wartości wykształcenie średnie wskaźnik struktury wynosi 0,242 co oznacza, że 24,2% badanej zbiorowości stanowią osoby z wykształceniem średnim. Przykład 2: W celu ustalenia norm empirycznych testu ortograficznego dla uczniów kończących klasę III szkoły podstawowej przeprowadzono badania. Losowo wybrani na początku czerwca z populacji trzecioklasistów uczniowie wypełniali test. Rozkład liczby popełnionych błędów przedstawiony jest w tabeli 2. Tabela2. Liczba błędów w teście ortograficznym Liczba błędów ponad 6 Razem Częstość Częstość względna % W badanej grupie 330 uczniów bezbłędnie test ortograficzny napisało 12 dzieci, tj. 7% wszystkich uczniów piszących test. Najczęściej uczniowie popełniali 3 błędy 93 uczniów na 330, co stanowi 28 % wszystkich biorących udział w badaniu. Jeżeli grupowaniu podlegają zmienne o wartościach liczbowych strukturę badanej zbiorowości można przedstawić również w postaci rozkładu kumulowanego. W rozkładzie kumulowanym wartościom zmiennej przyporządkowane są liczebności kumulowane. Przez liczebność kumulowaną rozumiemy liczbę jednostek l k, dla których wartość zmiennej nie przekracza danej wartości x k : k l k = n i i = 1 Gdy wartościom zmiennej przyporządkowane zostają liczebności kumulowane względne otrzymany szereg przedstawia dystrybuantę empiryczną. kumulowana względna określa, jaką część badanej zbiorowości stanowią te jednostki, dla których wartość zmiennej nie przekracza danej wartości x k : k q k = p i i = 1 Gdy analizowana zmienna jest zmienną o wartościach liczbowych, jak na przykład liczba rodzeństwa, liczba popełnionych błędów, itp. lub na przykład wiek, wzrost, czas wykonania zadania i mamy dużo danych, należy ustalić najpierw pewne przedziały wartości zmiennej a następnie zliczyć ile danych w tych przedziałach się mieści. Liczbę przedziałów, ich szerokość oraz granice ustalamy tak, aby otrzymany rozkład czytelnie przedstawiał strukturę badanej zbiorowości. Odpowiedź na pytanie ile przedziałów ma być w konkretnym przypadku, zależy głównie od tego, jak liczna jest badana zbiorowość. Nie ma jednak algorytmu, którego zastosowanie zapewniałoby otrzymanie optymalnego, z punktu widzenia celu badań, obrazu struktury zbiorowości. W

4 literaturze można znaleźć różne propozycje ustalania liczby przedziałów klasowych, z których jedna przedstawiona jest na rys. 4. zbiorowości Liczba klas Źródło: Z.Zając, Zarys metod statystycznych, PWE, 1988 Rys.4. Proponowana liczba przedziałów klasowych w zależności od liczby danych Szerokości przedziałów ustalamy tak, aby wyodrębnione w ten sposób grupy były w miarę jednorodne. Z pewnych względów najlepiej jest gdy szerokości przedziałów są równe, ale nie jest to wymóg konieczny. Czasem zasadnym jest ustalenie przedziałów o różnej szerokości. Rozkład zmiennej według przedziałów wartości zmiennej przedstawiamy w tabeli o następującym schemacie. Przedziały klasowe wartości zmiennej X n i względna p i % kumulowana l k kumulowana względna % (x 1 ; x 2 ] (x 2 ; x 3 ] (x 3 ; x 4 ] suma Rys. 3. Schemat tabeli przedstawiającej rozkład zmiennej według przedziałów wartości zmiennej Rozkład kumulowany zawiera inną informację o badanej zbiorowości niż szereg rozdzielczy prosty. kumulowana informuje nas o tym, u ilu osób badanej zbiorowości zaobserwowano wartości zmiennej nie wyższe niż ta, dla której tę liczebność obliczyliśmy. względna kumulowana wskazuje, jaka część badanej zbiorowości charakteryzuje się wartościami zmiennej nie wyższymi od tej, dla której tę liczebność ustaliliśmy. Rozkładu kumulowanego można nie uwzględniać jeżeli tego nie potrzebujemy. Pomijamy wówczas w tabeli kolumny liczebność kumulowana oraz liczebność kumulowana względna. Wzrost uczniów Szkoły Podstawowej nr 55 w Zabeziu w roku szkolnym 1999/2000 Wzrost (cm) względna % kumulowana kumulowana względna % ( ] ( ] ( ] ( ] ( ] ( ] ( ] Źródło: Dane umowne Tabela 3. W powyższym przykładzie liczba uczniów, których wzrost nie przekracza 145 cm równa jest 40 (liczebność kumulowana równa 40), co stanowi 8% badanej zbiorowości. Uczniów o wzroście nie większym niż 160 cm jest 460, czyli 92% zbiorowości.

5 Tabele rozkładu jednej zmiennej w wyodrębnionych grupach W jednej tabeli można również przedstawić dwa rozkłady tej samej zmiennej w wyodrębnionych grupach. Taka prezentacja ułatwia porównawcze omówienie struktury badanej zbiorowości, uwypuklenie podobieństw i różnic w strukturze grup ze względu na badaną właściwość. Przykład: Jeżeli chcemy porównać rozkład wykształcenia w grupach według miejsca zamieszkania, to tabela może mieć taką np. formę. Tabela 4. osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 według miejsca zamieszkania (w procentach) Miejsce zamieszkania niższe niż średnie średnie lub wyższe razem wieś miasto W grupie osób bezrobotnych mieszkających na wsi przeważają osoby o wykształceniu niższym niż średnie (57%). Odwrotnie jest w grupie osób bezrobotnych mieszkających w mieście, tu przeważają bezrobotni o wykształceniu średnim lub wyższym (74%). Jeżeli natomiast chcemy porównać rozkład miejsca zamieszkania w grupach według wykształcenia, to tabela może przybrać taką formę. Tabela 5. Miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 według wykształcenia (w procentach) Miejsce zamieszkania niższe niż średnie średnie lub wyższe wieś miasto razem W grupie osób bezrobotnych mających wykształcenie niższe niż średnie więcej osób mieszka na wsi (70%) niż w mieście (30%). Inaczej jest w grupie bezrobotnych posiadających wykształcenie średnie lub wyższe więcej osób z tej grupy mieszka w mieście (61%) niż na wsi (39%). Tabele rozkładu wielozmiennej Wyniki grupowania, które przebiegało w ten sposób, że każda jednostka badania została zaliczona do grupy ze względu na to, jaką wartość przyjmuje ze względu na więcej niż jedną zmienną, tworzą rozkład wielozmiennej. Jeżeli, na przykład, interesować nas będzie struktura bezrobotnych ze względu na wykształcenie (zmienna X) i miejsce zamieszkania (zmienna Y) jednocześnie, tworzymy grupy w ten sposób: określamy wykształcenie i miejsce zamieszkania każdej osoby i zliczamy ile jest osób o wykształceniu niższym niż średnie i mieszkających na wsi, ile jest osób o wykształceniu średnim lub wyższym i mieszkających na wsi, ile jest osób o wykształceniu niższym niż średnie i mieszkających w mieście, itd. Otrzymamy w ten sposób rozkład dwuzmiennej (wykształcenie X, miejsce zamieszkania Y), czyli rozkład dwuzmiennej (X,Y). Rozkład dwuzmiennej przedstawiamy w tabelach dwudzielczych, zwanych też tabelami korelacyjnymi lub krzyżowymi.

6 Zmienna Y Zmienna X Sumy brzegowe x1 x2 x3... (zmienna Y) y1 y2... Sumy brzegowe (zmienna X) zbiorowości Rys.6. Schemat tabeli dwudzielczej W główce tabeli umieszczamy nazwę jednej zmiennej (X) oraz wartości tej zmiennej lub przedziały wartości zmiennej (x1, x2, x3, x4), w boczku tabeli nazwę drugiej zmiennej oraz jej wartości lub przedziały wartości. W komórki tabeli wpisujemy liczebności wyodrębnionych grup, tzn. liczebności grup, dla których zmienna X przyjmuje wartość x1 a zmienna Y wartość y1, dalej zmienna X przyjmuje wartość x2 a zmienna Y wartość y1, itd. Ostatnia kolumna, w której umieszczone są sumy liczebności kolejnych wierszy i ostatni wiersz, w którym mamy sumy liczebności kolejnych kolumn przedstawiają rozkłady brzegowe. Ostatnia kolumna (wraz z pierwszą, gdzie są wyszczególnione wartości zmiennej Y) - rozkład zmiennej Y, ostatni wiersz (wraz z pierwszym, gdzie są wyszczególnione wartości zmiennej X) - rozkład zmiennej X. W tabeli wielodzielczej możemy umieszczać dodatkowo lub zamiast liczebności bezwzględnych, liczebności względne. Poniżej (tabela ) pokazany jest przykład tabeli dwudzielczej przedstawiającej rozkład dwuzmiennej (wykształcenie, miejsce zamieszkania) w populacji osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku Tabela 6. a miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku Miejsce zamieszkania niższe niż średnie średnie lub wyższe razem wieś miasto razem Spośród 190 przebadanych osób 56 ma wykształcenie niższe niż średnie i mieszka na wsi a 67 ma wykształcenie średnie lub wyższe i mieszka w mieście. Jak widać bezrobotni o wykształceniu średnim lub wyższym przeważają w mieście. W tabeli możemy również podać wartości procentowe. Tabela 7. a miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 (w procentach). Miejsce zamieszkania niższe niż średnie średnie lub wyższe razem wieś miasto razem Spośród przebadanych osób 29% stanowią bezrobotni, którzy mają wykształcenie niższe niż średnie i mieszkają na wsi a 35% bezrobotni, którzy mają wykształcenie średnie lub wyższe i mieszkają w mieście. Jak widać bezrobotni o wykształceniu średnim lub wyższym przeważają w mieście.

7 Czasem zachodzi potrzeba przedstawienia struktury badanej zbiorowości z uwzględnieniem więcej niż dwu zmiennych. Rozkład trójzmiennej przedstawiamy w tabeli o następującym schemacie: Zmienna Y Zmienna Z Zmienna X x1 x2... y1 z1 z2 y2 z1 z2 y3 z1 z Sumy brzegowe (Zmn X) Rys.7. Schemat tabeli trójdzielnej Sumy brzegowe (zmn Y) zbiorowości Prezentację struktury badanej grupy bezrobotnych z uwzględnieniem oprócz miejsca zamieszkania oraz wykształcenia również płci przedstawia tabela poniżej. Tabela 8. Bezrobotni zarejestrowani w Urzędzie Pracy w Paradyżu w roku 2005 ze względu na wykształcenie, miejsce zamieszkania i płeć (w procentach) Miejsce Płeć zamieszkania niższe niż średnie średnie lub wyższe płeć miejsce wieś kobieta mężczyzna miasto kobieta mężczyzna wykształcenie Proponuję, aby interpretacji powyższej tabeli czytelnik dokonał samodzielnie. Interpretacja!!!!! Jako zadanie na koniec rozdziału Tytułowanie tabel i wykresów Badania empiryczne statystyczne mogą być badaniami populacji ograniczonej lub nieograniczonej. Jeżeli badaniu podlega populacja ograniczona, to badanie może być wyczerpujące gdy badaniu został poddany każdy element populacji lub częściowe gdy badaniu zostały poddane tylko elementy próbki populacji. Tytuł tabeli lub wykresu przedstawiającej rozkład analizowanej przez badacza zmiennej powinien być tak sformułowany, aby wynikało z niego, jakie to było badanie. I tak, gdy przeprowadzono: 1. Badania całościowe populacji ograniczonej - tytuł tabeli zawiera: nazwę zmiennej (cechy, właściwości), której rozkład przedstawiony jest w tabeli nazwę populacji i jej przestrzenne i czasowe ograniczenie co? kto gdzie kiedy?

8 Przykład: Tabela 1. osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku niższe niż średnie 80 średnie lub wyższe 110 suma 190 n % 2. Badania częściowe populacji ograniczonej - tytuł tabeli zawiera: nazwę zmiennej (cechy, właściwości), której rozkład przedstawiony jest w tabeli nazwę populacji i jej przestrzenne i czasowe ograniczenie oraz informację, że badania nie są całościowe Przykład: Tabela 2. badanej grupy osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku lub Tabela 2. bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 (próba 30 osób). W pierwszym z powyższych przykładów na to, że badania są częściowe wskazuje zwrot badanej grupy osób, w drugim informacja podana w nawiasie. 3. Badania populacji nieograniczonej tytuł tabeli zawiera: nazwę zmiennej (cechy, właściwości), której rozkład przedstawiony jest w tabeli populacji, którą reprezentuje badana próbka Przykład: Tabela 1. Rozkład wieku uczniów w grupie eksperymentalnej nazwę Jeżeli w jednej tabeli przedstawiamy dwa rozkłady jednej zmiennej w wyodrębnionych grupach, to tytuł tabeli zawiera informację taką jak w przypadku, gdy prezentowany jest rozkład jednej zmiennej (czyli uwzględniająca rodzaj badania) wraz z dodatkiem według... Przykład: Tabela 3. Miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 według wykształcenia(w procentach) Miejsce zamieszkania niższe niż średnie średnie lub wyższe wieś miasto razem Przykład: Tabela 4. osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 według miejsca zamieszkania(w procentach) Miejsce zamieszkania niższe niż średnie średnie lub wyższe razem wieś miasto

9 Jeżeli w tabeli przedstawiamy rozkład dwuzmiennej, w tytule tabeli podajemy nazwę tej dwuzmiennej w formie nazwa cechy 1 a nazwa cechy 2 oraz informację pozwalającą określić typ badania. Przykład: Tabela 5. a miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku Miejsce zamieszkania niższe niż średnie średnie lub wyższe razem wieś miasto razem Wykresy statystyczne Strukturę badanej zbiorowości można przedstawić graficznie na wykresach statystycznych. Poprawnie i czytelnie sporządzone wykresy pozwalają na szybką orientację w strukturze danych, obrazowo ujmują różnice między rozkładami zmiennej w różnych zbiorowościach, co ułatwia dalszą tych różnic analizę statystyczną. Umożliwiają wstępne rozpoznanie zgodności otrzymanego rozkładu empirycznego z rozkładem teoretycznym, itd. O wartości wykresu decyduje wybór odpowiedniego do charakteru danych typu wykresu, jak również właściwy dobór i opis skali oraz właściwa legenda. Przesądzają one często w ogóle o wykresu czytelności. W literaturze spotykamy wiele rozróżnień typów wykresów statystycznych a odpowiadające rozróżnionym typom nazwy nie są spójnie stosowane przez różnych autorów. Podobnie rzecz się ma w przypadku komputerowych programów umożliwiających sporządzanie wykresów statystycznych. W tym skrypcie ograniczymy się do podania bardzo ogólnych wskazówek dotyczących doboru typu wykresu, w zależności od rodzaju właściwości (zmiennej), której rozkład ma być przedstawiony graficznie. Rozróżnimy dwa podstawowe typy wykresów przydatnych do obrazowania rozkładu zmiennej w zbiorowości: 1.Wykresy, w których wykorzystuje się metodę podziału powierzchni wybranej figury zamkniętej (np. koła, prostokąta) na części w proporcjach odpowiadających proporcjom podziału badanej zbiorowości na grupy; 2.Wykresy, w których wykorzystuje się układ odniesienia (np. układ współrzędnych kartezjańskich); w tym przypadku informację o rozkładzie zmiennej w zbiorowości odczytuje się z odpowiednio oznaczonych i wyskalowanych osi układu odniesienia. Pośrednim typem są wykresy, w których wykorzystuje się jedną oś odniesienia. Wykresy pierwszego typu stosujemy przede wszystkim do prezentacji rozkładu zmiennej nominalnej, bo tylko taki w tym przypadku jest odpowiedni, choć można je również wykorzystać do prezentacji rozkładu dowolnej zmiennej. Wykresy drugiego typu stosujemy wyłącznie do prezentacji rozkładu zmiennych mierzonych na skalach z jednostką miary. Wykres kołowy i kolumnowy Przykładem wykresu typu I jest wykres kołowy. Koło reprezentujące całą zbiorowość - dzielimy tak, aby poszczególne wycinki koła były proporcjonalne do liczebności rozróżnionych grup.

10 Wyższe, 8,8 % Średnie, 24,2 % Zawodowe, 67,0 % Rys. osób bezrobotnych zarejestrowanych w... Tę samą informację możemy przedstawić na wykresie kolumnowym: Histogram Przykładem wykresu typu II. jest histogram zmiennej ciągłej. Struktura zbiorowości obrazowana jest na histogramie poprzez szereg prostokątów umieszczonych w odpowiednio opisanym i wyskalowanym układzie dwu osi liczbowych; na jednej osi reprezentowane są wartości zmiennej, na drugiej - liczebności lub liczebności względne (wskaźniki struktury).

11 Jeżeli obrazujemy szereg rozdzielczy kumulowany, na drugiej osi reprezentowane są liczebności kumulowane lub liczebności względne kumulowane, a otrzymany wykres to histogram kumulowany. Wykres liniowy Rozkład zmiennej ciągłej przedstawiony może być graficznie na wykresie liniowym zwanym wielobokiem liczebności. Wielobok liczebności otrzymamy, gdy połączymy odcinkami punkty, których współrzędne wyznaczone są przez środek przedziału klasowego i odpowiadającą temu przedziałowi liczebność.

12 Wykres złożony Wykresy złożone przedstawiają strukturę zbiorowości względem więcej niż jednej zmiennej. Tutaj pokażemy pewną odmianę wykresu złożonego układ wykresów skategoryzowanych. Układ taki przedstawia rozkład według np. dwu zmiennych na tylu osobnych wykresach, ile wartości ma jedna ze zmiennych grupujących..

13 Zadania i ćwiczenia 1. Zapisz następujące liczby w postaci procentów: 0,2 = 20% 0,02 = 2% 0,30 = 0,24 = 0,05 = 0,004 = 0,256 = 1,00 = 1,25 = 2. Wyniki :egzaminu z matematyki w grupie studentów przedstawiają się następująco: ndst, dst, dst, db, ndst, bdb, bdb, db, db, dst, dst, dst, db, bd, bd, ndst, dst, dst, dst, db, dst, db, bdb, dst, db, bdb, bdb, dst, db, db, db, dst, dst, bdb, db, db, dst, dst, bdb, db, db, dst, bdb, dst, dst, db, db, db, dst, bdb, dst, db, db Ile było ocen ndst, ile dst, ile db, ile bdb? Utwórz odpowiednią tabelę liczebności przedstawiającą rozkład ocen w grupie studentów. Ilu studentów zdawało egzamin? Oblicz wskaźniki struktury otrzymanego rozkładu dla każdej oceny. 3. Na podstawie tabeli 8 odpowiedz na następujące pytania: Ile procent bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu mieszka na wsi? Ile procent bezrobotnych ma wykształcenie niższe niż średnie? Ile, w procentach, jest kobiet wśród badanych? Ile, w procentach, jest mężczyzn o wykształceniu średnim lub wyższym? Jaki procent badanych bezrobotnych Tabela 8. Bezrobotni zarejestrowani w Urzędzie Pracy w Paradyżu w roku 2005 ze względu na wykształcenie, miejsce zamieszkania i płeć (w procentach) Miejsce Płeć zamieszkania niższe niż średnie średnie lub wyższe płeć miejsce wieś kobieta mężczyzna miasto kobieta mężczyzna wykształcenie

14 4. Przeprowadź statystyczną analizę danych zawartych w poniższej tabeli według podanych poleceń: Identyfikator Wynik testu ( odporność na stres) Ocena z egzaminu Płeć A.Z. 28 db K A.C. 26 db K B.D. 29 dst K B.S. 30 bdb M C.R. 27 dst M C.G. 28 db K T.U. 28 dst M D.T. 32 db K F.O. 29 bdb K H.I. 32 dst K N.O. 29 dst M M.E. 33 bdb M L.D. 31 bdb M S.W. 25 dst K S.B. 24 dst M G.G. 30 db K K.L. 28 db M K.I. 29 db K R.A. 27 bdb K G.I. 24 dst K J.F. 31 bdb M L.W. 23 db M T.A. 33 bdb M W.A. 26 dst K C.M. 25 dst M M.C. 34 db K B.O. 27 db M D.R. 22 dst M W.P. 23 dst K Przedstaw tabelarycznie i graficznie rozkład zmiennej płeć oraz rozkład zmiennej ocena z egzaminu. Pamiętaj o tytułach tabel i wykresów oraz o zamieszczeniu legendy. W tabeli umieść również liczebności względne (w procentach). Przedstaw w tabeli dwudzielczej strukturę grupy: wynik testu a płeć wynik testu a ocena Pamiętaj o tytułach tabel i legendzie. Sporządź histogram (zwykły i kumulowany) zmiennej wynik testu (podziel wyniki testu na pięć klas). Naszkicuj wielobok liczebności oraz dystrybuantę empiryczną. Oblicz lub odczytaj ze sporządzonych wykresów: Jaki procent grupy stanowią osoby, które osiągnęły w teście wynik 30 punktów lub więcej? Jaki procent grupy stanowią osoby, które osiągnęły w teście wynik 23 punktów lub mniej?

Praktyczne wykorzystanie IBM SPSS Statistics (wersja 21 PL)

Praktyczne wykorzystanie IBM SPSS Statistics (wersja 21 PL) Katolicki Uniwersytet Lubelski Jana Pawła II Dr Krzysztof Jurek Praktyczne wykorzystanie IBM SPSS Statistics (wersja 21 PL) Kurs dla użytkowników początkujących i średniozaawansowanych Lublin SPIS TREŚCI

Bardziej szczegółowo

Jak przeprowadzić badania satysfakcji użytkowników biblioteki?

Jak przeprowadzić badania satysfakcji użytkowników biblioteki? Jak przeprowadzić badania satysfakcji użytkowników biblioteki? Poradnik dla bibliotekarzy Satysfakcja klienta to stan pozytywnego odbioru usługi, który pośrednio świadczy o akceptacji jakości usługi, jak

Bardziej szczegółowo

Statystyka matematyczna

Statystyka matematyczna Projekt pn. Wzmocnienie potencjału dydaktycznego UMK w Toruniu w dziedzinach matematyczno-przyrodniczych realizowany w ramach Poddziałania 4.1.1 Programu Operacyjnego Kapitał Ludzki Joanna Karłowska-Pik

Bardziej szczegółowo

Wprowadzenie do metod probabilistycznych wspomagane komputerowo MAPLE. Jerzy Ombach. Państwowa Wyższa Szkoła Zawodowa

Wprowadzenie do metod probabilistycznych wspomagane komputerowo MAPLE. Jerzy Ombach. Państwowa Wyższa Szkoła Zawodowa Wprowadzenie do metod probabilistycznych wspomagane komputerowo MAPLE Jerzy Ombach Państwowa Wyższa Szkoła Zawodowa Nowy Sącz 2006 Rada Naukowa Zdzisława Zacłona, Leszek Rudnicki, Jarosław Frączek, Zdzisław

Bardziej szczegółowo

OPRACOWANIE DANYCH W PSPP

OPRACOWANIE DANYCH W PSPP Zpracování dat v PSPP pro společenské vědy 3 KRAKOWSKA AKADEMIA A. F. MODRZEWSKIEGO BORIS KOŽUH OPRACOWANIE DANYCH W PSPP KRAKÓW 2013 4 Boris Kožuh, Jaroslav Myslivec Opracowanie danych w PSPP 9 1 Program

Bardziej szczegółowo

SPOŁECZNA WYŻSZA SZKOŁA PRZEDSIĘBIORCZOŚCI I ZARZĄDZANIA W ŁODZI. Zasady pisania prac licencjackich i magisterskich. Poradnik dla studentów

SPOŁECZNA WYŻSZA SZKOŁA PRZEDSIĘBIORCZOŚCI I ZARZĄDZANIA W ŁODZI. Zasady pisania prac licencjackich i magisterskich. Poradnik dla studentów SPOŁECZNA WYŻSZA SZKOŁA PRZEDSIĘBIORCZOŚCI I ZARZĄDZANIA W ŁODZI Halina Sobocka - Szczapa Zasady pisania prac licencjackich i magisterskich. Poradnik dla studentów Łódź 2010 SPIS TREŚCI WPROWADZENIE...3

Bardziej szczegółowo

RAPORT TEMATYCZNY Z BADANIA. Czas pracy i warunki pracy w relacjach nauczycieli

RAPORT TEMATYCZNY Z BADANIA. Czas pracy i warunki pracy w relacjach nauczycieli RAPORT TEMATYCZNY Z BADANIA Czas pracy i warunki pracy w relacjach nauczycieli Warszawa, czerwiec 2013 Autorzy: dr hab. Michał Federowicz dr Jacek Haman dr Jan Herczyński Kamila Hernik Magdalena Krawczyk-Radwan

Bardziej szczegółowo

Pracownia fizyczna analiza wyników pomiarów i ich niepewności.

Pracownia fizyczna analiza wyników pomiarów i ich niepewności. 005-0-0 Pracownia fizyczna analiza wyników pomiarów i ich niepewności... Wstęp Zjawiska zachodzące w przyrodzie opisywane są za pomocą odpowiednio zdefiniowanych pojęć zwanych wielkościami fizycznymi.

Bardziej szczegółowo

Technologia Informacyjna

Technologia Informacyjna 1 Technologia Informacyjna Akusz kalkulacyjny 2 Czym jest arkusz kalkulacyjny Arkusz kalkulacyjny to program komputerowy przeznaczony do przetwarzania danych, głównie liczbowych, z wykorzystaniem tabel.

Bardziej szczegółowo

Metodyczne problemy badań preferencji konsumenckich

Metodyczne problemy badań preferencji konsumenckich Anna Szymańska Metodyczne problemy badań preferencji konsumenckich Wstęp Badania preferencji konsumenckich prowadzone są w celu poznania systemu ocen odzwierciedlających potrzeby i upodobania konsumenta,

Bardziej szczegółowo

Po drugie jest to dyscyplina naukowa, traktująca o metodach liczbowego opisu i wnioskowania o prawidłowościach występujących w procesach masowych.

Po drugie jest to dyscyplina naukowa, traktująca o metodach liczbowego opisu i wnioskowania o prawidłowościach występujących w procesach masowych. PROJEKTOWANIE BADANIA STATYSTYCZNEGO Termin statystyka ma wiele znaczeń. Po pierwsze określa się nim zbiór informacji liczbowych, dotyczących celowo wybranej grupy zjawisk. W tym sensie mówi się np. o

Bardziej szczegółowo

Centralna Komisja Egzaminacyjna. Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego

Centralna Komisja Egzaminacyjna. Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego Centralna Komisja Egzaminacyjna Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego Analiza wyników egzaminów zewnętrznych z wykzrzystaniem metzdy EWD w ewaluacji

Bardziej szczegółowo

Katalog metod diagnozy rozwoju poznawczego dziecka na etapie edukacji przedszkolnej i wczesnoszkolnej

Katalog metod diagnozy rozwoju poznawczego dziecka na etapie edukacji przedszkolnej i wczesnoszkolnej Grażyna Krasowicz-Kupis Katarzyna Wiejak Katarzyna Gruszczyńska Katalog metod diagnozy rozwoju poznawczego dziecka na etapie edukacji przedszkolnej i wczesnoszkolnej TOM I narzędzia dostępne w poradniach

Bardziej szczegółowo

PORADNIK JAK STWORZYĆ PROJEKT BADAWCZY?

PORADNIK JAK STWORZYĆ PROJEKT BADAWCZY? PORADNIK JAK STWORZYĆ PROJEKT BADAWCZY? KONKURS WIEDZY OBYWATELSKIEJ I EKONOMICZNEJ 2011/2012 Wstęp...2 Projekt badawczy w działaniu...2 Wybór tematu...2 Pytania badawcze...3 Analiza cudzych źródeł...5

Bardziej szczegółowo

GRADACYJNA ANALIZA DANYCH IDEA I PRZYKŁAD ZASTOSOWANIA

GRADACYJNA ANALIZA DANYCH IDEA I PRZYKŁAD ZASTOSOWANIA Zeszyty Naukowe Wydziału Informatycznych Technik Zarządzania Wyższej Szkoły Informatyki Stosowanej i Zarządzania Współczesne Problemy Zarządzania Nr 1/2012 GRADACYJNA ANALIZA DANYCH IDEA I PRZYKŁAD ZASTOSOWANIA

Bardziej szczegółowo

Opracowywanie danych doświadczalnych

Opracowywanie danych doświadczalnych Opracowywanie danych doświadczalnych Michał K. Urbański, Wydział Fizyki Politechniki Warszawskiej, murba@if.pw.edu.pl październik 2014 SPIS TREŚCI 1. Wstęp 2 1.1. Treść skryptu i rozkład materiału......

Bardziej szczegółowo

WYKORZYSTANIE ANALIZY KORESPONDENCJI W BADANIACH MARKETINGOWYCH. Katedra Ekonometrii, Akademia Ekonomiczna im. O. Langego, Wrocław

WYKORZYSTANIE ANALIZY KORESPONDENCJI W BADANIACH MARKETINGOWYCH. Katedra Ekonometrii, Akademia Ekonomiczna im. O. Langego, Wrocław WYKORZYSTANIE ANALIZY KORESPONDENCJI W BADANIACH MARKETINGOWYCH Agnieszka Stanimir Katedra Ekonometrii, Akademia Ekonomiczna im. O. Langego, Wrocław 1 WPROWADZENIE Praca jest poświęcona analizie korespondencji,

Bardziej szczegółowo

Maciej Jakubowski Artur Pokropek BADAJĄC EGZAMINY. Podejście ilościowe w badaniach edukacyjnych. Centralna Komisja Egzaminacyjna

Maciej Jakubowski Artur Pokropek BADAJĄC EGZAMINY. Podejście ilościowe w badaniach edukacyjnych. Centralna Komisja Egzaminacyjna Maciej Jakubowski Artur Pokropek BADAJĄC EGZAMINY Podejście ilościowe w badaniach edukacyjnych Centralna Komisja Egzaminacyjna Maciej Jakubowski Artur Pokropek BADAJĄC EGZAMINY Podejście ilościowe w badaniach

Bardziej szczegółowo

Poradnik Badaj interaktywnie

Poradnik Badaj interaktywnie Poradnik Badaj interaktywnie Jak poprawnie przygotować ankietę internetową Poradnik Badaj interaktywnie Jak poprawnie przygotować ankietę internetową Wydawca: Autorzy: Bartłomiej Berbeć Karolina Ciećka

Bardziej szczegółowo

Ostateczna wersja metodologii prowadzenia monitoringu zawodów deficytowych i nadwyżkowych na lokalnym rynku pracy

Ostateczna wersja metodologii prowadzenia monitoringu zawodów deficytowych i nadwyżkowych na lokalnym rynku pracy Ostateczna wersja metodologii prowadzenia monitoringu zawodów deficytowych i nadwyżkowych na lokalnym rynku pracy OPRACOWANIE NOWYCH ZALECEŃ METODYCZNYCH PROWADZENIA MONITORINGU ZAWODÓW DEFICYTOWYCH I

Bardziej szczegółowo

IBM SPSS Statistics Base 22

IBM SPSS Statistics Base 22 IBM SPSS Statistics Base 22 Uwaga Przed skorzystaniem z niniejszych informacji oraz produktu, którego one dotyczą, należy zapoznać się z informacjami zamieszczonymi w sekcji Informacje na stronie 185.

Bardziej szczegółowo

Metodyka nauczania matematyki ze wspomaganiem e-learningowym

Metodyka nauczania matematyki ze wspomaganiem e-learningowym Metodyka nauczania matematyki ze wspomaganiem e-learningowym Zdzisław Porosiński Wstęp 2 Matematyka Re@ktywacja 6 Uczestnicy projektu 6 Wymagania techniczne 7 Funkcjonalność materiałów e-learningowych

Bardziej szczegółowo

Spis treści. 1.1 Problematyka... 4 1.2 Cele pracy i zakres pracy... 5

Spis treści. 1.1 Problematyka... 4 1.2 Cele pracy i zakres pracy... 5 Spis treści 1 Wstęp 4 1.1 Problematyka.......................... 4 1.2 Cele pracy i zakres pracy...................... 5 2 Analiza zagadnienia 7 2.1 Wprowadzenie.......................... 7 2.2 Eksploracja

Bardziej szczegółowo

4. Metody systemowe zarządzania jakością

4. Metody systemowe zarządzania jakością Zarządzanie jakością w praktyce inżynierskiej 4. Metody systemowe zarządzania jakością 4.1 Metody statystyczne w zarządzaniu jakością Do podstawowych instrumentów monitorowania procesów wytwórczych należą

Bardziej szczegółowo

Paweł Tatarzycki STATYSTYKA. Wybrane zagadnienia

Paweł Tatarzycki STATYSTYKA. Wybrane zagadnienia Paweł Tatarzycki STATYSTYKA Wybrane zagadnienia ELEMENTARNE ZAGADNIENIA STATYSTYKI Termin statystyka pochodzi od łacińskiego status, co oznacza stan rzeczy. W ujęciu historycznym terminem tym określano

Bardziej szczegółowo

MATEMATYKA dla studentów kierunku Zarządzanie i Marketing ZBIGNIEW BARTOSIEWICZ DOROTA MOZYRSKA EWA PAWŁUSZEWICZ

MATEMATYKA dla studentów kierunku Zarządzanie i Marketing ZBIGNIEW BARTOSIEWICZ DOROTA MOZYRSKA EWA PAWŁUSZEWICZ MATEMATYKA dla studentów kierunku Zarządzanie i Marketing ZBIGNIEW BARTOSIEWICZ DOROTA MOZYRSKA EWA PAWŁUSZEWICZ Wrzesień 1998 2 Spis treści Wstęp 7 1 Podstawy 9 1.1 Elementy logiki............................

Bardziej szczegółowo

Wybrane techniki przygotowywania rekomendacji dla użytkowników serwisu internetowego

Wybrane techniki przygotowywania rekomendacji dla użytkowników serwisu internetowego POLITECHNIKA ŁÓDZKA Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Praca dyplomowa Wybrane techniki przygotowywania rekomendacji dla użytkowników serwisu internetowego Artur Ziółkowski

Bardziej szczegółowo

Interpretacja trzyletnich wskaźników Edukacyjnej Wartości Dodanej

Interpretacja trzyletnich wskaźników Edukacyjnej Wartości Dodanej Filip Kulon 1 Przemysław Majkut Okręgowa Komisja Egzaminacyjna w Krakowie Interpretacja trzyletnich wskaźników Edukacyjnej Wartości Dodanej Wstęp Edukacyjna wartość dodana to sposób na mierzenie wkładu

Bardziej szczegółowo

OBRAZY CZTERECH BADANYCH ZAWODÓW:

OBRAZY CZTERECH BADANYCH ZAWODÓW: 1 OBSERWATOR RYNKU PRACY REGIONU WAŁBRZYSKIEGO OBRAZY CZTERECH BADANYCH ZAWODÓW: Sprzedawca Kucharz Elektryk Technolog robót wykończeniowych w budownictwie Raport końcowy Tom I 2 Publikacja współfi nansowana

Bardziej szczegółowo

Metody statystyki medycznej stosowane w badaniach klinicznych

Metody statystyki medycznej stosowane w badaniach klinicznych Metody statystyki medycznej stosowane w badaniach klinicznych Statistics for clinical research & post-marketing surveillance część I Program szkolenia część I Wprowadzenie Podstawowe pojęcia statystyczne

Bardziej szczegółowo