SEMINARIUM DYPLOMOWE dr hab., prof. nzw. Janusz Gierszewski ZAGADNIENIE:

Podobne dokumenty
Metody doboru próby do badań. Dr Kalina Grzesiuk

DOBÓR PRÓBY. Czyli kogo badać?

Pobieranie prób i rozkład z próby

Rodzaje badań statystycznych

DOBÓR PRÓBY. Czyli kogo badać?

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Dokładne i graniczne rozkłady statystyk z próby

Praktyczne aspekty doboru próby. Dariusz Przybysz Warszawa, 2 czerwca 2015

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA MATEMATYCZNA

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Zadania ze statystyki, cz.6

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

1. Projektowanie badania. 2. Dobór próby. 3. Dobór metody i budowa instrumentu. 4. Pomiar (badanie) 5. Redukcja danych. 6.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Badania marketingowe

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Statystyka w pracy badawczej nauczyciela

Estymacja parametro w 1

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Estymacja punktowa i przedziałowa

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

11/8/2015 KRYTERIA JAKOŚCI POMIARU RZETELNOŚĆ. METODY BADAŃ SPOŁECZNYCH WYKŁAD 5: PROJEKTOWANIE BADAŃ (cz.2)

Karolina Jabłońska, Artur Sobieraj Dobór próby badawczej czynnikiem sukcesu w prowadzonych badaniach empirycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Charakterystyka liczbowa opisującą właściwości zbioru danych (np. średnia, mediana, odchylenie standardowe)

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Metody Statystyczne. Metody Statystyczne.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wydział Matematyki. Testy zgodności. Wykład 03

Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

Badania rynkowe 2016_4. Krzysztof Cybulski Katedra Marketingu Wydział Zarządzania Uniwersytet Warszawski

Czy, jak i właściwie dlaczego można badać opinię publiczną?

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka matematyczna dla leśników

Rozkłady statystyk z próby. Statystyka

Statystyka matematyczna

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść I

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Estymacja przedziałowa. Przedział ufności

Badania sondażowe. Dobór próby do badania Rodzaje błędów w badaniach. Agnieszka Zięba

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

1.1 Wstęp Literatura... 1

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD STATYSTYK Z PRÓBY

Testowanie hipotez statystycznych. Wprowadzenie

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

METODY STATYSTYCZNE W BIOLOGII

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Badania marketingowe. Omówione zagadnienia

Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

LABORATORIUM 6 ESTYMACJA cz. 2

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

1 Estymacja przedziałowa

Wykład 3 Hipotezy statystyczne

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Hipotezy statystyczne

Hipotezy statystyczne

Estymacja parametrów rozkładu cechy

Estymacja przedziałowa

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Testowanie hipotez statystycznych

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

STATYSTYKA INDUKCYJNA. O sondażach i nie tylko

WYKŁAD 5 TEORIA ESTYMACJI II

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wnioskowanie statystyczne. Statystyka w 5

Grupowanie materiału statystycznego

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Metoda reprezentacyjna

Testowanie hipotez statystycznych

Przykład zastosowania optymalnej alokacji w estymacji frakcji

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Metody probabilistyczne

Proces badawczy schemat i zasady realizacji

Proces badawczy schemat i zasady realizacji

W8. Metody doboru próby w badaniach rynkowych

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Transkrypt:

SEMINARIUM DYPLOMOWE dr hab., prof. nzw. Janusz Gierszewski ZAGADNIENIE: 1 DOBÓR PRÓBY MINIMALNEJ : Reprezentatywność: Próbę uznamy za reprezentatywną dla populacji, z której została dobrana, jeśli zagregowane cechy tej próby ściśle odzwierciedlają te same zagregowane cechy populacji. Jeśli na przykład 50% populacji stanowią kobiety, to próba musi zawierać w przybliżeniu 50% kobiet, aby była reprezentatywna. Chociaż dobór próby może oznaczać każdą procedurę wyboru jednostek obserwacji - na przykład ankietowanie co dziesiątego przechodnia na ruchliwej ulicy - kluczem do uogólniania wniosków z próby na szerszą populację jest probabilistyczny dobór próby, powiązany z ważną ideą doboru losowego. Poziom ufności: p = 99% (przyjmujemy, że populacja, którą badamy jest szczegółowo określona nieprzypadkowa). Wielkość badanej populacji: 23744 (wg tabeli ludność Kościerzyny GUS 2015 r.). Wielkość frakcji 0,9 (szacujemy, że badanie poprawnie wypełni 90% populacji). Błąd maksymalny 5,0 % (zakładamy, że grupa badana jest reprezentatywna dla badanego zagadnienia, a zagadnienie nie budzi wątpliwości). Wzór na kalkulator doboru próby: gdzie: m/n oszacowana proporcja w populacji (m wielkość frakcji, n wielkość populacji); d dopuszczalny błąd; n wielkość próby; u wartość wynikająca z przyjętego poziomu ufności. Lub: http://www.naukowiec.org/dobor.html Minimalna liczebność próby liczona wg kalkulatora liczebności wyniosła 137 osób. W tym przypadku błąd maksymalny przy próbie losowej 110 osób wynosi 9 %. 1 Por. E. Babbie, Badania społeczne w praktyce, s. 225. 1

Przedział ufności: Dokładność statystyk z prób wyrażamy w kategoriach poziomu ufności co do tego, że statystyki te mieszczą się w określonym przedziale od parametru. Przykładowo, możemy powiedzieć, że mamy 95-procentową ufność, że nasza statystyka z próby (na przykład 80-procentowe poparcie dla monitoringu wizyjnego) mieści się w przedziale ±5% od parametru w populacji. Gdy poszerza się przedział ufności dla danej statystyki, nasza ufność się zwiększa. Możemy na przykład powiedzieć, że mamy 99,9-procentową ufność, że nasza statystyka mieści się w granicach trzech błędów standardowych od prawdziwej wartości parametru. Przedział ufności to pewność, że wynik obejmuje dany odsetek zjawisk. Jeśli chcesz mieć 95-procentową pewność, że wyniki twoich badań są dokładne w granicach ± 5% od parametrów w populacji, powinieneś dobrać próbę o liczebności co najmniej.. I to trzeba obliczyć. Początki Literary Digest przeprowadzał badania wśród mieszkańców USA. W 1920 roku rozesłał kartki pocztowe do mieszkańców sześciu stanów, pytając, na kogo zamierzają głosować w wyborach prezydenckich na Warrena Hardinga czy na Jamesa Coxa. Nazwiska respondentów zostały wybrane z książek telefonicznych i z list rejestracyjnych samochodów. Na podstawie kart pocztowych otrzymanych z powrotem Literary Digest trafnie przewidział, że wybory wygra Harding. Przed kolejnymi wyborami Literary Digest zwiększył zasięg sondażu i sformułował trafne prognozy w latach 1924, 1928 i 1932. W ich przypadku operat doboru próby składał się z: abonentów telefonicznych; a później właścicieli samochodów. Odpowiedni dobór próby badawczej opiera się na dwóch rodzajach metod: metodach probabilistycznych; metodach nieprobabilistycznych. Czynnikiem gwarantującym sukces w prowadzeniu badań empirycznych jest odpowiedni dobór próby badawczej. Nasza próba musi być jak najbardziej reprezentatywna, wyodrębniona z populacji generalnej przez właściwe losowanie. Populacja generalna: Populacją generalną nazywamy skończoną zbiorowość, o której badacz chce uzyskać określone informacje. Są to wszystkie jednostki, które z punktu widzenia celu badania mogą być poddane badaniom, u których występuje interesująca badacza cecha. W celu zdefiniowania populacji generalnej badacz powinien wziąć pod uwagę takie charakterystyki jak: element badania (treść informacji) jednostkę badania (nośnik informacji) wymiar czasowy 2

przestrzenny Są to charakterystyki niezbędne do zdefiniowania danej populacji. Badana populacja (zbiorowość generalna, populacja generalna) ogół rzeczywistych jednostek, o których chcemy uzyskać informacje. Przykłady: populacja mieszkańców Kościerzyny, populacja kobiet w wieku 35-50 lat w Słupsku, populacja studentów AP, populacja przedsiębiorstw detektywistycznych na terenie Polski. Badania pełne (wyczerpujące) wszystkie jednostki badanej populacji poddaje się pomiarowi Badania częściowe (niewyczerpujące, próbkowe) część jednostek badanej populacji poddaje się pomiarowi. Część jednostek nosi nazwę próby np. 300 studentów AP. Wybór metody doboru próby badanej jest sposobem w jaki elementy próby badawczej będą dobierane do próby. Metody te dzielą się na metody oparte na doborze losowym, metody oparte na doborze nielosowym, dobór oparty na ochotnikach. Próbę nazywa się losową, gdy dobór badanej części populacji odbywa się w drodze losowania z całej populacji. Dobór celowy polega na zamierzonym doborze do badań tych jednostek, które spełniają określone kryteria oraz charakteryzują się takimi, a nie innymi właściwościami, a w których dobór losowy jest niemożliwy. Dobór oparty na ochotnikach nie reprezentuje zbiorowości. Ochotnicy sami deklarują udział w badaniach. Inne podziały metody doboru próby badawczej: - dobór celowy; dobór losowy; kula śnieżna, dobór kwotowy czy 1. Dobór losowy próby: - losowanie ze zbioru nieznanego (prosty dobór losowy), - losowanie z warstw (dobór warstwowy), - losowanie wielostopniowe (dobór wielostopniowy grupowy), - losowanie systematyczne (dobór losowy prosty systematyczny). 2. Dobór nielosowy (celowy) próby: - metoda doboru jednostek typowych; - metoda doboru kwotowego; - metoda kuli śniegowej; - próbkowanie teoretyczne. Dobór metoda kuli śnieżnej stosujemy, gdy trudno jest nam znaleźć jednostki specyficznej populacji (migranci, bezdomni..). Szuka się pewnej grupy jednostek znajdujemy 10 jednostek, a mieliśmy 300, prosimy, żeby wskazały nam 3 kolejne, to mamy 30 osób, kolejne proszę o wskazanie 4 osób, to mamy 120 osób itd. Dobór warstwowy a kwotowy: Dobór warstwowy polega na podziale całej populacji generalnej na tzw. warstwy i dokonaniu losowania bezpośredniego niezależnych prób w obrębie każdej warstwy. Podział populacji na warstwy musi być przeprowadzony w taki sposób, aby każdy element wchodził tylko do jednej warstwy i znajdował się w którejś z nich. Metoda ta pozwala zapobiec dobieraniu nieadekwatnych prób losowych ze zbiorowości, w których występuje silne rozproszenie badanych cech. 3

W porównaniu do nieograniczonego doboru losowego metoda ta charakteryzuje się większą dokładnością wyników przy zachowaniu tej samej wielkości próby. Dobór warstwowy czasami nazywany jest losowo warstwowym. Ponieważ na poziomie każdej warstwy powinno dobierać się jednostki stosując dobór losowy. Wyróżnia się trzy rodzaje technik losowania z poszczególnych warstw: dobór proporcjonalny, polegający na wyborze z każdej warstwy takiej liczby elementów, jaka pozostaje w proporcji do liczebności (udziału) tej warstwy w całej populacji. Dużym ułatwieniem, jakie stwarza ta technika doboru w sferze analizy danych jest możliwość przeprowadzenia obliczeń dla całej próby jednocześnie, nie zaś dla każdej warstwy oddzielnie, dobór ten posiada bowiem zaletę samoważenia. dobór nieproporcjonalny polegający na wyróżnieniu warstw w populacji generalnej, które są niedoreprezentowane w próbie (ich udział w populacji jest niewielki), a następnie doborze z każdej warstwy takiej liczby elementów, która pozostaje w proporcji do iloczynu liczebności warstwy i odchylenia standardowego badanej cechy w danej warstwie. Postępowanie takie jest intuicyjnie poprawne, bowiem dla reprezentowania warstwy o większym rozproszeniu badanej cechy potrzeba większej liczby elementów w próbie niż dla warstwy o mniejszym rozproszeniu, a jednocześnie z większej warstwy powinna być wylosowana większa próba. dobór optymalny jest taką techniką doboru, w której z poszczególnych warstw do próby, losuje się taka liczbę elementów, która jest proporcjonalna do iloczynu liczebności warstwy i wielkości odchylenia standardowego badanej cechy w danej warstwie, a odwrotnie proporcjonalny do pierwiastka kwadratowego z kosztu badania jednostki należącej do danej warstwy. W takich przypadkach dobór elementów z każdej warstwy do próby powinien być odwrotnie proporcjonalny do pierwiastka kwadratowego z kosztu badania każdej jednostki. Dobór kwotowy próby badawczej opiera się za założeniu, że próba jest reprezentatywna dla wszystkich interesujących nas cech, jeżeli jej struktura oparta na kilku istotnych cechach jest identyczna ze strukturą zbiorowości generalnej. Innymi słowy dobór kwotowy opiera się na znajomości struktury populacji generalnej (tzw. zmiennych kontrolnych) i jej odwzorowaniu na strukturze próby badawczej. Liczebność segmentacyjną próby badawczej ustalić można na podstawie przemnożenia rozkładu procentowego wybranych cech w populacji generalnej przez ogólną liczebność próby. Im więcej wyróżnionych cech jako zmiennych kontrolnych, tym więcej podziałów segmentowych i tym trudniej jest skompletować odpowiedni skład próby. Kwota to liczba jednostek zapewniająca zgodność struktury próby ze strukturą populacji ze względu na cechy kontrolne Dobór jednostek w zakresie kwot wg uznania bądź pewnego klucza. Np. dobór próby 400-elementowej spośród studentów AP. Płeć: 30% kobiet, 70% mężczyzn, czyli kwota kobiet = 0,3 * 400 = 120 kobiet i kwota mężczyzn = 0,7 * 400 = 280 mężczyzn Dobór: 120 studentek PR i 280 studentów AP Ze względu na cechy kontrolne próba jest reprezentatywna. 4

Polega na odwzorowaniu struktury populacji generalnej na strukturze próby badawczej W próbie kwotowej wychodzi się od macierzy lub tabeli, opisującej istotne dla badania cechy populacji. W zależności od celów badania badaczowi może być potrzebna wiedza, jaki jest na przykład udział mężczyzn i kobiet w badanej populacji oraz jaki jest udział każdej płci w poszczególnych kategoriach wieku, poziomu wykształcenia. W ramach kwoty dobiera się jednostki stosując dobór przypadkowy! Dobór kwotowy nie jest traktowany jako metoda reprezentatywna. Jest doborem quasi reprezentatywnym. Etapy procesu doboru próby: Zdefiniowanie badanej populacji. Sporządzenie wykazu badanej populacji (zbiorowości generalnej). Określenie liczebności próby. Wybór metody doboru próby. Pobranie próby. Zdefiniowanie badanej populacji należy określić: Jednostkę badania (kto lub co jest przedmiotem badania np. studenci w wieku 18-35 lat) Zakres czasowy populacji tzn. podajemy moment lub przedział czasu, którego dotyczy badanie np. stan populacji na 31 grudnia 2016 r. Zakres przestrzenny populacji zazwyczaj obszar geograficzny, którego dotyczy badanie np. województwo pomorskie, miasto Słupsk Wynika z problemu badawczego i decyzji, której ma służyć informacja wynikająca z badania. Sporządzenie wykazu badanej populacji (zbiorowości generalnej) zbiór wszystkich jednostek populacji, który zostanie użyty w badaniu. Zazwyczaj korzysta się z pewnych rejestrów lub spisów, które już gdzieś występują np. PESEL, GUS, wykaz liczby studentów. Operat losowania (doboru próby) kompletny wykaz jednostek populacji, którym to jednostkom przypisano określone symbole identyfikacyjne najczęściej liczby w celu doboru próby. Określenie liczebności próby wyznacza się na podstawie kilku sposobów: Wg eksperta w zależności od rodzaju badania wyznaczamy liczebność próby na podstawie opinii eksperta. Ekspert na podstawie wiedzy historycznej nam dobiera tę próbę. Wg minimalnej liczebności komórki metoda analizy danych nam to narzuca 5

a, b, c, d, e, f liczba jednostek przyjmujących odpowiednio kategorie xi oraz yj (i=1,2; j=1,2,3). Wg założonego dopuszczalnego błędu założony dopuszczalny błąd determinuje liczebność próby. Dotyczy doboru losowego. Wzór można stosować w specyficznych sytuacjach. Przy wyznaczaniu wartości średniej populacji gdzie: n minimalna liczebność próby σ odchylenie standardowe cechy w populacji (np. z pilotażu) uα wartość zmiennej losowej o rozkladzie normalnym standaryzowanym odczytana tak, aby P { uα <u< uα} (np. 1-α =0,95 to uα = 1,96) d założony maksymalny błąd szacunku, tzn. maksymalna dopuszczalna różnica między wartością średnią populacji μ a wartością średnią próby - im błąd będzie mniejszy tym liczebność próby będzie rosła. Przy wyznaczaniu proporcji populacji π n minimalna liczebność próby uα wartość zmiennej losowej o rozkładzie normalnym standaryzowanym odczytana tak, aby P { uα <u< uα } (np. 1-α=0,95 to uα = 1,96) π proporcja populacji (np. z pilotażu) d założony dopuszczalny błąd szacunku, tzn. maksymalna dopuszczalna różnica między proporcją populacji pi a proporcją próby p. Metody nielosowe: I. Dobór przypadkowy do próby dobieramy jednostki przypadkowo tzn. nielosowo, gdyż w odpowiednim czasie znalazły się one w określonym miejscu, w którym gromadzono dane np. ktoś stoi w centrum handlowym i wyłapuje ludzi, tak samo w barze, na ulicy II. Dobór celowy badacz na podstawie wiedzy o jednostkach badanej populacji wskazuje te jednostki, które wejdą do próby np. dobór studentów do oceny stanu bezpieczeństwa na drogach (gdzie zamieszkują, jakimi środkami komunikacji się przemieszczają ) III. Dobór kwotowy najczęściej wykorzystywany przez firmy badawcze. Istota: struktura próby ma być zgodna ze strukturą populacji ze względu na ważne dla badacza cechy. Powodzenia ͺ 6

Bibliografia: Babbie, E. 2007. Badania społeczne w praktyce. Warszawa: Wydawnictwo Naukowe PWN. Cieślarczyk M., Krawczyk P., Korulczyk Z., Poradnik metodyczny autorów prac kwalifikacyjnych, AON 2002. 7