BADANIA PRÓBKOWE PROJEKTOWANIE I WNIOSKOWANIE
|
|
- Jacek Małek
- 7 lat temu
- Przeglądów:
Transkrypt
1 BADANIA PRÓBKOWE PROJEKTOWANIE I WNIOSKOWANIE Mirosław Szreder, Katedra Statystyki, Uniwersytet Gdański Wśród wielu nowych trendów obserwowanych w opisie rzeczywistości na uwagę zasługuje upowszechnienie się pomiaru liczbowego, który w wielu dziedzinach życia społecznego i gospodarczego zdaje się wypierać opis jakościowy (werbalny). Dążenie do oceny nieraz bardzo skomplikowanych zjawisk za pomocą kilku wskaźników, indeksów, pozycji w rankingu staje się wyznacznikiem współczesnego trybu życia szybkiego, oferującego dostęp do wielu źródeł informacji. Opis liczbowy jest zwykle oparty na wynikach badań próbkowych (niewyczerpujących), obejmujących jedynie małą reprezentację populacji. Fundamentem wnioskowania o populacji pozostaje w tego typu badaniach teoria wnioskowania statystycznego Neymana-Pearsona. Z wielu jednak powodów próba losowa przestaje być jedynym i wystarczającym źródłem informacji dla statystyka. Głównymi powodami dokonującej się ewolucji w tym zakresie są: z jednej strony wzrost znaczenia błędów nielosowych w całkowitym błędzie badania próbkowego (braki odpowiedzi, wady operatów losowania), a z drugiej rosnące zasoby informacji o wielu populacjach poddawanych badaniom i coraz łatwiejszy dostęp do tych informacji. Te nowe zjawiska powinny być brane pod uwagę w projektowaniu badania już na etapie wyboru techniki próbkowania. Jednym z najważniejszych wyzwań dla statystyka jest obecnie umiejętne wykorzystanie całości zgromadzonej na wstępie wiedzy (a priori) w badaniu, w którym głównym źródłem informacji pozostaje wciąż próba statystyczna. Przesłanki realizacji badań próbkowych Na upowszechnienie się badań próbkowych wpływ wywarły w ostatnich dziesięcioleciach zarówno postępy w teorii statystyki i rozwoju odpowiedniego oprogramowania, jak i ogólne przyspieszenie tempa życia i oczekiwań szybkich wyników przez zlecających badania 1. W stosunku do badań pełnych (wyczerpujących) atutem badań próbkowych są niższe koszty, a także na co nie zawsze wystarczająco zwraca się uwagę większa ich efektywność, jeżeli mierzyć ją stosunkiem jakości wyników (ich wiarygodności i precyzji) do poniesionych nakładów. Jest tak dlatego, że wśród kilku kategorii błędów, jakimi są 1 Statystyki GUS są opóźnione zwykle o ponad miesiąc, a jeśli chodzi o dane szczegółowe o kilka miesięcy. Dziś wiedza o tym, co się działo przed kilku miesiącami, jest prehistorią (W. Gadomski [2009], s. 22). Copyright StatSoft Polska 2011, info@danewiedzasukces.pl 5
2 obciążone wyniki prawie każdego badania statystycznego, w badaniach próbkowych pojawia się tylko jedna dodatkowa kategoria błędu błąd losowania (ang. sampling error). Poza błędem losowania istnieją cztery inne kategorie błędów, którymi mogą być obciążone wyniki, zarówno badań wyczerpujących, jak i niewyczerpujących. Są to: błąd pokrycia jednostek badanej zbiorowości przez operat losowania (ang. coverage error), który może być wynikiem wykorzystania w badaniu nieaktualnego lub niekompletnego spisu jednostek populacji; błąd spowodowany brakiem odpowiedzi respondentów (ang. nonresponse error); błąd pomiaru (ang. measurement error), związany z zarejestrowaniem nieprawdziwych informacji o badanym respondencie; błąd przetwarzania zebranych danych statystycznych (ang. postsurvey processing error). W stosunku do błędu losowania, który najczęściej jako jedyny w postaci skwantyfikowanej zostaje przypisany wynikom badania próbkowego, inne błędy mogą znacznie bardziej zniekształcać ostateczne rezultaty, bez względu na to, czy obserwacji poddano wszystkie jednostki populacji, czy tylko ich reprezentację. Błąd pokrycia odgrywa tu szczególną rolę, gdyż od jakości odwzorowania populacji w operacie losowania zależy rzeczywisty dostęp badacza do populacji docelowej (ang. target population). W tym zakresie nawet organa statystyki publicznej, które jak mogłoby się wydawać powinny mieć dobrej jakości rejestry pełniące funkcje operatów, nie zawsze są w stanie sprostać wymogom jakościowym w tym zakresie. Wydaje się, że obecność błędów pokrycia w badaniach statystycznych GUS była dostrzegana dość dawno, ale stanowiły one problem wstydliwy, o którym oficjalnie nie pisano. J. Paradysz [2010], s. 52 Tym bardziej trudno jest o dostęp do kompletnego i aktualnego operatu w badaniach wykonywanych przez mniejsze podmioty na rynku, mające skromniejsze zasoby i możliwości. Dotyczy to m.in. badań opinii społecznej realizowanych drogą telefoniczną. W wielu przypadkach można mieć uzasadnione obawy co do kompletności operatu w takich sondażach. Ważne jest jednak to, że błąd pokrycia nie jest wyłączną specyfiką badań próbkowych. Podobnie rzecz się ma z błędem braków odpowiedzi części respondentów odmawiających współpracy. Wystąpienie znacznej liczby odmów może prowadzić do systematycznego obciążenia wyników badania. I nawet w tak ważnych badaniach, jak spisy powszechne, trudno jest błędy te wyeliminować: Błędy systematyczne w narodowych spisach powszechnych są znacznie większe niż się nam dotychczas wydawało. J. Paradysz [2010], s. 63 W badaniach ankietowych i sondażowych jest to współcześnie ten rodzaj błędów, który sprawia najwięcej trudności statystykom. Odmów jest w wielu badaniach poważny 6 Copyright StatSoft Polska 2011, info@danewiedzasukces.pl
3 odsetek 2, a ich skutków nie niweluje zwiększenie liczebności próby. Błąd, jaki generują braki odpowiedzi, może znacznie przewyższać typową wielkość błędu losowania. Wskazując zatem na przesłanki badań próbkowych, warto zaznaczyć, że towarzyszący tym badaniom błąd losowania bywa często najmniejszym składnikiem całkowitego błędu, którym obciążone są wyniki badań statystycznych. W tym kontekście wyzwaniem dla statystyków jest z jednej strony lepsze poznanie natury i wielkości błędów nielosowych, a z drugiej doskonalenie sposobów minimalizacji skutków tych błędów. Już przed ponad pół wiekiem niektórzy znani statystycy zauważali zbyt małe zainteresowanie badaczy błędami innymi niż błąd losowania. Słynny hinduski statystyk P.C. Mahalanobis w 1951 r. pisał: Ogólna postawa jest taka, że błąd nielosowy postrzega się jako coś, co nie dotyczy statystyka, a w każdym razie uważany jest za niezbyt jasną kwestię, którą statystyk nie musi się przejmować 3. Z kolei amerykański znawca technik próbkowania L. Kish twierdził, że: Błąd losowania jest nadmiernie badany 4. Pomiar błędów nielosowych, a także korekty wyników obciążonych tymi błędami (m.in. z wykorzystaniem technik imputacji i kalibracji) oba te zagadnienia wiążą się ściśle z szeroką problematyką wykorzystania informacji a priori w statystycznych badaniach próbkowych. Gromadzenie, ocena i umiejętne wykorzystanie informacji spoza próby staje się jednym z najważniejszych czynników wpływających na jakość badań próbkowych. Źródeł tych dodatkowych informacji o wielu poddawanych badaniom populacjach jest obecnie więcej, niż było kiedykolwiek w przeszłości. Ważne jest więc dostrzeżenie możliwości ich wykorzystania na wszystkich etapach badania próbkowego. Próby losowe czy nielosowe? Dla statystyka dylemat, czy próba powinna być losowa czy nielosowa, właściwie nie istnieje. Teoria klasycznego wnioskowania statystycznego oparta jest na modelu matematycznym, w którym zakłada się, że do próby dostają się jednostki wygenerowane przez mechanizm losujący, który każdej jednostce populacji daje szansę znalezienia się w próbie. Statystyka dostarcza znacznie więcej sformalizowanych narzędzi wnioskowania w sytuacji, 2 W co najmniej kilku sondażach zrealizowanych przez największe w naszym kraju instytuty badawcze w czasie ubiegłorocznej kampanii prezydenckiej udziału w badaniu odmawiało ponad 80% badanych, a były też takie, w których odmów było 93% (por. Ocena metodologii i rezultatów... [2010]). 3 In fact, the general attitude is to look upon the non-sampling error as something, which does not concern the statistician, or in any case is a kind of dirty job, which a highbrow statistician need not bother about, P.C. Mahalanobis [1951], s "Sampling error is»over-researched«". Sformułowanie to pojawiło się w interesującym artykule znanych statystyków Richarda Platka i Carla-Erika Särndala pt. "Can a statistician deliver?", opublikowanym w jęz. polskim wraz z dyskusją przez miesięcznik "Wiadomości Statystyczne" nr 4, 2001 r. Copyright StatSoft Polska 2011, info@danewiedzasukces.pl 7
4 gdy do wspomnianego modelu matematycznego może się odwołać, aniżeli wtedy, gdy próba zostaje pobrana z populacji w inny sposób. Główną zaletą prób probabilistycznych, w szczególności próby losowej prostej, jest możliwość stosowania w dalszej analizie (wnioskowaniu) zasad rachunku prawdopodobieństwa (stąd nazwa: próba probabilistyczna, ang. probability prawdopodobieństwo). Tam, gdzie nie ma próby losowej, mechanizmu losującego, czy wreszcie zdarzeń losowych, tam nie ma zastosowania klasyczny rachunek prawdopodobieństwa. Najważniejsze elementy wnioskowania statystycznego, w tym: określenie wielkości próby, interpretacja wyników estymacji i testowania hipotez, charakterystyka wielkości błędu wszystkie one w sposób bezpośredni odwołują się do prawdopodobieństwa. Oznacza to, że u samych podstaw najważniejszych aspektów wnioskowania statystycznego leży założenie o możliwości stosowania rachunku prawdopodobieństwa (założenie losowości próby badawczej). Prawdopodobieństwo otrzymuje tutaj interpretację częstościową jedną z czterech najpopularniejszych interpretacji, obok: klasycznej, logicznej i personalistycznej (subiektywnej) 5. W estymacji przedziałowej prawdopodobieństwo występuje explicite, jako poziom ufności (1-α), który interpretować należy jako częstość względną liczby przedziałów ufności pokrywających szacowany parametr populacji w wielokrotnie powtarzanych losowaniach prób, z których każda określa własne granice przedziału ufności. Gdyby tę samą procedurę wielokrotnie powtarzanych prób zastosować do technik nielosowych próbkowania, w których mechanizm generowania obserwacji w próbie nie jest losowy, to nie byłoby żadnych podstaw do zastosowania rachunku prawdopodobieństwa. W konsekwencji poziom ufności nie pozwalałby na intepretację mówiącą cokolwiek o prawdopodobieństwie popełnienia (lub niepopełnienia) błędu w przedziałowej estymacji parametru. Dlatego zastosowanie podanej wyżej interpretacji do estymacji opartej na próbach nieprobabilistycznych (nielosowych) uznać należałoby za nieupoważnione. Podobnie rzecz się ma z testowaniem hipotez statystycznych. Pojęcie prawdopodobieństwa występuje tu wprost jako poziom istotności (α) prawdopodobieństwo popełnienia błędu polegającego na odrzuceniu hipotezy, gdy w rzeczywistości jest ona prawdziwa. Prawdopodobieństwo popełnienia tego błędu jesteśmy w stanie ustalić, bo potrafimy obliczyć częstość względną nietypowych prób w długim ciągu losowań. Zwróćmy uwagę, że prawdopodobieństwo α odnosi się wyłącznie do niedoskonałości mechanizmu losującego, odpowiedzialnego za błąd losowania. Błąd losowania i przypisane mu prawdopodobieństwo nie uwzględniają niczego poza niedoskonałością samego aktu losowania. A jeżeli tak, to zrozumiałe jest, że błąd ten nie występuje tam, gdzie w ogóle losowania nie ma. W technikach nieprobabilistycznych prawdopodobieństwo to (α) nie miałoby żadnej interpretacji. Zdarzające się zastosowania teorii weryfikacji hipotez do prób nielosowych powodują, że traci się w tych warunkach możliwość określenia prawdopodobieństwa podjęcia błędnej decyzji, a także możliwość interpretacji przyjętego poziomu istotności (szerzej na ten temat w kolejnym punkcie niniejszego opracowania). 5 Szerzej na ten temat - por. Szreder [1994] i Szreder [2010]. 8 Copyright StatSoft Polska 2011, info@danewiedzasukces.pl
5 Do prawdopodobieństwa odwołujemy się także w ważnym zagadnieniu określenia niezbędnej wielkości próby badawczej. Zwróćmy najpierw uwagę na to, że pytanie: "Jak duża powinna być w danym badaniu próba?" jest niepełne i trudno jest na nie w ogóle odpowiedzieć, jeżeli nie poda się jakiegoś kryterium precyzji lub dokładności wnioskowania. Dopiero w połączeniu z takim kryterium, pytaniu o liczebność próby można nadać odpowiedni sens logiczny i sformułować je przy pomocy właściwych kategorii statystycznych. Na przykład: "Jaka powinna być liczebność próby, aby przeciętne odchylenie uzyskanych w badaniu ocen od prawdziwej wartości szacowanego parametru nie różniło się więcej niż o 2% lub o 5 jednostek miary, w której wyrażona jest badana cecha?". W badaniach reprezentacyjnych przyjęło się najczęściej stosować łącznie dwa kryteria: średniego lub maksymalnego błędu oszacowania oraz ustalonego poziomu ufności. Oba te kryteria wiążą się bezpośrednio z losowaniem próby, a nie z jakimkolwiek innym sposobem jej wyboru. Do niedawna dość powszechne było przekonanie, że techniki nielosowego doboru próby są tym gorszym wariantem, wymuszonym okolicznościami, które nie pozwalają na zastosowanie technik probabilistycznych. Sytuacja ta jednak zmienia się wraz ze wzrostem zasobów informacji, które obok obserwacji w próbie statystyk chciałby włączyć do wnioskowania. Kiedyś mógł ich nie mieć albo nie mieć do nich łatwego dostępu. Obecnie coraz rzadziej badacz znajduje się w sytuacji zupełnego braku wiedzy o badanej populacji. Najczęściej wiedzę taką, mimo że cząstkową i niedoskonałą, ma lub może mieć. I problemem nie jest to, czy ją wykorzystać, lecz jak ją wykorzystać. Jest to kluczowa sprawa dla zrozumienia zarówno coraz śmielszego odwoływania się statystyków do personalistycznej interpretacji prawdopodobieństwa, jak i coraz większej popularności prób nielosowych w badaniach niewyczerpujących. Ostatecznym bowiem celem wnioskowania statystycznego nie jest osiągnięcie doskonałości w próbkowaniu, lecz jak najlepsze poznanie badanej populacji. Gdyby mechanizm losowania próby był doskonały, to badacz nie miałby powodów, by w niego ingerować. A ingeruje coraz silniej, gdyż ma coraz bogatszą wiedzę o populacji, wiedzę użyteczną, którą pragnie włączyć do próbkowania w celu poprawy jakości wnioskowania. Ingerencja badacza w klasyczny schemat próby losowej prostej jest widoczna w powszechnie znanych schematach próbkowania, takich jak losowanie systematyczne, czy losowanie warstwowe. W tym ostatnim szczególnie dobrze widać przekonanie o niedoskonałości modelu próby losowej prostej w sytuacji, w której badacz zna (a priori) zróżnicowanie wewnętrzne populacji ze względu na cechy istotne dla celu badania. Ingerowanie zaś w mechanizm losowania to nic innego jak stopniowe jego zastępowanie wyborem opartym na informacjach apriorycznych o badanej zbiorowości. Dlatego wraz ze zwiększaniem się zasobów informacji o badanych populacjach widoczna staje się tendencja do coraz częstszego korzystania w praktyce ze schematów losowania nieprostego 6, a także z technik nielosowego doboru próby, takich jak wybór kwotowy. Gdy o wielokrotnie badanej populacji badacz ma stosunkowo bogatą wiedzę, to kwotowy (nieprobabilistyczny) wybór 6 O wnioskowaniu dla prób nieprostych w wielu swoich pracach pisze prof. Cz. Domański wraz z zespołem, por. np. Cz. Domański i K. Pruska [2000]. Copyright StatSoft Polska 2011, info@danewiedzasukces.pl 9
6 próby może się okazać lepszy od schematów probabilistycznych. Ilustracją tego niech będzie stwierdzenie znanego brytyjskiego ośrodka badania opinii i rynku MORI o tym, że wybór kwotowy jest nie tylko najpowszechniej stosowany w Wielkiej Brytanii ("most polls in Britain use quota sampling which pre-determines the demographic make-up of the sample to ensure it matches the profile of the whole adult population"), ale także efektywność tej techniki wyboru okazywała się dotychczas większa niż efektywność technik probabilistycznych ("Historically in Britain, the record of quota samples in predicting elections has been better than that of random samples") 7. Zaobserwowane prawidłowości w próbie nielosowej można odnieść do zbiorowości, której próba ta jest reprezentantem, jednakowoż bez przypisywania im wielkości błędu lub prawdopodobieństw ich prawdziwości. W praktyce ośrodki badawcze stosujące tę grupę technik próbkowania, jeżeli tylko doświadczenia ich są wystarczająco bogate, odwołują się do danych z przeszłości i do wiedzy ekspertów, aby w sposób skwantyfikowany określić błąd, jaki może wynikać z posłużenia się w opisie populacji informacjami z próby (błąd próbkowania). Weryfikacja hipotez statystycznych W statystycznej teorii weryfikacji hipotez, której twórcami są E.S. Pearson i J. Neyman, sprawdzaną hipotezę nazywa się hipotezą zerową i oznacza się przez H 0. Równolegle formułuje się konkurencyjną wobec niej tzw. hipotezę alternatywną (H 1 ), która w przeciwieństwie do hipotezy zerowej ma najczęściej charakter złożony. Oznacza to, że hipoteza alternatywna nie określa jednej wartości parametru populacji, którego dotyczy wnioskowanie, lecz dopuszcza różne jego wartości, inne od tej, którą zawiera hipoteza zerowa. Na przykład: hipoteza zerowa stwierdza, że współczynnik korelacji między dwiema cechami w populacji jest równy zero, a hipoteza alternatywna głosi, że współczynnik ten jest większy od zera (czyli przyjąć może jedną z nieskończonej liczby wartości większych od zera, lecz nie równą zero). Mimo że hipotezą sprawdzaną (testowaną) jest hipoteza zerowa, to formułowana jest ona w taki sposób, aby dowieść jej nieprawdziwości. Jest to jedna z kluczowych kwestii w dobrym rozumieniu teorii wnioskowania statystycznego. Aby dowieść istnienia statystycznie istotnej korelacji między dwiema cechami, stawia się hipotezę, że współczynnik korelacji między tymi cechami jest równy zero. Odrzucenie tej hipotezy (stwierdzenie jej nieprawdziwości) stanowi statystyczny dowód na to, że między badanymi cechami istnieje istotna zależność korelacyjna. Podobnie jest w przypadku hipotez nieparametrycznych, odnoszących się nie do parametrów, lecz pewnych atrybutów populacji. Aby dowieść, że między dwiema cechami w populacji istnieje współzależność, sprawdzaną hipotezę formułuje się na zasadzie zaprzeczenia, tj. że analizowane cechy są niezależne. Także tutaj odrzucenie sprawdzanej hipotezy w oparciu o wynik próby losowej będzie statystycznym dowodem na to, że cechy te są zależne. 7 Fakt ten potwierdza także Worcester R.M. [1991], s Copyright StatSoft Polska 2011, info@danewiedzasukces.pl
7 Procedura weryfikacji hipotez statystycznych zakłada, że hipoteza zerowa jest dotąd prawdziwa, dopóki nie znajdą się silne przesłanki każące wątpić w jej prawdziwość 8. Jedynym źródłem możliwych przesłanek mogą być w klasycznym ujęciu informacje pochodzące z próby losowej. Odrzucenie testowanej hipotezy następuje wówczas, gdy bardzo małe jest prawdopodobieństwo wystąpienia (realizacji) zaobserwowanej próby, przy założeniu że prawdziwa jest hipoteza zerowa. Na przykład, jeżeli hipoteza H 0 głosi, że w populacji średni wzrost osób wynosi 177 cm, a z próby losowej uzyskano średni wzrost 155 cm, to możemy albo przyjąć, że zrealizowało się zdarzenie o bardzo małym prawdopodobieństwie (wylosowano nietypową próbę zdominowaną przez najniższe osoby z tej populacji), albo że hipoteza zerowa jest nieprawdziwa 9. Jeżeli mielibyśmy uznać, że realizacja próby była zdarzeniem o prawdopodobieństwie mniejszym od pewnego minimalnego (np. 0,01), to skłonni jesteśmy raczej odrzucić hipotezę zerową, czyli stwierdzić, że jest nieprawdziwa. Podejmując decyzję o odrzuceniu H 0, możemy jednak popełnić błąd, gdy hipoteza ta będzie w rzeczywistości prawdziwa. Na szczęście znamy prawdopodobieństwo popełnienia takiego błędu. Odrzucenie sprawdzanej hipotezy, gdy jest ona prawdziwa, oznacza, że zrealizowała się próba losowa o prawdopodobieństwie mniejszym od. Jeżeli =0,01, to próba taka zdarzać się będzie nie częściej niż średnio jeden raz na sto prób. Podejmując decyzję o odrzuceniu (stwierdzeniu nieprawdziwości) hipotezy zerowej, wiemy, z jakim prawdopodobieństwem może to być decyzja błędna. Nie tylko znamy to prawdopodobieństwo, ale sami jego wielkość ustalamy. Posługujemy się więc procedurą, która może być zawodna z prawdopodobieństwem nie większym niż. Jeżeli zastosowanie testu statystycznego dla danego zbioru obserwacji w próbie nie prowadzi do odrzucenia hipotezy zerowej, to właściwą w tych okolicznościach decyzją jest stwierdzenie, że brak jest podstaw do odrzucenia H 0. Innymi słowy próba nie dostarczyła wystarczających przesłanek do odrzucenia sprawdzanej hipotezy. Z kolei brak przesłanek do stwierdzenia nieprawdziwości hipotezy H 0 nie oznacza dowodu na jej prawdziwość. W teorii wnioskowania statystycznego nie istnieje konkluzja o stwierdzeniu prawdziwości hipotezy zerowej, a jedynie o braku podstaw do uznania jej za nieprawdziwą. Nie są to kategorie tożsame 10. Wyjaśnienie, dlaczego empiryczne badanie nie może stanowić podstawy do stwierdzenia prawdziwości testowanej hipotezy, ma podstawy logiczne, statystyczne i filozoficzne. Logiczne uzasadnienie podanej wyżej tezy wymaga przypomnienia, że w procedurze weryfikacji hipotez statystycznych jednym z ważnych etapów jest przyjęcie założenia o prawdziwości hipotezy H 0. Przy założeniu, że sprawdzana hipoteza jest prawdziwa, następuje 8 A null hypothesis is regarded as valid unless the evidence suggests that it is not true, J. Kmenta [1990], s Por. także Cz. Domański [1990]. 9 Zauważmy, że im większa liczebnie będzie próba, a także im mniejsze rozproszenie (dyspersja) wzrostu osób w tej populacji, tym trudniej będzie zaakceptować tak duże (22 cm) odchylenie średniej w próbie od średniej w populacji. 10 W jęz. angielskim do wyrażenia tej myśli używa się powszechnie stwierdzenia absence of evidence is not evidence of absence. Brak dowodów (np. współzależności cech) nie jest dowodem braku (współzależności tych cech). Copyright StatSoft Polska 2011, info@danewiedzasukces.pl 11
8 obliczenie zarówno wartości statystyki testowej, jak i wyznaczenie prawdopodobieństwa krytycznego (ang. p-value) 11. Dopuszczenie możliwości stwierdzenia prawdziwości hipotezy zerowej w wyniku zastosowania procedury testowania prowadziłoby do następującej sprzeczności logicznej. Najpierw zakłada się, że hipoteza H 0 jest prawdziwa, stosuje się odpowiednią procedurę testową, aby w jej efekcie dojść do wniosku, że hipoteza H 0 jest prawdziwa. Ale przecież założono na wstępie, że jest prawdziwa! Warto więc powtórzyć, że: logicznej sprzeczności unika się, gdy możliwymi decyzjami w procesie weryfikacji hipotez są, albo odrzucenie sprawdzanej hipotezy, albo stwierdzenie o braku wystarczających podstaw do jej odrzucenia; rzeczywista użyteczność testowania statystycznego przejawia się przede wszystkim w możliwości stwierdzenia nieprawdziwości sprawdzanej hipotezy (odrzuceniu H 0 na rzecz konkurencyjnej hipotezy H 1 ). Statystyczne uzasadnienie niemożności stwierdzenia prawdziwości hipotezy zerowej brzmi najbardziej przekonująco w ogólniejszym kontekście wnioskowania statystycznego. Odwołamy się tu w szczególności do estymacji przedziałowej. Zwróćmy uwagę, że w większości testów parametrycznych określona statystyka testowa służy także do konstrukcji przedziału ufności dla parametru populacji, którego dotyczy wnioskowanie. Informacje uzyskane z próby pozwalają zarówno obliczyć wartość statystyki testowej, jak i skonstruować odpowiedni przedział ufności dla. Jeżeli w wyniku testowania hipotezy zerowej otrzymano wartość statystyki leżącą poza obszarem krytycznym, a więc stwierdzono brak podstaw do odrzucenia H 0 na poziomie istotności, to w kontekście estymacji oznacza to, że z dużym prawdopodobieństwem (1- ) parametr mieści się w przedziale zawierającym wartość hipotetyczną 0 (tj. wartość parametru wyspecyfikowaną w hipotezie zerowej). Innymi słowy oznacza to, że z dużym prawdopodobieństwem można twierdzić, że jedną z możliwych wartości nieznanego parametru populacji jest 0. Nie jest ona jedyną wartością (co dawałoby podstawy do stwierdzenia, że udowodniono prawdziwość H 0 : 0 ), a zaledwie jedną z nieskończonej liczby wartości mieszczących się w przedziale ufności dla. Zilustrujemy to niżej prostym przykładem. Przykład Przyjmijmy, że w populacji o rozkładzie normalnym, w której odchylenie standardowe (σ) wynosi 4, nieznana jest wartość średnia. W oparciu o losową próbę n = 16 elementów, z której obliczono średnią ( X 11), należy na poziomie istotności α = 0,10 zweryfikować hipotezę, że średnia w populacji jest równa 10. Hipotezy zerową i alternatywną sformułowano następująco: 11 Przez prawdopodobieństwo krytyczne rozumie się najmniejszą wartość poziomu istotności, na którym może być odrzucona hipoteza zerowa. 12 Copyright StatSoft Polska 2011, info@danewiedzasukces.pl
9 H 0 1 : 10 H : 10 Wartość odpowiedniej statystyki testowej Z, obliczona przy założeniu prawdziwości hipotezy zerowej, równa się: X Z n Wartość ta nie mieści się w obszarze krytycznym (, 1,64) (1,64, ), stąd właściwą decyzją jest stwierdzenie o braku podstaw do odrzucenia hipotezy H 0. Dlaczego nie jest to tożsame z uznaniem hipotezy zerowej za prawdziwą? Prezentując uzyskany wynik z próby w kontekście estymacji przedziałowej: P X z X z 1 2 n 2 n 4 4 P 11 1, , ,36 12,64 0,90 oznacza on, że z prawdopodobieństwem 90% można twierdzić, iż nieznana średnia w populacji zawiera się w przedziale (9,36; 12,64) i że prawdziwa wartość tej średniej może być dowolną liczbą z tego przedziału. Może to być także wartość 10 (ujęta w sprawdzanej hipotezie), ale nie jest ona jedyną możliwą wartością. A skoro nie jedyną, to nie możemy twierdzić, że wskazana w hipotezie wartość jest prawdziwa, gdyż wykluczałoby to prawdziwość jakiejkolwiek innej wartości z przedziału (9,36; 12,64). Głównym powodem tego, że wynik z próby losowej nie rozstrzyga o prawdziwości hipotezy określającej konkretną wartość parametru populacji, jest niedoskonałość mechanizmu losowania. Każda technika losowania jest obciążona błędem losowania, sprawiającym, że uzyskana próba prawie nigdy nie jest doskonałą reprezentacją populacji. Wynik z próby, który prowadzi do stwierdzenia braku podstaw do odrzucenia sprawdzanej hipotezy statystycznej, nie jest dowodem prawdziwości tej hipotezy. Analogiczne do tego rozumowanie jest szeroko stosowane także w odniesieniu do hipotez naukowych. W obu przypadkach hipotez statystycznych i hipotez naukowych podkreśla się niemożność udowodnienia prawdziwości hipotezy na podstawie cząstkowych (próbkowych) danych empirycznych. Żadna liczba białych łabędzi nie ustala tego, że wszystkie łabędzie są białe pisze Karl Popper [1995], (s. 121) 12. Oczywiście, obserwacje empiryczne (także statystyczne) mogą potwierdzać pewne hipotezy lub je wspierać, ale znaczenie takiego 12 Podobne stwierdzenie przypisuje się też Einsteinowi: Żadna liczba eksperymentów nie przekona mnie, że mam rację; jeden eksperyment może udowodnić, że nie mam racji (na podst. A. Calaprice [2005], s. 291). Copyright StatSoft Polska 2011, info@danewiedzasukces.pl 13
10 faktu jest dla nauki mniejsze niż wykazanie nieprawdziwości (falsyfikacja) hipotezy. W codziennym życiu bywa odmiennie. Staramy się niekiedy poszukiwać faktów lub interpretować je w taki sposób, aby potwierdzały nasze pierwotne przekonania (nasze hipotezy). Zjawisko to nazywane jest pozytywnym testowaniem hipotez (ang. positive hypothesis testing) i ściśle łączone jest z tzw. błędem konfirmacji (ang. confirmation bias), por. M.H. Bazerman, D. Moore [2009]. Błąd ten polega na poszukiwaniu i przetwarzaniu tylko tych informacji, które potwierdzają postawioną hipotezę, z jednoczesnym pomniejszaniem znaczenia obserwacji, które hipotezie tej przeczą. W nauce tego typu skłonność prowadzić może do nierzetelnych lub fałszywych wyników. Analogią z zakresu wnioskowania statystycznego byłoby postępowanie, którego celem jest zwiększanie liczebności próby dla wzmocnienia siły argumentacji o prawdziwości hipotezy zerowej. Tymczasem, jak stwierdziliśmy wcześniej, nawet przy bardzo dużej próbie nie da się wykazać prawdziwości sprawdzanej hipotezy, a jedynie pokazać, iż próba wspiera tę hipotezę (nie daje przesłanek do jej odrzucenia). Statystyk, filozof, psycholog wszyscy oni zainteresowani są takim formułowaniem hipotez, których fałszywość można udowodnić materiałem empirycznym i w ten sposób potwierdzić hipotezę konkurencyjną (alternatywną). Literatura 1. Bazerman M.H., Moore D., [2009], Judgment in managerial decision making, (7 th edition), J. Wiley. 2. Calaprice, A., [2005], The new quotable Einstein, Princeton University Press. 3. Domański Cz., [1990], Testy statystyczne, PWE, Warszawa. 4. Domański Cz., K. Pruska, [2000], Nieklasyczne metody statystyczne, PWE, Warszawa. 5. Gadomski W., [2009], Polska w globalnej lawinie, Gazeta Wyborcza z Glass D.J., Hall N., [2008], A brief history of the hypothesis, Cell vol. 134, no Kmenta J., [1990], Elements of econometrics, Macmillan Publishing Company, New York. 8. Mahalanobis P.C., [1951], Professional Training in Statistics, Bulletin of the International Statistical Institute, vol. 33, no Ocena metodologii i rezultatów badań poprzedzających pierwszą i drugą turę wyborów prezydenckich 2010 roku, [2010], Raport Komisji pod przew. prof. H. Domańskiego, Wyd. OFBOR, Warszawa. 10. Paradysz J., [2010], Konieczność estymacji pośredniej w spisach powszechnych, [w:], E. Gołata (red.), Pomiar i informacja w gospodarce, Zeszyty Naukowe nr 149, Uniwersytet Ekonomiczny w Poznaniu, s Popper K.R., [1995], Mit schematu pojęciowego. W obronie nauki i racjonalności, Książka i Wiedza, Warszawa. 12. Szreder M., [1994], Informacje a priori w klasycznej i bayesowskiej estymacji modeli regresji. Wydawnictwo Uniwersytetu Gdańskiego. 14 Copyright StatSoft Polska 2011, info@danewiedzasukces.pl
11 13. Szreder M., [2010], Metody i techniki sondażowych badań opinii, (wyd. II zmienione), PWE, Warszawa. 14. Worcester R.M., [1991], British Public Opinion. A Guide to the History and methodology of Political Opinion Polling. Basil Blackwell, London. Copyright StatSoft Polska 2011, info@danewiedzasukces.pl 15
DYDAKTYKA I NAUKA MIROSŁAW SZREDER LOSOWE I NIELOSOWE PRÓBY W BADANIACH STATYSTYCZNYCH WPROWADZENIE
PRZEGLĄD STATYSTYCZNY R. LVII ZESZYT 4 2010 DYDAKTYKA I NAUKA MIROSŁAW SZREDER LOSOWE I NIELOSOWE PRÓBY W BADANIACH STATYSTYCZNYCH WPROWADZENIE Jednym z istotnych etapów projektowania badania próbkowego
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Rola badań statystycznych w naukach ekonomicznych w świetle nowych możliwości określanych mianem big data
Mirosław Szreder Katedra Statystyki Wydział Zarządzania Uniwersytet Gdański miroslaw.szreder@ug.edu.pl Rola badań statystycznych w naukach ekonomicznych w świetle nowych możliwości określanych mianem big
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)
Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
WNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Przypuśdmy, że mamy do czynienia z następującą sytuacją: nieznany jest rozkład F rządzący pewnym zjawiskiem losowym. Dysponujemy konkretną próbą losową ( x1, x2,..., xn
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
STATYSTYKA INDUKCYJNA. O sondażach i nie tylko
STATYSTYKA INDUKCYJNA O sondażach i nie tylko DWA DZIAŁY ESTYMACJA Co na podstawie wyników z próby mogę powiedzieć o wynikach w populacji? WERYFIKACJA HIPOTEZ Czy moje przypuszczenia uczynione przed badaniami
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
Hipotezy statystyczne
Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Hipotezy statystyczne
Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA
Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Testowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść II
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść II Szkic wykładu 1 Wprowadzenie 2 3 4 5 Weryfikacja hipotez statystycznych Obok estymacji drugim działem wnioskowania statystycznego jest weryfikacja hipotez
Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów
Wstęp do probabilistyki i statystyki Wykład 4. Statystyki i estymacja parametrów dr hab.inż. Katarzyna Zakrzewska, prof.agh, Katedra Elektroniki, WIET AGH Wstęp do probabilistyki i statystyki. Wykład 4
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy
Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2017/2018 STATYSTYKA
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15
VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Wykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Zadania ze statystyki cz.8. Zadanie 1.
Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Kilka uwag o testowaniu istotności współczynnika korelacji
341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności
Kontekstowe wskaźniki efektywności nauczania - warsztaty
Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Aktualizacja 2017 Plan wykładu 1. Metody wnioskowania statystycznego vs. metody opisu 2. Testowanie hipotez
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
TESTOWANIE HIPOTEZ STATYSTYCZNYCH
TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Grupowanie materiału statystycznego
Grupowanie materiału statystycznego Materiał liczbowy, otrzymany w wyniku przeprowadzonej obserwacji statystycznej lub pomiaru, należy odpowiednio usystematyzować i pogrupować. Doskonale nadają się do
a. opisać badaną cechę; cechą X jest pomiar średnicy kulki
Maszyna ustawiona jest tak, by produkowała kulki łożyskowe o średnicy 1 cm. Pomiar dziesięciu wylosowanych z produkcji kulek dał x = 1.1 oraz s 2 = 0.009. Czy można uznać, że maszyna nie rozregulowała
12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez
Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s
STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych
STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH Co to są hipotezy statystyczne? Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej. Dzielimy je
Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres