ANALIZA MOCY TESTU I JEJ ZNACZENIE W BADANIACH EMPIRYCZNYCH
|
|
- Jadwiga Głowacka
- 8 lat temu
- Przeglądów:
Transkrypt
1 ANALIZA MOCY TESTU I JEJ ZNACZENIE W BADANIACH EMPIRYCZNYCH Grzegorz Harańczyk i Jerzy Gurycz, StatSoft Polska Sp. z o.o. Planując badania empiryczne, badacz coraz częściej nie ogranicza się jedynie do postawienia hipotez, których prawdziwość będzie weryfikował, oraz ustalenia poziomu istotności wyniku, ale także planuje, jak duży efekt uzna za zadowalający i jaką chce uzyskać moc testu. W praktyce moc testu oznacza prawdopodobieństwo podjęcia na podstawie testu decyzji o istnieniu efektu, gdy on rzeczywiście istnieje. Analiza mocy testu daje wymierne korzyści, nie tylko w wynikach badań, ale także w nakładach na nie. Dowody potwierdzające tę tezę zostaną zaprezentowane na przykładzie zastosowania analizy mocy testu w poszukiwaniu nowych leków. Zagadnienie analizy mocy testu Badacz podczas swojej pracy stawia pytania i przypuszczenia, następnie formułuje hipotezy, a przeprowadzając eksperymenty i badania, stara się je zweryfikować. Jednym z głównych zadań statystyki jest właśnie dostarczenie narzędzi do weryfikacji różnego rodzaju hipotez statystycznych, czyli przypuszczeń i sądów dotyczących badanego zjawiska. Planując badanie, należy odpowiedzieć sobie na wiele pytań: Jaką dokładność oceny interesującego nas parametru otrzymamy, przy próbie o danej wielkości?, Jak duże jest prawdopodobieństwo, że decyzja podjęta na podstawie testu jest prawidłowa?, czyli Jak duże zaufanie możemy mieć do wyników naszych badań? albo Jak duża musi być próbka, by osiągnąć zamierzony poziom dokładności?. Zadaniem analizy mocy testu i oceny liczności prób jest właśnie udzielanie odpowiedzi na tak postawione pytania. W dalszej części pokrótce przedstawimy istotę testów statystycznych oraz analizy mocy testu. Następnie zagadnienie to zostanie zilustrowane przykładem rzeczywistej analizy wykonanej dla jednej z firm zajmujących się poszukiwaniem nowych leków. Rozpatrywany problem jest problemem dość uniwersalnym i często spotykanym w badaniach empirycznych. Przykład prezentuje kilka aspektów pracy badawczej, ze szczególnym zwróceniem uwagi na błędy II rodzaju popełniane podczas testowania hipotez statystycznych. W opisanym przykładzie te błędy mają kluczową rolę. Problem badawczy polega na tym, że znając skład chemiczny związków, nie sposób dokładnie przewidzieć ich działania, Copyright StatSoft Polska
2 często brak jest wiedzy o mechanizmach powodujących takie, a nie inne ich działanie na organizmach żywych. Rodzi to potrzebę wsparcia badań teoretycznych badaniami eksperymentalnymi. W tym wypadku badania takie polegają na przeszukiwaniu ogromniej ilości związków i porównywaniu ich działania na wybrane interesujące nas parametry biochemiczne. Podczas kolejnych etapów przeprowadzana jest selekcja i w kręgu zainteresowań pozostaje coraz mniej substancji i tak aż do fazy badań klinicznych. Przy takim badaniu pojawiają się dwa skrajnie różne cele: z jednej strony mamy wyeliminować jak najwięcej związków nieaktywnych, a z drugiej nie przegapić żadnego potencjalnego leku. Wyniki przedstawione w dalszej części są fragmentem wyników pewnego wstępnego etapu takich badań. Zgodnie ze światowymi standardami poszukiwania nowych leków ich celem było wyselekcjonowanie spośród kilkudziesięciu branych pod uwagę związków kilkunastu, które weszły do dalszych badań in-vivo. Przy analizowaniu tak ogromniej ilości związków nie można sobie pozwolić na dowolne zwiększenie liczności próby, bo wiązałoby się to z ogromnymi kosztami. Z drugiej strony być może warto zwiększyć liczbę osobników o kilka w celu podniesienia mocy testu. Istotna jest także wiedza, czy nasza procedura badawcza zawodzi, a jeśli tak, to jak często. Szczególnie ważna jest dla nas ocena ryzyka eliminowania z dalszych badań substancji aktywnych, które z jakichś powodów nie zostały uznane za dające efekt. Na te pytania postaramy się znaleźć odpowiedź w dalszej części, a teraz przejdźmy do przypomnienia zasad testowania hipotez statystycznych. Podstawy teoretyczne W kontekście testowania istotności statystycznej spotykamy się z dwiema sytuacjami, odrzucająco-potwierdzającą (OP) oraz przyjmująco-potwierdzającą (PP). My skupimy się w naszych rozważaniach na testowaniu odrzucająco-potwierdzającym, czyli sytuacji, gdy hipoteza zerowa jest przeciwieństwem tego, co badacz chciałby wykazać. W przypadku klasycznej metodyki testowania hipotez statystycznych mamy do czynienia z dwoma błędami, których prawdopodobieństwa tradycyjnie oznacza się jako α i β. Przypomnijmy, że α jest prawdopodobieństwem popełnienia błędu I rodzaju, czyli błędnego odrzucenia hipotezy zerowej, gdy jest ona w rzeczywistości prawdziwa. W kontekście badań, których celem jest wykrycie zróżnicowania (istnienie zróżnicowania nazywać będziemy istnieniem efektu), popełnienie błędu pierwszego rodzaju oznacza stwierdzenie (błędne) na podstawie testu istnienia efektu dla substancji, która tak naprawdę tego efektu nie daje. Wielkość β oznacza prawdopodobieństwo popełnienia błędu drugiego rodzaju, czyli błędu polegającego na nieodrzuceniu fałszywej hipotezy zerowej. W kontekście badania istnienia efektu popełnienie tego błędu oznacza nieodrzucenie hipotezy zerowej, podczas gdy należy ją odrzucić, czyli stwierdzenie (na podstawie testu) braku efektu, podczas gdy efekt istnieje. W badaniach opisanych w przykładzie przekłada się to na niewykrycie działającej substancji. Beta można obliczyć jedynie dla konkretnej hipotezy alternatywnej, czyli dla konkretnej wielkości efektu Copyright StatSoft Polska 2006
3 Rzeczywistość Decyzja H 0 H 1 H 0 Poprawne przyjęcie Błąd II rodzaju β H 1 Błąd I rodzaju α Poprawne odrzucenie Moc testu statystycznego to 1-β, czyli prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona fałszywa. W praktyce moc testu oznacza prawdopodobieństwo podjęcia na podstawie testu decyzji o istnieniu efektu, gdy on rzeczywiście istnieje. Moc testu zależy od konkretnych ustawień testu (w większości testów od obszaru krytycznego statystyki testowej, który to z kolei zależy od liczności próby, rozproszenia wyników w próbie, przyjętego poziomu istotności α i przyjętych w teście założeń) oraz od wielkości efektu, którego wykrycie interesuje badacza (ta wielkość jest często określana jako efekt standaryzowany). Podobnie jak β, moc można policzyć tylko dla konkretnej alternatywy, czyli dla konkretnej wielkości efektu. Oznacza to, że w praktyce celowe jest rozpatrywanie złożonych hipotez alternatywnych postaci H 1 : µ 1 > µ 2 (jednostronne), czyli wielu alternatyw naraz. Dla takiej złożonej hipotezy alternatywnej często hipotezę zerową zapisujemy jako H 0 : µ 1 µ 2, taki zapis hipotezy zerowej nie ma co prawda uzasadnienia matematycznego (hipoteza zerowa musi być w postaci równości, by dało się obliczyć rozkład statystyki testowej i oceniać prawdopodobieństwa), jednak taki zapis jest powszechnie stosowany. Jeszcze raz należy podkreślić, że moc można obliczyć tylko dla konkretnych wartości testowanego efektu. Procedura testowania Należy jeszcze raz podkreślić, że my nie badamy prawdziwości hipotez, a jedynie to, która jest bardziej prawdopodobna. Podejmowanie decyzji na podstawie prawdopodobieństwa niesie ze sobą powszechne ryzyko popełniania błędów, dobrze jest więc rozumieć konsekwencje tych błędów, aby mieć nad nimi kontrolę. I tak błąd I rodzaju, oznaczający błędne potwierdzenie tezy badacza, może spowodować podjęcie inwestycji i wysiłków, a co najmniej dalszych badań, które nie mają szans powodzenia. Błąd II rodzaju w tym sposobie stawiania hipotez, jest bardzo niekorzystny dla badacza, gdyż jego słuszne przewidywania nie zostały potwierdzone jedynie na skutek losowego błędu. Z punktu widzenia badacza zmniejszenie ryzyka popełnienia błędu drugiego rodzaju powinno być może nawet istotniejsze. Zwykle przyjmuje się, że częstość popełniania błędu I rodzaju, oznaczana przez α, powinna wynosić co najwyżej 0,05, przy czym częstość β popełniania błędu II rodzaju również nie powinna być duża. Moc testu statystycznego, definiowana jako 1-β, powinna być wysoka. Powinna wynosić co najmniej 0,8, aby zapewnić wykrycie znaczących odstępstw od Copyright StatSoft Polska
4 hipotezy zerowej. Podane wartości są tylko umownie przyjęte, niezwykle ważną rzeczą jest rozumienie ich znaczenia i konsekwencji, jakie niesie ich zmiana. W większości typowych sytuacji analitycznych postępowanie przy ocenie mocy testu i wymaganej liczności próby jest takie samo. Po sformułowaniu problemu, wybraniu typu hipotezy ustalamy wartość parametru odpowiadającą hipotezie zerowej. Następnie sprawdzamy moc i liczność próby dla rozsądnego zakresu spodziewanej wielkości efektu. Kolejnym krokiem może być obliczenie wielkości próby wymaganej do wykrycia efektu o sensownej wielkości (tzn. odchyleniu od hipotezy zerowej) i przy rozsądnej mocy testu. W przypadku niezadowalających wyników można spróbować tak zmienić parametry analizy i sposób jej przeprowadzania, aby zwiększyć moc testu. Jest kilka czynników znacznie wpływających na moc testów. Jednym z podstawowych jest sam test, który jest wykonywany. Niektóre testy statystyczne mają ze swojej natury większą moc niż inne. Kolejnym ważnym czynnikiem jest liczność próby oraz wielkość spodziewanego efektu. W ogólności im większa próba, tym większa moc testu. Jednak czasem pomiary są drogie i czasochłonne, konieczne jest więc znalezienie liczności, która będzie wystarczająco duża i nie będzie prowadziła do marnowania środków. Jeśli chodzi zaś o wielkość efektu, to jeżeli hipoteza zerowa jest zdecydowanie błędna, to moc testu będzie większa niż przy niewielkich rozbieżnościach. Czynnikiem, nad którym nie mamy bezpośrednio kontroli, są błędy pomiarowe i populacyjne odchylenie standardowe. Zawsze istnieje pewien wkład szumu pomiarowego zaciemniającego sygnał pochodzący od realnego, poszukiwanego efektu. Każda poprawa dokładności pomiarów i staranności prowadzenia badań poprawia moc testu. Kontrolować moc testu możemy natomiast poprzez poziom istotności α. Im większe jest α, tym większa jest moc testu, oczywiście w niektórych sytuacjach nie możemy pozwolić sobie na zwiększenie ryzyka popełniania błędów I rodzaju. Przykład zastosowania Zasadniczym celem badań opisanych we wstępie była ocena statystycznej istotności zróżnicowania przeciętnego poziomu stężeń badanych parametrów biochemicznych przy stosowaniu placebo, leku referencyjnego i badanych związków. Działanie badanych związków oceniano na podstawie porównań ze związkiem referencyjnym, którym był lek o znanym działaniu. Badano następujące parametry biochemiczne: glukoza; trójglicerydy; cholesterol; frakcję HDL ( dobry cholesterol ); frakcję LDL ( zły cholesterol ). Pożądanym działaniem badanych związków jest modyfikowanie poziomu tych parametrów (ocena efektu hipoglikemizującego i wpływu na profil lipidowy). My dla potrzeb naszego 62 Copyright StatSoft Polska 2006
5 przykładu zawęzimy się do poziomu glukozy i frakcji LDL, a będziemy porównywać jedynie działanie związku A ze związkiem referencyjnym. Badania starannie przygotowano i przeprowadzono na specjalnie wyselekcjonowanych myszach. W analizowanej serii badania przeprowadzono na 6 grupach doświadczalnych, liczebność grup wynosiła po 10 osobników. W każdej grupie podawano myszom inną substancję według następującego schematu: numer myszy liczba zwierząt badany związek Placebo Związek REF Związek A Związek B Związek C Związek D Substancje podawano codziennie przez 13 dni. Po upływie tego czasu oznaczono stężenie glukozy, trójglicerydów, cholesterolu całkowitego oraz jego frakcji HDL i LDL. Otrzymane wyniki zestawiono w arkuszu danych. Opis danych Zbiór danych zawierał 60 przypadków oraz 6 zmiennych. Copyright StatSoft Polska
6 Najpierw oceniano szczegółowo wyniki oznaczeń badanych parametrów krwi pod kątem odstających obserwacji. Na podstawie położenia punktów na wykresie rozrzutu podejmowano decyzję o ewentualnym odrzuceniu odstających punktów. Za odstające uznano pomiary, które w zdecydowany sposób odbiegały od pozostałych (ich nieodrzucenie mogłoby powodować przeszacowanie lub niedoszacowanie przeciętnego poziomu danej substancji w badanej grupie zwierząt). Odrzucanie obserwacji w przypadku tak małych prób musi być jednak dokonywane bardzo ostrożnie, ponieważ może przynieść odwrotny od zamierzonego efekt. Dla tak przygotowanych danych utworzono wykresy danych surowych mające na celu ułatwienie porównań międzygrupowych. Poniżej znajduje się wykres danych surowych z zaznaczonymi średnimi dla poziomu frakcji LDL dla badanych związków i placebo (na wykresie nie ma już obserwacji odstających). Wykres ten pozwala dokładnie prześledzić różnice, zarówno pod kątem zróżnicowania przeciętnego poziomu stężenia badanego parametru w poszczególnych grupach porównawczych, jak również rozrzutu surowych wyników w obrębie grup Frakcja LDL Placebo ZWIĄZEK REF ZWIĄZEK A ZWIĄZEK B ZWIĄZEK C ZWIĄZEK D Średnia Dane surowe Lek Cel analizy Chcemy sprawdzić, czy średni poziom stężenia badanych wskaźników (cholesterol, glukoza, LDL) jest niższy w grupie, w której myszy traktowano badanym związkiem, w porównaniu do średniego poziomu w grupie, w której podawano lek referencyjny µ BADANY < µ REF. Tezą naszych badań jest po prostu sprawdzenie, czy któryś z badanych związków obniża interesujące nas parametry biochemiczne bardziej niż lek referencyjny. Hipoteza zerowa będzie więc zaprzeczeniem naszej tezy, toteż H 0 : µ BADANY µ REF. Hipoteza ta będzie testowana dla każdej z badanych substancji Copyright StatSoft Polska 2006
7 Do analizy różnic pomiędzy wartościami średnich uzyskanych w wyniku przeprowadzenia oznaczeń w surowicach myszy traktowanych zawiesiną kontrolną (lek referencyjny) i badanymi związkami wykorzystano test t dla zmiennych niezależnych. Test t jest powszechnie stosowaną metodą oceny różnic między średnimi w dwóch grupach. Mogą to być próby niezależne (np. sprawdzenie różnicy ciśnienia krwi w grupie pacjentów poddanych działaniu jakiegoś leku w stosunku do grupy otrzymujących placebo) lub zależne (np. sprawdzenie różnicy ciśnienia krwi u pacjentów przed i po podaniu leku). Teoretycznie test t może być stosowany także w przypadku bardzo małych prób, jedynym warunkiem jest normalność rozkładu zmiennych oraz brak istotnych różnic między wariancjami. Badane przez nas dane spełniają te założenia, jednak wstępne wyniki analiz nie były jednoznaczne. W wielu przypadkach nie było podstaw do odrzucenia hipotezy zerowej, czyli uznania któregoś ze związków za lepszy niż związek referencyjny. Nasz test nie wykrywa efektów działania badanych substancji, a jego celem było wyselekcjonowanie kilkunastu związków do dalszych badań. Istnieje obawa, że niektóre ze związków nie działają z jakichś przyczyn w badanych warunkach lub ich działanie na tak małej próbie nie dało zauważalnego efektu lub zostało stłumione przez błędy losowe. Odrzucając dany związek, chcemy mieć czyste sumienie, być w miarę możliwości pewni, że nie straciliśmy szans na wykrycie dobrze działającego leku. Celem dalszej analizy stało się więc obliczenie mocy testu oraz poprawienie procedury tak, aby w dalszych etapach wyniki były bardziej jednoznaczne. Aby obliczyć moc testu w naszym przypadku należy podać populacyjne średnie dla obu populacji, liczność pierwszej i drugiej grupy, poziom α (prawdopodobieństwo popełnienia przy testowaniu błędu I rodzaju, u nas ustalone na poziomie 0,05) oraz wartość populacyjnego odchylenia standardowego, wspólnego dla obu próbkowanych populacji. Jak już wcześniej zostało to wspomniane, analiza będzie prowadzona dla hipotezy zerowej jednostronnej H 0 : µ 1 µ 2. W dalszej części pracy zamieszczono wyniki analizy mocy testu na przykładzie stężenia glukozy oraz frakcji LDL cholesterolu (są to dwie skrajności, gdzie moc jest najmniejsza i największa). Analiza w przypadku pozostałych parametrów biochemicznych przebiega bardzo podobnie. Wyniki analizy mocy testu w przypadku oceny zróżnicowania wartości przeciętnych frakcji LDL cholesterolu W tej części zostaną przedstawione wyniki analizy mocy testu w przypadku oceny istotności zróżnicowania przeciętnego poziomu frakcji LDL pomiędzy badanymi grupami myszy. Tak jak to zostało wcześniej powiedziane przy ocenie mocy testu za wartość referencyjną przyjęto poziom frakcji LDL dla związku referencyjnego (ZWIĄZEK REF). Copyright StatSoft Polska
8 Analiza mocy testu wykonywana była przy ustalonym poziomie α=0,05. Zamieszczona poniżej tabela zawiera wyniki analizy. Jak widać, obliczona moc testu wyniosła zaledwie blisko 0,1. Możemy zatem stwierdzić, że przy przyjętych ustawieniach (średnie wartości frakcji LDL dla związku A i związku referencyjnego, wielkość odchylenia standardowego oraz liczebności) prawdopodobieństwa podjęcia decyzji o istnieniu efektu (na podstawie testu), gdy on rzeczywiście istnieje, jest zbyt niskie (przypomnijmy że, dobra moc testu to przynajmniej 0,8). Na podstawie wcześniejszych rozważań wiemy, że praktyczne możliwości zwiększenia mocy testu wiążą się z koniecznością zwiększenia liczebności próby, podwyższenia poziomu istotności testu α lub zmniejszeniem rozrzutu wyników. Dwie pierwsze możliwości można sprawdzić za pomocą odpowiednich wykresów. Wykresy te zamieszczono poniżej.,5 Test t dla prób niezależnych: Obliczanie mocy Dwie średnie, test t, próby niezal. (H0: Mi1 <= Mi2) Moc wzgl. N (Es = 0,210245, Alfa = 0,05, N1 = N2 = N),4,3 Moc,2,1 0, Liczność próby (N) Wykres pozwala zauważyć, że przy przyjętej wielkości efektów dla leku referencyjnego uzyskanie wysokiej wartości mocy testu (np. rzędu 0,8) wymagałoby bardzo dużej liczby obserwacji. Drugi z utworzonych wykresów pozwala ocenić moc testu w zależności od przyjmowanego poziomu istotności testu α Copyright StatSoft Polska 2006
9 ,5 Test t dla prób niezależnych: Obliczanie mocy Dwie średnie, test t, próby niezal. (H0: Mi1 <= Mi2) Moc wzgl. Alfa (Es = 0,210245, N1 = 10, N2 = 10),4,3 Moc,2,1 0,0 0,00 0,05 0,10 0,15 0,20 0,25 0,30 Prawdop. bł. I rodzaju (Alfa) Wykres pokazuje, że przyjęcie wyższego poziomu istotności testu (np. na poziomie 0,25) nadal nie gwarantuje zbyt wysokiej mocy testu. Oznacza to, że prawdopodobieństwo wykrycia istotnego efektu jest bardzo niskie. Powodem takiej sytuacji może być zróżnicowanie międzyosobnicze pomiędzy badanymi myszami, które ma wpływ na ich reakcje, lub niewystarczająca dokładność pomiaru badanych wskaźników. Nie musi to natomiast oznaczać, że wielkość frakcji LDL nie jest dobrym markerem do oceny efektu działania badanego związku. Wyniki analizy mocy testu w przypadku oceny zróżnicowania wartości przeciętnego stężenia glukozy W tej części pokażemy wyniki analizy mocy testu w przypadku oceny istotności zróżnicowania przeciętnego poziomu glukozy pomiędzy badanymi grupami myszy. Tak jak powyżej będziemy porównywać działanie związku A ze związkiem referencyjnym, przy prawdopodobieństwie błędu I rodzaju ustalonym na poziomie 0,05. Zamieszczona poniżej tabela zawiera wyniki analizy. Copyright StatSoft Polska
10 Jak widać, w przypadku stężenia glukozy obliczona moc testu wyniosła ponad 0,88. Możemy zatem stwierdzić, że przy przyjętych ustawieniach (średnie wartości poziomu glukozy dla ZWIĄZKU REF i ZWIĄZKU A, wielkość odchylenia standardowego oraz liczebności) prawdopodobieństwo podjęcia decyzji o istnieniu efektu (na podstawie testu), gdy on rzeczywiście istnieje, jest na bardzo dobrym poziomie. Podobnie jak poprzednio, poniżej zamieszczono wykresy prezentujące zależność mocy testu od liczebności próby i przyjętego poziomu istotności testu. Test t dla prób niezależnych: Obliczanie mocy Dwie średnie, test t, próby niezal. (H0: Mi1 <= Mi2) Moc wzgl. N (Es = 1,33298, Alfa = 0,05, N1 = N2 = N) 1,00,98,96 Moc,94,92,90,88, Liczność próby (N) Wykres pozwala zauważyć, że przy przyjętej wielkości efektów dla leku referencyjnego liczebność rzędu obserwacji jest już wystarczająca. Drugi z utworzonych wykresów pozwala ocenić moc testu w zależności od przyjmowanego poziomu istotności testu α. Test t dla prób niezależnych: Obliczanie mocy Dwie średnie, test t, próby niezal. (H0: Mi1 <= Mi2) Moc wzgl. Alfa (Es = 1,33298, N1 = 10, N2 = 10) 1,0,9 Moc,8,7,6 0,00 0,05 0,10 0,15 0,20 0,25 0,30 Prawdop. bł. I rodzaju (Alfa) 68 Copyright StatSoft Polska 2006
11 Wykres pokazuje, że przyjęcie poziomu istotności α=0,05 daje dobrą moc testu (powyżej 0,88). Gdybyśmy przyjęli poziom istotności na wyższym poziomie, wówczas moc testu wzrasta nawet powyżej 0,95. Ocena wyników analiz W wynikach analizy dla frakcji LDL warto zwrócić uwagę na jedną rzecz, mianowicie na stosunek β do α, który można dość łatwo zinterpretować. W naszym przykładzie α zostało przyjęte na poziomie 0, 05, natomiast β, równe 1-moc testu, wyniosło 0, 884. Tak więc ryzyko błędnego odrzucenia hipotezy zerowej jest oceniane przez planującego badanie jako 17 razy bardziej poważne niż błędnego zaakceptowania. Przyjrzyjmy się jeszcze wynikom oceny istotności zróżnicowania przeciętnego poziomu frakcji LDL pomiędzy badanymi grupami myszy dla wszystkich związków badanych w tej serii. Porównanie średnich dla leku referencyjnego i związku A zostało już omówione, w przypadku pozostałych związków. Dla związków B, C oraz D sytuacja jest podobna, moc testu jest na poziomie 0,3-0,5, a zależność mocy testu od liczności próby i poziomu α przedstawia się następująco: Zależność mocy testu od liczności próby i prawdopodobieństwa błędu I rodzaju 1,0 1,0 0,9 0,9 0,8 0,8 0,7 0,7 0,6 0,6 Moc 0,5 Moc 0,5 0,4 0,4 0,3 0,3 0,2 0,2 0,1 0, ,00 0,05 0,10 0,15 0,20 0,25 0,30 Liczność próby (N) Prawdop. bł. I rodzaju (Alfa) Badacz ma w tym miejscu do rozwiązania typowe zadanie optymalizacyjne. Wydaje się, że w dalszych badaniach zwiększenie liczności próby jest najkorzystniejszym rozwiązaniem, jednak należy zwrócić uwagę także na koszty badań. Na tym etapie badań zamiast zwiększać liczność próby dwukrotnie, co oczywiście powoduje ogromne zwiększenie kosztów badań, można po prostu post factum zwiększyć poziom α. W praktyce często uważa się, że im mniejsze α, tym lepiej, jednak powoduje to obniżenie mocy testu. Należy Copyright StatSoft Polska
12 w tym miejscu przypomnieć sobie cel naszych badań, zgodnie z nim podniesienie poziomu α nie jest tak szkodliwe. W świetle uzyskanych wyników i powyższych rozważań procedurę przeprowadzania badań należałoby wzbogacić o następujący algorytm postępowania: 1. Należy określić, stężenia których substancji są krytyczne, i jaka wielkość efektu będzie oznaczać, że dana substancja jest aktywna. 2. Następnie należy odpowiednio dobierać liczność próby oraz poziom istotności α. W ten sposób praktycznie oceniamy, jak często dopuszczalne są pomyłki. Sugerowana jest analiza sekwencyjna. Na przykład przyjęcie w pierwszej fazie badań wysokiego poziomu alfa (powiedzmy α = 0,2), tak aby test miał jak największą moc, i dopuszczenie tym samym błędnego sygnału o występowaniu efektu, gdy w rzeczywistości go nie ma (w przykładzie to oznacza dwa razy na dziesięć) i dalsza ocena wyselekcjonowanych substancji już przy niższym poziomie α. 3. Bardzo duży wpływ na moc ma wielkości rozrzutu wyników. Jej kontrola jest niezwykle ważna. Sugeruje się, aby w następnej fazie badań spróbować zmniejszyć rozrzut wyników. Taka poprawa procedury nie tylko obniża koszty, ale przede wszystkim zwiększa szanse na sukces w tym wieloetapowym i bardzo długim procesie badawczym. Podsumowanie Wykorzystywanie możliwości, jakie daje analiza mocy testu oraz wyznaczanie liczności prób, często daje duże oszczędności przy eksperymentach, a także pomaga poprawić skuteczność testów. Aby oszacować minimalną liczność próby, jaka daje satysfakcjonujące rezultaty lub obliczyć moc testu, należy jedynie znać lub mieć dobre estymatory wielkości efektu lub średnich w grupach i odchylenia standardowego w badanej populacji. Jeżeli jesteśmy w stanie uzyskać takie informacje poprzez przeprowadzenie badań pilotażowych, skorzystanie z wyników wcześniejszych badań lub prowadzimy badania powtarzalne, wieloetapowe, to na pewno warto przeprowadzić analizę mocy testu. Analiza mocy testu staje się bardzo ważnym narzędziem w pracy badacza, szczególnie na etapie planowania doświadczeń, ale także już po zakończeniu badań, jako element oceny skuteczności podjętych działań. Literatura 1. StatSoft (2006). Elektroniczny Podręcznik Statystyki PL, Kraków, WEB: 2. J. Cohen, Statistical power analysis for the behavioral sciences, LEA Publishers S. McKillup, Statistics Explained, An Introductory Guide for Life Scientists, Cambridge Copyright StatSoft Polska 2006
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją
SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów
Rozkład Gaussa i test χ2
Rozkład Gaussa jest scharakteryzowany dwoma parametramiwartością oczekiwaną rozkładu μ oraz dyspersją σ: METODA 2 (dokładna) polega na zmianie zmiennych i na obliczeniu pk jako różnicy całek ze standaryzowanego
Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z
WNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Testowanie hipotez statystycznych
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez
Hipotezy statystyczne
Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy
Hipotezy statystyczne
Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej
Wykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść II
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść II Szkic wykładu 1 Wprowadzenie 2 3 4 5 Weryfikacja hipotez statystycznych Obok estymacji drugim działem wnioskowania statystycznego jest weryfikacja hipotez
Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości
Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości Informatyka 007 009 aktualizacja dla 00 JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu. Przypomnienie testu dla
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
TESTOWANIE HIPOTEZ STATYSTYCZNYCH
TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Prawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15
VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Projektowanie badań i interpretacja wyników okiem biostatystyka. Warszawa, 15 marca 2016, Anna Marcisz
Projektowanie badań i interpretacja wyników okiem biostatystyka Warszawa, 15 marca 2016, Anna Marcisz Agenda Część I Cel badań - hipotezy badawcze/statystyczne Wielkość próby potrzebna do badania Jak odczytywać
Testowanie hipotez statystycznych cd.
Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres
Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2
STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.
Teoria błędów Wskutek niedoskonałości przyrządów, jak również niedoskonałości organów zmysłów wszystkie pomiary są dokonywane z określonym stopniem dokładności. Nie otrzymujemy prawidłowych wartości mierzonej
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Przypuśdmy, że mamy do czynienia z następującą sytuacją: nieznany jest rozkład F rządzący pewnym zjawiskiem losowym. Dysponujemy konkretną próbą losową ( x1, x2,..., xn
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Zadania ze statystyki cz.8. Zadanie 1.
Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech
TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Testowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW
ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,
Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Temat: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. MS EXCEL Do weryfikacji różnic między dwiema grupami jednostek doświadczalnych w MS Excelu wykorzystujemy funkcję o nazwie T.TEST.
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych
1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja
Opracowywanie wyników doświadczeń
Podstawy statystyki medycznej Laboratorium Zajęcia 6 Statistica Opracowywanie wyników doświadczeń Niniejsza instrukcja zawiera przykłady opracowywania doświadczeń jednoczynnikowy i wieloczynnikowych w
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Aktualizacja 2017 Plan wykładu 1. Metody wnioskowania statystycznego vs. metody opisu 2. Testowanie hipotez
Jak sprawdzić normalność rozkładu w teście dla prób zależnych?
Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?
2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali