Przekształcenia zmiennych (cd) Testowanie hipotez część I
|
|
- Kinga Paluch
- 8 lat temu
- Przeglądów:
Transkrypt
1 Przekształcenia zmiennych (cd) Testowanie hipotez część I Przekształcenia zmiennych cd. Mówiliśmy już o przekształceniach zmiennych polegających na takich zmianach niesionych przez nie informacji, żeby po przekształceniu lepiej pasowały do odpowiedzi na pytania badawcze. Przekształcenia zmiennych, o których teraz powiemy wynikają z przesłanek natury statystycznej: formalne wymogi testów statystycznych, możliwość porównywania zmiennych, itp. Wśród różnych charakterystyk danych ilościowych, za najbardziej pożyteczne przy analizie statystycznej często uznaje się: symetrię rozkładu, addytywność cech, stałość rozstępu i wariancji i inne. Normalizacja Normalizacja wartości zmiennej to ogólne określenie technik (zwykle polegających na przekształceniach algebraicznych) za pomocą których tak przekształcamy wartości zmiennej, że posiadają one własność, której wyjściowa zmienne nie miała (np. rozkład wynikowej zmiennej jest symetryczny, podczas kiedy rozkład zmiennej wyjściowej był skośny). W ramach normalizacji wyróżnić można: rangowanie wartości (zastępowanie wartości cechy ich pozycjami na liście ), standaryzacja wartości, unitaryzacja wartości i inne. Ogólny przypadek normalizacji (który nie uwzględnia rangowania wartości) można zapisać jako: p xi A zi = B, gdzie z i to znormalizowane wartości zmiennej x i, zaś A, B i p są parametrami normalizacji. W zależności od przyjętych parametrów normalizacji, wartości zmiennej normalizuje się według innej zasady. Może to być np. unityzacja (powodująca, że z i ma stały obszar zmienności od 0 do 1). Standaryzacja My zajmiemy się znaną już standaryzacją wartości zmiennej. Standaryzacja to normalizacja wartości zmiennej o parametrach: A = x B = S( x), gdzie S(x) jest odchyleniem standardowym zmiennej x. p = 1,2,... czyli dla często przyjmowanego p=1 mamy formułę standaryzacyjną postaci: xi x zi = S( x) Co daje standaryzacja? 1. Znane parametry struktury: z = 0, S( z) = Można pokazać, że niezależnie od wyjściowych wartości zmiennej (wartości zmiennej x), 99.73% znormalizowanych wartości leży w przedziale [-3 ; 3].
2 Po co standaryzujemy zmienne? Wyobraźmy sobie sytuację: Jakaś szkoła chce wystawić jednego ze swoich uczniów do międzyszkolnego konkursu wiedzy ogólnej. Nauczyciele zdecydowali, że odpowiedni kandydat powinien charakteryzować się średnio najlepszymi wynikami z takich przedmiotów jak matematyka, geografia, biologia i WOS oraz (na wszelki wypadek ) mieć przy tym stosunkowo wysokie IQ. Wyselekcjonowano siódemkę dzieci, które napisały stosowne testy. Oto ich wyniki: Biologia (max. 52) WOS (max. 135) IQ Matematyka Geografia (max. 70) (max. 30) Konrad Kamila Radek Michał Iwona Beata Ania Jak wybrać najlepszego reprezentanta szkoły? Dodawanie punktów uzyskanych w poszczególnych testach o tyle nie jest uprawnione, że po pierwsze punkty te inaczej ważą w każdym teście, po drugie nie mają jednego miana (IQ ma zupełnie inaczej rozumiane punkty niż wyniki testów "wiedzowych"). Dodatkowo mogłoby się zdarzyć, że wybranie ucznia mającego najwięcej punktów doprowadzi do sytuacji, kiedy będzie on wybitną jednostką w jednej dziedzinie i niespecjalnie wyróżniającą się w innej, co oczywiście nie będzie dla szkoły specjalnie korzystne w kontekście konkursu z wiedzy ogólnej. Z pomocą przychodzi właśnie standaryzacja (standaryzowane zmienne mają te same średnie i odchylenia standardowe mówią czy i jak bardzo jednostka odstawała od pozostałych w próbie oraz czy było to odchylenie in plus, czy in minus ): Biologia (max. 52) WOS (max. 135) IQ Matematyka Geografia stand. stand. stand. stand. stand. suma (max. 70) (max. 30) Matem. Geogr. Biol. WOS IQ stand. Konrad ,45-0,29-1,50-1,17 0,59-0,93 Kamila ,35-0,29-1,17-1,46-0,14-4,41 Radek ,06 0,53 0,47 0,38 0,35 1,67 Michał ,58-1,53 0,80-0,32-1,35-1,82 Iwona ,80-0,71-0,19 0,67 1,56 2,14 Beata ,92 1,35 1,13 0,95-1,11 1,39 Ania ,49 0,94 0,47 0,95 0,10 1,97 Po wystandaryzowaniu zmiennych i obliczeniu ich sumy okazuje się, że najlepszą kandydatką jest Iwona, pomimo tego, że ma swoje słabe strony (geografia i biologia). Szkoła mogłaby również się zastanowić nad kandydaturą drugiej pod względem wyniku osoby Anią ustępuje ona Iwonie głównie pod względem IQ (135 vs. 141, co przy tych wartościach IQ może nie mieć specjalnego znaczenia w konkursie z wiedzy ogólnej), ale nadrabia inną wiedzą. Standaryzacja wartości zmiennych w SPSSie Otwórzmy w SPSSie zbiór szkola. Są to dokładnie te same zmienne, co prezentowane powyżej. Żeby wystandaryzować ich wartości wybieramy Analiza Opis statystyczny
3 Statystyki opisowe (Analyze Descriptive Statistics Descriptives). W pojawiającym się oknie wybieramy zmienne, które chcemy standaryzować oraz zaznaczamy ( Save standardized values as variables ): W efekcie dostajemy zmienne wystandaryzowane. Stworzenie zmiennej stanowiącej ich sumę pozostawiam Państwu. ZADANIE1 Otwórz zbiór diagnoza2005. Wykonaj histogram dochodu ( bp107 ). Czy rozkład dochodu jest symetryczny? Wystandaryzuj wartości tej zmiennej. Oblicz statystyki opisowe standaryzowanych wartości i sprawdź, czy są one zgodne z własnościami standaryzacji. Jak zmieniła się wartość skośności i kurtozy po standaryzacji? Narysuj histogram standaryzowanych wartości. Czy wzorzec (a)symetrii pozostał? Przekształcenie logarytmiczne Poprzednie zadanie pokazywało, że o ile standaryzacja potrafi ograniczyć znakomitą większość wartości zmiennej do przedziału [-3 ; 3] oraz ustalić jej średnią na 0, a odchylenie standardowe na 1, to nie wpływa na skośność (asymetrię) i kurtozę. Często natomiast (przy formalnych testach) wymaga się, żeby rozkład zmiennej był symetryczny. Symetrię zmiennej często uzyskuje się stosując przekształcenie logarytmiczne, czyli po prostu obliczając logarytmy wartości zmiennej wyjściowej: lnx = ln( x ) i i ZADANIE2 Korzystając ze znanego Ci już sposobu (Przekształcenia Oblicz wartości (Transform Compute Variable)), wygeneruj zmienną lnbp107, której wartości będą logarytmami naturalnymi wartości zmiennej bp107. Wyznacz statystyki opisowe obydwu zmiennych zwróć uwagę na skośność. Narysuj histogramy tych zmiennych.
4 Testowanie hipotez część I Najczęstszym przypadkiem, do którego wykorzystujemy narzędzia statystyki i z którym mamy do czynienia w praktyce jest częściowe badanie statystyczne. Od badania pełnego różni się ono tym, że nie wykorzystujemy w nim wszystkich elementów analizowanej populacji (zbiorowości generalnej), a jedynie ich próbę. Statystyczne metody wykorzystywane do badania pełnego to najczęściej metody opisowe. Przy badaniu częściowym zaś wykorzystujemy matematyczne metody pozwalające wnioskować o cechach zbiorowości, z których próba została wylosowana oraz określać wielkość popełnianych przy tym błędów. Z oczywistych przyczyn, badanie pełne jest często niemożliwe do przeprowadzenia. W przypadkach takich wykonuje się badania częściowe i przeprowadza wnioskowanie statystyczne. Metodologia weryfikowania hipotez jest ogólnie znana i nie jest przedmiotem tych zajęć powtarzanie jej. Odświeżymy sobie jedynie trochę terminologii: hipotezy przedstawiają analizowany problem badawczy; wyróżniamy hipotezę zerową, która standardowo zakłada jakąś równość (np. parametr rozkładu zmiennej równy jest jakiejś konkretnej wielkości; parametr rozkładu jednej zmiennej równy jest analogicznemu parametrowi rozkładu innej zmiennej; dystrybuanta empiryczna rozkładu zmiennej równa jest dystrybuancie teoretycznej) i zastanawiamy się, czy są przesłanki, żeby hipotezę tę odrzucić. Jeśli takie przesłanki są, to odrzucamy ją i przyjmujemy hipotezę alternatywną. statystyka testowa statystyka, która obliczana jest przy okazji każdego testu funkcja wartości zmiennej/wartości zmiennych; przy założeniu prawdziwości hipotezy zerowej posiada znany rozkład, co pozwala ustalić, czy są przesłanki, żeby tę hipotezę odrzucić, czy nie (jeśli jej wartość wpada do obszaru krytycznego (wyznaczonego przy znajomości rozkładu statystyki testowej przy założeniu prawdziwości hipotezy zerowej oraz przy przyjęciu pewnego poziomu istotności), to mamy podstawy, żeby hipotezę zerową odrzucić). α - poziom istotności intuicyjnie jest to akceptowany poziom ryzyka, że niesłusznie odrzucimy hipotezę zerową. Formalnie, jest to maksymalne akceptowalne prawdopodobieństwo popełnienia błędu I rodzaju, a więc błędu polegającego na niepoprawnym odrzuceniu hipotezy zerowej. Standardowo przyjmowane poziomy istotności to 1% (0,01), 5% (0,05) i 10% (0,1). * wartość p (p-value; (W SPSSie) istotność; często alternatywnie oznaczana α ) empiryczny (policzony) poziom istotności empiryczne prawdopodobieństwo popełnienia błędu I rodzaju (czyli związane z wartością statystyki testowej przy uwzględnieniu jej rozkładu przy hipotezie zerowej). Jeśli prawdopodobieństwo to jest odpowiednio małe (precyzyjniej: mniejsze niż poziom istotności, α ), to mamy podstawy, żeby hipotezę zerową odrzucić. W przeciwnym wypadku (wartość p większa od α ), nie ma podstaw do odrzucenia hipotezy zerowej.
5 Założenia testów Testy statystyczne mają swoje założenia, które należy również testować, aby upewnić się, czy użycie testu w konkretnym przypadku będzie uzasadnione. Rozkład normalny Początki rozkładu normalnego sięgają XIX wieku, kiedy spopularyzował go Karl Friedrich Gauss, a w szczególności zainteresowali się nim astronomowie. Zaobserwowano wtedy, że pomiar danej wielkości ma rozkład normalny wyniki takiego pomiaru stanowią rzeczywistą wielkość mierzonego zjawiska plus błąd. Znany jest dzwonowaty kształt funkcji gęstości tego rozkładu krzywa Gaussa który, przypomnijmy, wygląda tak: Źródło: Wikipedia, Jeśli zmienna X ma rozkład normalny, X ~ N( m, σ ), to zmienna Z, taka że: X m Z = σ ma standardowy rozkład normalny, co zapisujemy Z ~ N (0,1). Wykres standardowego rozkładu normalnego jest (oczywiście) scentrowany w zerze:
6 Obszar (tzw. jednosigmowy) [-1; 1] stanowi 68.27% powierzchni pod krzywą Gaussa, obszar [-2; 2] (dwusigmowy) to 95.45% tej powierzchni, zaś obszar trzysigmowy ([-3; 3]) to 99.73% tej powierzchni. Założenie o rozkładzie normalnym Założenie, że zmienna ma rozkład normalny leży u podstaw bardzo wielu tzw. parametrycznych testów istotności różnic (o których będziemy mówić w dalszej części), jak również jest to założenie wielu innych narzędzi statystycznych przykładowo analizy wariancji. Istnieje wiele testów, które weryfikują, czy zmienna pochodzi z rozkładu normalnego, czy też nie. Często wykorzystywane tego typu testy to Kołmogorowa-Smirnowa oraz Sharpio-Wilka, z tymże ten drugi odpowiedni jest dla prób nie przekraczających 50 elementów (obserwacji). Hipotezami tych testów są: H0 : F( x) = FN ( x) H1 : F( x) FN ( x) czyli hipoteza zerowa mówi, że dystrybuanta empiryczna badanej zmiennej równa jest dystrybuancie rozkładu normalnego, a więc, że zmienna ta ma rozkład normalny. W SPSSie test normalności rozkładu przeprowadzany jest na dwa sposoby: 1. Jeśli testujemy, czy jakaś zmienna ma rozkład normalny, to wybieramy: Analiza Testy nieparametryczne K-S dla jednej próby (Analyze Nonparametric Tests 1-Sample K-S) i wypełniamy pojawiające się okno. W wyniku dostajemy statystykę testową test Kołmogorowa-Smirnowa oraz wartość p tej statystyki. Przypomnijmy: Często, wykorzystując obliczenia komputerowe, zamiast odszukiwać wartości * krytyczne w tablicach statystycznych, łatwiej jest obliczyć α, czyli tzw. policzony poziom istotności (empiryczny poziom istotności lub tzw. wartość p (p-value)), w * SPSSie często nazywana istotnością. α to empirycznie wyznaczone (przy założeniu odpowiedniego rozkładu statystyki testowej), prawdopodobieństwo popełnienia błędu I rodzaju. Przyjmując, że za poziom istotności (równoważny maksymalnemu akceptowanemu prawdopodobieństwu popełnienia błędu I rodzaju, a więc prawdopodobieństwu odrzucenia prawdziwej hipotezy zerowej) przyjmujemy α, możliwe są następujące dwie sytuacje: * (i). α α * (ii). α > α Oczywiście w sytuacji (i) odrzucimy hipotezę zerową na rzecz alternatywnej, zaś w sytuacji (ii) nie będziemy mieli do tego podstaw. Proszę otworzyć dane PGSS_2002_pr. Spróbujmy przetestować, czy dodatkowe dochody miesięczne (zmienna q39d ) mają rozkład normalny. Wybieramy Analiza Testy nieparametryczne K-S dla jednej próby (Analyze Nonparametric Tests 1-Sample K-S), wypełniamy odpowiednio wyskakujące okno i otrzymujemy wynik:
7 Wartość p (istotność asymptotyczna) jest dla nas nieodróżnialna od 0, prawdopodobieństwo popełnienia błędu I rodzaju jest na tyle małe (mniejsze od każdego standardowego poziomu istotności (1%, 5% lub 10%)), że możemy odrzucić hipotezę zerową o normalności rozkładu zmiennej q39d. Możemy się zastanowić nad możliwością sprowadzenia zmiennej q39d do normalności. Rzućmy okiem na jej histogram: Histogram wskazuje na wyraźną asymetrię rozkładu. Wiemy już, że w takiej sytuacji może pomóc transformacja logarytmiczna. Stwórzmy zmienną lnq39
8 będącą logarytmem naturalnym zmiennej q39d (Przekształcenia Oblicz wartości (Transform Compute Variable)). Wykonajmy teraz test Kołmogorowa-Smirnowa dla lnq39 : Na poziomie istotności α = 0,05 zachodzi p = 0, 066 > α = 0, 05, a więc prawdopodobieństwo, że popełnimy błąd I rodzaju jest zbyt duże nie ma więc podstaw do odrzucenia H 0 o normalności rozkładu zmiennej lnq39. ZADANIE3 Proszę otworzyć dane zatrudnienie i sprawdzić, czy można powiedzieć, że zmienna prevexp ma rozkład normalny. Jeśli nie, to spróbować ją przekształcić, żeby rozkład normalny miała. 2. Jeśli testujemy, czy rozkłady jakiejś zmiennej są rozkładami normalnymi w podpróbkach wydzielonych przez kategorie innej zmiennej, to wybierzemy: Analiza Opis statystyczny Eksploracja (Analyze Descriptive Statistics Explore). W pole Zmienna zależna ( Dependent List ) wpisujemy zmienną, której normalność rozkładu chcemy sprawdzić, zaś w pole Lista czynników ( Factor List ) wpiszemy zmienną, której kategorie dzielą próbę na podgrupy. Otwórzmy zbiór diag2 i spróbujmy przeprowadzić test normalności rozkładów zmiennej lnbp107 w podgrupach stanu cywilnego (zmiennej ac8 ). Wybieramy więc Analiza Opis statystyczny Eksploracja (Analyze Descriptive Statistics Explore), wypełniamy odpowiednio pojawiające się okno, a dodatkowo klikamy ( ) i zaznaczamy: ( )
9 W wyniku otrzymamy: Z tabelki wynika, że w podgrupie osób rozwiedzionych zmienna lnbp107 ma rozkład normalny (wynik nie potwierdzany przez test Sharpio-Wilka). Optymistyczne wyniki co do normalności rozkładu zmiennej lnbp107 w grupie osób będących w separacji (takich osób było jedynie 21) mogą wynikać z tego, że testy na normalność rozkładu ogólnie są z reguły skłonne znajdować normalność rozkładu w małych próbkach oraz są bardzo wrażliwe na najdrobniejsze odejścia od rozkładu normalnego w próbkach dużych. Jednorodność (równość) wariancji Częstym założeniem testów jest jednorodność wariancji. Przykładowo, analizując statystyczną istotność różnic dochodowych w różnych grupach wykształcenia, formalnym wymogiem zastosowania jednoczynnikowej analizy wariancji jest jednorodność (równość) wariancji dochodu w każdej z grup dochodowych. Jednorodność wariancji często weryfikowana jest za pomocą testu Levene a. Test ten bada równość wariancji w k podgrupach. Hipotezy tego testu są następujące: H0 : σ1 = σ 2 =... = σ k H1 : nie wszystkie wariancje są sobie równe W SPSSie do testu Levene a mamy często dostęp przy korzystaniu z narzędzi, których użycie wymaga spełnienia założenia o równości wariancji (przykładowo wykonując analizę wariancji, dodatkowo możemy wykonać test Levene a). Żeby test Levene a wykonać rozłącznie ze wszystkimi innymi analizami, wybrać możemy: Analiza Opis statystyczny Eksploracja (Analyze Descriptive Statistics Explore) i ustalić wariancje której zmiennej chcemy porównywać ( Zmienna zależna ( Dependent List )) i w jakich podgrupach ( Lista czynników ( Factor List )). Dalej wybieramy ( ) i w pojawiającym się oknie zaznaczamy: Przykład (dane diagnoza_2005 lub diag2 ). Powiedzmy, że chcemy sprawdzić, czy kobiety i mężczyźni ( ac7 ) charakteryzują się tym samym zróżnicowaniem w określeniu dochodu dającego satysfakcjonujące życie ( ae6 ) (innymi
10 słowy, chcemy przeprowadzić test Levene a na jednorodność wariancji zmiennej ae6 w grupie kobiet i mężczyzn). [Powodem przeprowadzenia tego testu może być formalny wymóg spełnienia postulatu równości wariancji w innym teście]. Wybierzemy więc Analiza Opis statystyczny Eksploracja (Analyze Descriptive Statistics Explore) i wypełnimy je: Potem, zgodnie z tym, czego dowiedzieliśmy się wcześniej, klikniemy ( ) i w pojawiającym się oknie wybierzemy ( ). W wyniku dostajemy: Interpretacja tego wyniku (jak też wyników WSZYSTKICH innych przeprowadzanych w SPSSie testów, sprowadza się do zinterpretowania wartości p). Wartości p mamy podawane dla różnych odmian tego samego testu Levene a, nas z reguły interesowała będzie pierwsza z nich, czyli u nas p = 0,304. Ponieważ (dla 5%-go poziomu istotności) zachodzi p = 0,304 > α = 0, 05, to nie ma podstaw do odrzucenia hipotezy zerowej i przyjmujemy, że wariancje zmiennej ae6 wśród kobiet i mężczyzn są równe. Swoją drogą, statystyka testowa testu Levene a przy założeniu prawdziwości hipotezy zerowej ma rozkład F( k 1, n k), gdzie k-ilość porównywanych wariancji w hipotezie zerowej, n-ilość obserwacji. ZADANIE4 (dane diagnoza2005 ) Sprawdź, czy można twierdzić, że wariancja zmiennej ae6 jest jednorodna w grupach osób inaczej wykształconych ( ac9 )
11 Weryfikacja hipotez parametrycznych o równości średnich Hipotezy parametryczne, to hipotezy pozwalające wnioskować o tym, czy parametr w populacji (/parametry w populacjach) jest równy jakiejś konkretnej wartości (/są sobie równe), czyli przykładowo czy można powiedzieć, że kobiety zarabiają średnio 2200PLN (/kobiety zarabiają średnio tyle, co mężczyźni (grupy niezależne) lub czy ludzie przed wypiciem określonej ilości alkoholu tak samo oceniają odległość do danego przedmiotu, jak po jej wypiciu (grupy zależne)). Testami weryfikującymi równość średnich (dla zmiennych ilościowych oraz dla odsetków) są testy, których statystyki testowe mają rozkład t-studenta. Z tego powodu nazywają się często testami t. Testów tych nie powinno się stosować do zmiennych innych niż ilościowe. Test dla jednej próby (test jednej średniej) Test ten weryfikuje hipotezę, że średnia wartość zmiennej różni się w sposób istotny statystycznie od danej wartości. W ogólnym przypadku, możemy zapisać zestaw hipotez jako: H : m = m H : m m gdzie m średnia zmiennej w populacji, a m 0 - testowana wartość. Statystyka testowa obliczana jest ze wzoru: t X m 0 = S( X ) ~ t( n 1) n UWAGA! Możliwość zastosowania tego testu dla małych prób ( n 30 ) ograniczone jest do przypadku gdy zmienna ma w populacji rozkład normalny. Z reguły nie będziemy znali tego rozkładu, o jego normalności trzeba się będzie upewniać przeprowadzając jeden z odpowiednich testów. W razie braku normalności rozkładu, nie jest poprawne korzystanie z omawianego testu. Przykładowo (otwórzmy zbiór PGSS_2002_pr) i zobaczmy, czy można przyjąć, że średnia ilość osób w gospodarstwie domowym (hompop) równa jest 3. W SPSSie test ten realizowany będzie przez wybranie: Analiza Porównywanie średnich Test t dla jednej próby (Analyze Compare Means One Sample T-Test): Wśród Zmiennych testowanych jest zmienna hompop, zaś testowana wartość wyszczególniona jest w stosownym polu.
12 W wyniku dostajemy: W pierwszym panelu mamy statystyki opisowe zmiennej hompop, które potrzebne są do wyznaczenia statystyki opisowej. Drugi panel zawiera wyniki testu. Kolejne pola tego panelu to: nazwa zmiennej, wartość statystyki testowej, ilość stopni swobody (n-1), wartość p oraz inne, mniej ważne z punktu widzenia wyniku testu. Bazując na tym panelu możemy zapisać: t = 9,351 ~ t(2472); p < 0, 05 Zgodnie z zasadami podejmowania decyzji przy weryfikacji hipotez, prawdopodobieństwo, że popełnimy błąd jak odrzucimy hipotezę zerową jest na tyle małe (u nas: nieodróżnialne od zera), że możemy to zrobić. Wnioskujemy więc, że średnia ilość osób w gospodarstwie domowym jest w populacji różna od 3. ZADANIE5 Czy można przyjąć, że średnie dochody w populacji wynoszą 1200PLN?
Przekształcenia zmiennych (cd) Testowanie hipotez część I
Przekształcenia zmiennych (cd) Testowanie hipotez część I Przekształcenia zmiennych cd. Mówiliśmy już o przekształceniach zmiennych polegających na takich zmianach niesionych przez nie informacji, żeby
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2
STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
Analiza wariancji. dr Janusz Górczyński
Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik
Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Przypuśdmy, że mamy do czynienia z następującą sytuacją: nieznany jest rozkład F rządzący pewnym zjawiskiem losowym. Dysponujemy konkretną próbą losową ( x1, x2,..., xn
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne.
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
Testowanie hipotez statystycznych
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Zadania ze statystyki cz.8. Zadanie 1.
Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW
Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa
Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej
Hipotezy statystyczne
Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Jak sprawdzić normalność rozkładu w teście dla prób zależnych?
Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu
Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich
Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa
Zawartość. Zawartość
Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami
Hipotezy statystyczne
Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
TESTOWANIE HIPOTEZ STATYSTYCZNYCH
TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH Co to są hipotezy statystyczne? Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej. Dzielimy je
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Testowanie hipotez statystycznych cd.
Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:
Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie
Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością
WNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych
1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech
TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Jednoczynnikowa analiza wariancji
Jednoczynnikowa analiza wariancji Zmienna zależna ilościowa, numeryczna Zmienna niezależna grupująca (dzieli próbę na więcej niż dwie grupy), nominalna zmienną wyrażoną tekstem należy w SPSS przerekodować
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez statystycznych
STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2
STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 Karl Popper... no matter how many instances of white swans we may have observed, this does not
Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
Wykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14
Statystyka #6 Analiza wariancji Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2015/2016 1 / 14 Analiza wariancji 2 / 14 Analiza wariancji Analiza wariancji jest techniką badania wyników,
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011 Temat. Weryfikacja hipotez statystycznych dotyczących proporcji. Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Wykład 9 Testy rangowe w problemie dwóch prób
Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora
b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:
ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Żródło:
Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Test
Z poprzedniego wykładu
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne
Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska
Porównanie modeli statystycznych Monika Wawrzyniak Katarzyna Kociałkowska Jaka jest miara podobieństwa? Aby porównywać rozkłady prawdopodobieństwa dwóch modeli statystycznych możemy użyć: metryki dywergencji
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności
VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15
VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,
Weryfikacja hipotez statystycznych testy t Studenta
Weryfikacja hipotez statystycznych testy t Studenta JERZY STEFANOWSKI Marek Kubiak Instytut Informatyki Politechnika Poznańska Standardowy schemat postępowania (znane σ) Założenia: X ma rozkład normalny
Analizy wariancji ANOVA (analysis of variance)
ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza
TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.
TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI 1. Test dla dwóch średnich P.G. 2. Testy dla wskaźnika struktury 3. Testy dla wariancji DECYZJE Obszar krytyczny od pozostałej
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?
2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, Ŝe 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW
ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją
Testy dla dwóch prób w rodzinie rozkładów normalnych
Testy dla dwóch prób w rodzinie rozkładów normalnych dr Mariusz Grządziel Wykład 12; 18 maja 2009 Przykład Rozważamy dane wygenerowane losowo; ( podobne do danych z przykładu 7.2 z książki A. Łomnickiego)
Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych
Wykład 12 (21.05.07): Testy dla dwóch prób w rodzinie rozkładów normalnych Przykład Rozważamy dane wygenerowane losowo; ( podobne do danych z przykładu 7.2 z książki A. Łomnickiego) n 1 = 9 poletek w dąbrowie,
METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II
METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II Podział zmiennych Zmienne zależne zmienne, które są przedmiotem badania, których związki z innymi zmiennymi chcemy określić Zmienne