Testy normalności rozkładu
|
|
- Amalia Wójcik
- 9 lat temu
- Przeglądów:
Transkrypt
1 Testy normalności rozkładu Wiele testów parametrycznych wymaga by dane pochodziły z rozkładu zbliżonego do normalnego. Dlatego testy badające normalność rozkładów są tak istotne. W testach tych zawsze przyjmuje się H - rozkład zmiennej jest normalny. Odrzucenie H jest wiec równoznaczne z przyjęciem hipotezy że rozkład zmiennej nie jest normalny. Brak podstaw do odrzucenia nie oznacza przyjęcia hipotezy o normalności rozkładu. Musimy to jeszcze sprawdzić - w tym celu sporządzane są wykresy prawdopodobieństwoprawdopodobieństwo. Dla małych próbek wykonujemy dwa testy: Test Kołmogorowa - Smirnowa (K-S) z poprawką Lilleforsa (K-S-L) która jest obliczana gdy nie znamy średniej lub odchylenia standardowego całej populacji. Test Shapiro - Wilka (S-W) - najbardziej polecany ale może dawać błędne wyniki dla próbek większych niż tys. Należy podkreślić iż ostatnimi czasy test S-W stał się preferowanym testem normalności rozkładu prawdopodobieństwa ze względu na jego silną moc w porównaniu do innych dostępnych testów. Przyjęcie hipotezy zerowej o normalności rozkładu powinno być potwierdzone graficzną reprezentacją danych np. funkcją qqplot. Test Kolmogorova-Smirnova Test K-S dla jednej próbki (K-S one-sample test) bazuje na maksymalnej różnicy pomiędzy empiryczną dystrybuantą (ECDF) a hipotetyczną dystrybuantą (CDF). Jeżeli statystyka D jest znacząca wówczas hipoteza głosząca że analizowany rozkład jest normalny powinna zostać odrzucona. W wielu programach wykorzystywane wartości prawdopodobieństwa bazują na tych wyznaczonych przez Masseya (9) - wartości te są prawidłowe w przypadku gdy wartość średnia oraz odchylenie standardowe rozkładu normalnego są znane aproiri i nie są estymowane na podstawie zebranych danych. Test K-S powstał w latach 3 XIX wieku. Pozwala on na realizację porównania pojedynczego rozkładu f(x) częstości z teoretycznym rozkładem g(x) lub dwóch zaobserwowanych rozkładów. W obu przypadkach realizacja testu wymaga
2 zdefiniowania dystrybuanty (CDF) F(x) jak i G(X) oraz wyznaczenia wielkości największej różnicy pomiędzy tymi funkcjami. Założenia Próbki są losowe (lub obie grupy próbek są losowe i niezależne). Przestrzeń wartości powinna mieć przynajmniej zdefiniowany porządek (ordinal scale) a najlepiej gdyby była ciągła. Znane są dokładne wartości (nie są estymowane z danych) średnie oraz odchylenia standardowe populacji z jakiej pochodzą próbki. Hipoteza Test H: F(x) = G(x) (two-sided) H: F(x)!= G(x) dla przynajmniej jednej wartości x Obliczana jest testowa statystyka: D = sup[ F(x) - G(x) ] Dla pojedynczej próby o rozmiarze n wartości D Dk dla k=sqrt(n) dla zadanego poziomu istotności α wartości statystyki dane są tabelami lub obliczane programistycznie (np. z wykorzystaniem symulacji Monte Carlo). Jedną z zalet testu K-S jest to iż pozwala on na graficzną reprezentację danych co pozwala użytkownikowi na swoistą weryfikację poprawności testu. Dla dużych zbiorów danych (N>4) ze względu na CLT (centralne twierdzenie graniczne) t-test powinien pozwalać na poprawne wyniki nawet w sytuacji aberacji od rozkładu normalnego. Jednakże w rzeczywistości rozkłady dalece nie-normalne mogą spowodować iż t-test będzie generował omylne wyniki - nawet dla dużych zbiorów danych.
3 Wykres Dystrybuanty Dystrybuanta / Empiryczna dystrybuanta pozwala na graficzną reprezentację charakteru rozproszoności zbioru danych. Przykładowo przyjmijmy zbiór controlb (posortowany od wartości najmniejszej do największej) : 3 sorted controlb={ } Analizując dane widzimy iż nie mamy wartości poniżej.8 / danych leży poniżej. / danych leżą poniżej. itd. Dla przypomnienia dla dowolnej wartości x wartości dystrybuanty F(x) oznacza ułamek danych jakie są ściśle mniejsze od wartości x. Przykładowo F(3) dla danych controlb jest równe 7/. Przygotuj wykres dystrybuanty dla zbioru danych controlb. Pamiętaj że każdy punkt na wykresie odpowiada pojedynczemu punktowi w zbiorze danych. Widać iż większość punktów znajduje się w małym obszarze po lewej stronie wykresu jest to swoisty znak nie-normalnego rozkładu danych. Jednakże aby lepiej zobaczyć charakterystykę danych ze zbioru controlb zmieńmy skalę osi X - tak aby więcej przestrzeni miały małe wartości. Przygotuj wykres dystrybuanty dla zbioru danych controlb z logarytmiczną skalą osi X. Widać teraz iż mediana przyjmuje wartość około. Następnie przygotujmy wykres dystrybuanty dla grupy poddanej terapii: treatmentb= { } Przygotuj wykres dystrybuanty dla zbioru danych controlb z logarytmiczną skalą osi X oraz dystrybuanty dla zbioru danych treatmentb z logarytmiczną skalą osi X (przerywaną linią) - na jednym wykresie. Widzimy iż dane kontrolne jak i grup poddanych terapii mieszczą się w podobnym przedziale (od. do około ). Jednakże dla prawie każdej wartości x ułamek wartości z grupy poddanej terapii które są ściśle mniejsze od x jest widocznie mniejszy niż
4 4 ułamek wartości z grupy kontrolnej które są ściśle mniejsze od x. Przykładowo mediana dla grupy kontrolnej jest znacząco mniejsza w porównaniu z medianą dla grupy poddanej terapii. Wracając do testu K-S. Wykorzystuje on największą wertykalną różnicę pomiędzy dwoma dystrybuantami jako statystykę D. W naszym przypadku różnica ta występuje w okolicach x= i wynosi około D=.4. Warto zauważyć iż w przeciwieństwie do statystyki T wartości statystyki D (stąd też wartość p) nie są podatne na zmianę skali np. zastosowany logarytm. W analogiczny sposób przeprowadź rozumowanie dla grupy kontrolnej A oraz grupy poddanej terapii A: controla={ } treatmenta={ } Sprawdź czy twój wynik zgadza się z:
5 Przykład w Matlabie kstest: Załadujmy zbiory danych dotyczące temperatury ciała (body_women oraz body_men) - sumarycznie 3 obserwacji (zmienna all) każdy o 6 przykładach (zmienne odpowiednio women oraz men). Na początku spróbujmy dopasować rozkład normalny do pełnego zbioru danych. Zacznijmy od obliczenia wartości średniej oraz odchylenia standardowego: mean(all) = std(all) =.734 Spróbujmy powtórzyć te kroki dla zbioru danych dotyczącego osobno kobiet i mężczyzn. Następnie narysujmy dystrybuantę rozkładu teoretycznego oraz empirycznego analogicznie do poniższych wykresów: Widzimy iż pełny zbiór danych całkiem dobrze wpasowuje się dystrybuantę rozkładu normalnego. Sprawdźmy zatem czy podobne wnioski otrzymamy korzystając z analizy za pomocą testu K-S. W celu poprawnego wywołania testu musimy przygotować wektor wartości dystrybuanty rozkładu N(ˆµ σˆ): CDFall = normcdf(allmean(all)std(all)) Następnie możemy uruchomić test kstest : [HPKSSTATCV] = kstest(all[allcdfall].) co da nam H = P =.6 KSSTAT =.639 CV =.78 Zatem możemy zaakceptować H ponieważ p-value jest.6. Dodatkowo wartość krytyczna CV (dla odrzucenia H wymaga KSSTAT > CV ) jest mniejsza od progu. Test K-S może zostać wykorzystany do odpowiedzi na pytanie czy dane pochodzą z rozkładu normalnego lecz także dla innych rozkładów log-normalnego Weibulla wykładniczego czy logistycznego.
6 6 Należy zbadać czy zbiór danych dla mężczyzn oraz zbiór danych dla kobiet traktowane osobno również są z rozkładu normalnego? Zastanówmy się dalej czy oba rozkłady są takie same zatem postawmy hipotezę H: P = P gdzie P to odpowiednio rozkład dla mężczyzn zaś P dla kobiet. W tym celu wykorzystamy funkcję kstest : [HPKSSTAT] = kstest(men women) która w wyniku podaje: H = P =.94 KSSTAT =.846. Zatem powinniśmy zaakceptować hipotezę zerowa (p-value >. - domyślna wartość poziomu istotności). Zgodnie z przeprowadzonym testem różnica pomiędzy obiema próbkami nie jest statystycznie znacząca aby móc stwierdzić iż oba te rozkłady są różne. Na podstawie zbioru danych pacjenci.csv należy zbadać czy wzrost mężczyzn oraz wzrost kobiet mają takie same rozkłady? UWAGA! Jest kilka sytuacji w których błędem jest pełna ufność w wyniki t-testu: W przypadku gdy grupa kontrolna oraz poddana terapii nie różnią się wartością średnią lecz różnią się w inny sposób np: controla={ } treatmenta={ } Oba zbiory danych są zbalansowane względem zera - zatem wartość średnia tych zbiorów oscyluje blisko zera. Jednakże widoczna jest znacząca wariancja w zbiorze w porównaniu do grupy kontrolnej (-6-6 do -. -.). Dane są różne jednakże t-test nie jest w stanie wychwycić różnicy W przypadku gdy grupy kontrolna oraz poddana terapii są małe (np. po elementów) i różnią się wartością średnią jednakże gdy znacząco nienormalny rozkład maskuje różnice np:
7 controlb={ } reatmentb= { } 7 Oba te zbiory danych zostały wygenerowane z rozkładu lognormalnego i różnią się znacząco wartością średnią. Na podstawie zbioru danych z przykładu należy sprawdzić za pomocą t-testu oraz testu KS czy oba rozkłady są takie same? Proszę za pomocą testu KS sprawdzić także czy dane są z rozkładu normalnego? Załóżmy że pobliskie jabłonie właśnie owocują. Jedne jabłka to Delikates zaś drugie to Renety. Zastanówmy się czy pobliskie pszczoły preferują tylko pewien gatunek jabłek. Wykorzystując stoper mierzymy czas jak długo pojedyncza pszczoła pozostaje na konkretnym drzewie - zaczynami gdy dotyka ona drzewa zaś kończymy gdy odlatuje na odległość większą niż metr. Chcieliśmy zebrać równoliczne pomiary jednakże zaczęło padać i udało nam się zebrać jedynie następujące dane: delikates={ } renety={ } Zacznijmy od sprawdzenia czy zebrane dane pochodzą z rozkładu normalnego. Czy dla takich danych możemy wykorzystać t-test? Jak możemy interpretować wynik t-testu porównującego obie próbki? Następnie należy stworzyć wykres porównujący empiryczne dystrybuanty obu próbek. Wykorzystując test K-S proszę sprawdzić czy dane te charakteryzują się różnymi rozkładami prawdopodobieństwa.
8 8 Test Lillieforsa W teście K-S pojawia się dość restrykcyjne założenie że znana jest dokładna wartość średnia oraz odchylenie standardowe analizowanej populacji - nie są one estymowane z danych. W przeciwnym przypadku wartości statystyki D wyznaczone przez Masseya nie są prawdziwe. Jednakże często nie mamy takiej wiedzy i wykorzystywane wartości średnie wyznaczana są na podstawie dostępnych danych wówczas test normalności przyjmuje dość skomplikowaną warunkowaną hipotezę - jak prawdopodobne jest osiągnięcie danej wartości statystyki D (lub większej) pod warunkiem że wartość średnia oraz odchylenie standardowe zostały wyznaczone z danych. W takim przypadku należy wykorzystać tak zwane prawdopodobieństwa Lillieforsa (967) - wartości statystyki - w celu wyznaczenia czy różnica obliczona zgodnie z KS jest statystycznie znacząca. Założenia Próbki są losowe. Przestrzeń wartości powinna mieć przynajmniej zdefiniowany porządek (ordinal scale) a najlepiej gdyby była ciągła. Nieznane są dokładne wartości (są estymowane z danych) średnie oraz odchylenia standardowe populacji z jakiej pochodzą próbki. Hipoteza H: F(x) = G(x) (two-sided) H: F(x)!= G(x) dla przynajmniej jednej wartości x
9 Test Dla próbki składającej się z n obserwacji obliczana jest testowa statystyka D: D = sup[ F(x) - G(x) ] gdzie G(x) jest empiryczną dystrybuantą próby zaś F(x) jest dystrybuantą rozkładu normalnego o wartości średniej równej wartości średniej próby i wariancji równej wariancji próby (nie obciążonej - z n- w mianowniku). Jeżeli wartość statystyki D przekracza wartość krytyczną należy odrzucić hipotezę iż obserwacje pochodzą z rozkładu normalnego. Wartości krytyczne wyznacza się stosując metodę symulacji Monte Carlo dla próby około 3-3 elementów i realizowane są automatycznie w nowoczesnym oprogramowaniu do analizy statystycznej. Lillefors na bazie bogatego zbioru symulacji argumentował iż test ten jest znaczącym udoskonaleniem testu chi^ dla próby o małej liczbie elementów (<3) oraz iż ma większą siłę niż test K-S. 9 Przykład w Matlabie Lillietest: Wykorzystujemy funkcje lillietest. Ponownie załadujmy zbiory danych dotyczące temperatury ciała (body_women oraz body_men) - sumarycznie 3 obserwacji (zmienna all) każdy o 6 przykładach (zmienne odpowiednio women oraz men). [HPLSTATCV] = lillietest(all) co powinno zwrócić: H = P =.969 LSTAT =.647 CV =.777. Zatem możemy zaakceptować normalność rozkładu danych all z wartością p =.969. Należy zbadać czy zbiór danych dla mężczyzn oraz zbiór danych dla kobiet traktowane osobno również są z rozkładu normalnego (analogicznie do zadania dla testu K-S)? Czy otrzymane wyniki różnią się od wyników dla testu K-S? Test Shapiro-Wilka swtest:
10 Test Shapiro-Wilka (W) (968) wykorzystywany jest do testowania normalności rozkładu. Jeżeli statystyka W jest znacząca to wówczas należy odrzucić hipotezę iż analizowana próba pochodzi z rozkładu normalnego. Jest to preferowany test na normalność rozkładu ze względu na jego moc w porównaniu z innymi alternatywnymi testami. Niektóre programy statystyczne pozwalają na stosowanie testu W dla dużych danych (do obserwacji) przy wykorzystaniu rozszerzenia testu zaproponowanego przez Roystona (98). Test ten bazuje na spostrzeżeniu iż analizując dopasowanie próbnego zbioru danych do rozkładu normalnego (jego wykresu w q-q plot) jest podobne do zadania liniowej regresji - linia diagonalna jest linią idealnego dopasowania zaś wszystkie odchylenia od niej są podobne do residuów w zadaniu regresji. I właśnie analizując skalę tych odchyleń można określić jakość dopasowania. Autorzy testu rekomendują jego wykorzystanie dla małych zbiorów danych (<). Założenia Próbki są losowe. Przestrzeń wartości powinna mieć przynajmniej zdefiniowany porządek (ordinal scale) a najlepiej gdyby była ciągła. Nieznane są dokładne wartości (są estymowane z danych) średnie oraz odchylenia standardowe populacji z jakiej pochodzą próbki. Hipoteza Test H: F(x) ~ N(x) H: F(x)!~ N(x) W teście wykorzystywana jest następująca statystyka: Gdzie: yi to posortowane próbki oraz ai to stałe wymagające weryfikacji. Cała idea testu W polega na spostrzeżeniu iż jeżeli faktycznie dane pochodzą z rozkładu normalnego o nieznanej wartości średniej µ oraz wariancji σ to wówczas powinniśmy być w stanie odwzorować te dane za pomocą prostego równania liniowego:
11 Gdzie: xi to uporządkowany zbiór zmiennych losowych o rozkładzie N(). Następnie metodą najmniejszych kwadratów możemy wyznaczyć nieznane współczynniki ai. Wektor tych wartości możemy wyznaczyć poprzez: Gdzie: V jest macierzą co-wariancji elementów wektora x zaś wektor m jest wektorem wartości oczekiwanych elementów x. Statystyka W ma największą wartość równą zaś najmniejszą wartość równą na/(n- ) (stąd dla dużych wartości n> minimalna wartość jest w przybliżeniu równa kwadratowi najmniejszego współczynnika). Im większa wartość statystyki tym bliższe jest dopasowanie do rozkładu normalnego - jednakże nie jest to wystarczające gdyż wysokie wartości mogą wynikać ze zbyt małych zbiorów danych które w rzeczywistości nie są normalne. Natomiast przy odpowiednio małym W należy odrzucić hipotezę zerową. Interpretacja Hipotezę zerową - populacja charakteryzuje się rozkładem normalnym - należy odrzucić jeżeli wartość p jest mniejsza niż wyznaczony poziomu istotności. Wówczas możemy stwierdzić iż dane nie są z rozkładu normalnego. W przypadku wartości p większych od wybranego poziomu istotności nie możemy odrzucić hipotezy zerowej że dane pochodzą z rozkładu normalnego. Przykładowo dla poziomu istotności. otrzymana z danych wartość p.3 nie powoduje odrzucenia hipotezy że dane pochodzą z rozkładu normalnego. Przykład w Matlabie W badaniu zebrano losowo wybranych mężczyzn których wzrost odnotowano. Po uporządkowaniu danych otrzymano następujące wyniki: data = Analizując czy dane te pochodzą z rozkładu normalnego wykorzystamy test W: [H pvalue W] = swtest(data alpha ) Otrzymujemy jako wynik: H= p=.674 W = Zatem dane te raczej nie pochodzą z rozkładu normalnego. Fakt ten można również potwierdzić analizując wykres qq danych:
12 Przeprowadź analizę dla grupy kontrolnej A oraz grupy poddanej terapii A czy dane te pochodzą z rozkładu normalnego: controla={ } treatmenta={ } oraz dla grupy B: sorted controlb={ } treatmentb= { } Testowanie zgodności - ćwiczenia: Czy zmienna cukier z pliku pacjenci.csv ma rozkład normalny? Czas zużycia się żarówek tego samego typu zawiera plik zarowki.csv. Na poziomie istotności zweryfikuj hipotezę że czas zużycia się żarówki ma rozkład normalny. Plik kondensator.csv zawiera maksymalne pojemności 4 kondensatorów (w pf). Przyjmując poziom istotności zweryfikuj hipotezę że rozkład pojemności kondensatorów jest normalny. Na podstawie danych z pliku absolwenci.xsl zbadaj czy płace absolwentów rolnictwa i pedagogiki mają rozkłady normalne.
13 3 Testowanie zgodności - zadanie: Zadanie. W celu zbadania efektu ochronnego pewnego leku w leczeniu astmatyków uczulonych na aspirynę poddano badaniom jedenastu pacjentów. W dwóch seriach badań podawano im lek lub placebo a następnie przeprowadzano prowokację aspirynową w celu określenia dawki aspiryny wywołującej % spadek wydolności płuc - PD [mg]. W trakcie badań pacjenci i personel medyczny nie wiedzieli czy podano lek czy placebo (tzw. podwójnie ślepa próba). Wyniki (tzn. PD) przedstawiono w tabeli L e k P la c e b o Czy można założyć że wyniki w sesjach Lek i Placebo są niezależnymi obserwacjami zmiennej losowej o rozkładzie normalnym? Z uwagi na właściwości organizmu ludzkiego dla którego spadek wydolności płuc jest proporcjonalny do logarytmu dawki aspiryny do dalszych rozważań należy wziąć zlogarytmowane pomiary xi=ln(pd Lek)i i yi= ln(pd Placebo)i. Czy po transformacji logarytmicznej założenie normalności jest uzasadnione? W wyniku analizy wyświetlone są p-wartości dla testów Kołmogorowa-Smirnowa Lillieforsa oraz testu Shapiro-Wilka - zinterpretować wyniki.
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych
1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW
Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa
Testowanie hipotez. 1 Testowanie hipotez na temat średniej
Testowanie hipotez Poziom p Poziom p jest to najmniejszy poziom istotności α, przy którym możemy odrzucić hipotezę zerową dysponując otrzymaną wartością statystyki testowej. 1 Testowanie hipotez na temat
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:
ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań
Jak sprawdzić normalność rozkładu w teście dla prób zależnych?
Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu
Szkice rozwiązań z R:
Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ
ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2
Statystyka w przykładach
w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie
Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia
Ekonometria. Zajęcia
Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.
Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. D A R I U S Z P I W C Z Y Ń S K I 2 2 ROZKŁAD ZMIENNEJ LOSOWEJ Polega na przyporządkowaniu
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
POLITECHNIKA WARSZAWSKA
POLITECHNIKA WARSZAWSKA WYDZIAŁ BUDOWNICTWA, MECHANIKI I PETROCHEMII INSTYTUT INŻYNIERII MECHANICZNEJ STATYSTYCZNA KONTROLA PROCESU (SPC) Ocena i weryfikacja statystyczna założeń przyjętych przy sporządzaniu
STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2
STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Analizy wariancji ANOVA (analysis of variance)
ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11
Testy zgodności Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej 27. Nieparametryczne testy zgodności Weryfikacja
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.
Zadanie 1 budżet na najbliższe święta. Podać 96% przedział ufności dla średniej przewidywanego budżetu świątecznego jeśli otrzymano średnią z próby równą 600 zł, odchylenie standardowe z próby równe 30
... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
Statystyka matematyczna. Wykład VI. Zesty zgodności
Statystyka matematyczna. Wykład VI. e-mail:e.kozlovski@pollub.pl Spis treści 1 Testy zgodności 2 Test Shapiro-Wilka Test Kołmogorowa - Smirnowa Test Lillieforsa Test Jarque-Bera Testy zgodności Niech x
ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x
ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Hipotezy statystyczne
Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
Badanie normalności rozkładu
Temat: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność
ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW
ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną
Hipotezy statystyczne
Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH I. TESTY PARAMETRYCZNE II. III. WERYFIKACJA HIPOTEZ O WARTOŚCIACH ŚREDNICH DWÓCH POPULACJI TESTY ZGODNOŚCI Rozwiązania zadań wykonywanych w Statistice przedstaw w pliku
Własności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Regresja logistyczna (LOGISTIC)
Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, Ŝe 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną
Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia
Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych
Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne
Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Wykład 9 Testy rangowe w problemie dwóch prób
Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora
Przykład 1 ceny mieszkań
Przykład ceny mieszkań Przykład ceny mieszkań Model ekonometryczny zaleŝności ceny mieszkań od metraŝu - naleŝy do klasy modeli nieliniowych. - weryfikację empiryczną modelu przeprowadzono na przykładzie
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej
Zadania ze statystyki cz.8. Zadanie 1.
Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,
Estymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
1 Estymacja przedziałowa
1 Estymacja przedziałowa 1. PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ (a) MODEL I Badana cecha ma rozkład normalny N(µ, σ) o nieznanym parametrze µ i znanym σ. Przedział ufności: [ ( µ x u 1 α ) ( σn ; x + u 1 α
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow
Testowanie Hipotez Wprowadzenie Testy statystyczne: pocz. XVII wieku (prace J.Arbuthnotta, liczba urodzeń noworodków obu płci w Londynie) Testowanie hipotez: Karl Pearson (pocz. XX w., testowanie zgodności,
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012