Rozkład Gaussa i test χ2

Podobne dokumenty
Prawdopodobieństwo i rozkład normalny cd.

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Statystyka matematyczna dla leśników

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Zawartość. Zawartość

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Weryfikacja hipotez statystycznych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Rozkład normalny, niepewność standardowa typu A

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Testowanie hipotez statystycznych.

Wykład 9 Wnioskowanie o średnich

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Zadania ze statystyki, cz.6

Ćwiczenie nr 2: ZaleŜność okresu drgań wahadła od amplitudy

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

WNIOSKOWANIE STATYSTYCZNE

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka matematyczna i ekonometria

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Hipotezy statystyczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Hipotezy statystyczne

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Analiza niepewności pomiarów

Elementy statystyki STA - Wykład 5

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych. Wykład tutora na bazie wykładu prof. Marka Stankiewicza

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Wydział Matematyki. Testy zgodności. Wykład 03

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych. Wykład tutora na bazie wykładu prof. Marka Stankiewicza

LABORATORIUM PROMIENIOWANIE w MEDYCYNIE

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

Wykład 9. Terminologia i jej znaczenie. Cenzurowanie wyników pomiarów.

Testy post-hoc. Wrocław, 6 czerwca 2016

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

LABORATORIUM PODSTAW TELEKOMUNIKACJI

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna i ekonometria

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Testowanie hipotez statystycznych.

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Testowanie hipotez statystycznych

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Rozkłady statystyk z próby

Podstawy opracowania wyników pomiarów

Pobieranie prób i rozkład z próby

Zadania ze statystyki cz.8. Zadanie 1.

Statystyczne Metody Opracowania Wyników Pomiarów

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wnioskowanie statystyczne. Statystyka w 5

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Testowanie hipotez statystycznych

LABORATORIUM Z FIZYKI

Komputerowa Analiza Danych Doświadczalnych

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyczne Metody Opracowania Wyników Pomiarów

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Ważne rozkłady i twierdzenia

Testowanie hipotez statystycznych. Wprowadzenie

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Sposoby opisu i modelowania zakłóceń kanałowych

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Wykład 3 Hipotezy statystyczne

Transkrypt:

Rozkład Gaussa jest scharakteryzowany dwoma parametramiwartością oczekiwaną rozkładu μ oraz dyspersją σ: METODA 2 (dokładna) polega na zmianie zmiennych i na obliczeniu pk jako różnicy całek ze standaryzowanego rozkładu Gaussa na krańcach przedziałów (w nowych zmiennych): W warunkach eksperymentu, przy skończonej liczbie pomiarów N, najlepszym oszacowaniem tych parametrów są odpowiednio średnia arytmetyczna xśr oraz niepewność standardowa pojedynczego pomiaru sx. Jeśli chcemy nanieść krzywą teoretyczną na histogram pomiarów musimy dla każdego przedziału histogramowania obliczyć oczekiwaną częstość pk (lub oczekiwaną liczbę zliczeń (krotność) Nk = N pk) wynikającą z rozkłady Gaussa, która jest równa: Wartości F(z) odczytujemy z tabeli 7 ze skryptu. W celu obliczenia całki z rozkładu Gaussa w granicach xk do xk+1 możemy zastosować dwie metody: METODA 1 (przybliżona) polega na wyznaczeniu pk poprzez obliczenie wartości gęstości w połowie k-tego przedziału histogramowania G(x1/2) i pomnożeniu przez szerokość przedziału Δ. Należy zauważyć, że w naszych rozważaniach rozkład Gaussa to gęstość prawdopodobieństwa i jest to wielkość tożsama z tym co nazywaliśmy gęstością przy tworzeniu histogramów (proszę zauważyć że wartości rozkładu Gaussa też mają jednostki [jedn.]-1). Działają tutaj znane już wzory wiążące częstość, liczbę zliczeń i gęstość. Przykład naniesienia teoretycznego rozkładu Gaussa (obliczonego dwiema metodami) na histogram uzyskany z 432 pomiarów okresu drgań wahadła (z pierwszej instrukcji) jest przedstawiony w tabeli 1 i na wykresie 1. Proszę zauważyć że rozkład teoretyczny można nanieść na histogram zarówno liczby zliczeń (krotności), częstości jak i gęstości. 1

Prawdopodobieństwo że wartość statystyki testowej χ2 będzie większa niż obserwowana wartość χ2 jest równe: g(χ2) Test χ2 pozwala nam odpowiedzieć na pytanie czy rozkład teoretyczny jest zgodny z rozkładem doświadczalnym, ale nie daje nam jednoznacznej odpowiedzi TAK lub NIE. Związane jest to z probabilistycznym charakterem tego testu i jak każdy hazard pociąga za sobą ryzyko. Ryzyko to, zwane błędem pierwszego rodzaju i powszechnie oznaczane symbolem α, równe jest prawdopodobieństwu odrzucenia testowanej hipotez, nawet wtedy, gdy hipoteza jest prawdziwa. Dzieje się tak dlatego, że w teście obliczana jest wartość statystyki testowej χ2 o rozkładzie prawdopodobieństwa P χ2 www.wikipedia.org Gęstość prawdopodobieństwa g(χ2) rozkładu χ2 dla różnej liczby Postać analityczna g(χ2) jest podana w instrukcji. stopni swobody. Wartość P można odczytać z tabeli 6 z instrukcji (w tabeli znajdują się wartości P nie dla wartości χ2 tylko dla zredukowanej wartości równej χ2/ ν). g(χ2) www.wikipedia.org χ2 Im odczytana wartość P jest większa tym bardziej rozkłady otrzymany (eksperymentalny) i zadany (teoretyczny) są ze sobą zgodne. Jeśli prawdopodobieństwo jest małe prawdopodobnie rozkłady są ze sobą niezgodne- w szczególności jeżeli P<5% uważamy taką niezgodność za istotną (http://en.wikipedia.org/wiki/chisquare_distribution). χ2 Statystyka w wielokrotnie powtarzanych, w tych samych warunkach, eksperymentach może przyjąć różne wartości, przy czym, na mocy swej konstrukcji, duże jej wartości sugerują brak zgodności z modelu teoretycznego z modelem doświadczalnym. Z powodu losowego charakteru statystyki może się zdarzyć, że jej wartość χ2 w konkretnym doświadczeniu jest na tyle duża, że odrzucimy badaną hipotezę, nawet jeżeli ona jest prawdziwa. Tolerowalne prawdopodobieństwo takiego zdarzenia wyznacza poziom wspomnianego ryzyka. Przykładowo, jeśli owe ryzyko ustalimy na 5%, to będzie to oznaczało, że gotowi jesteśmy odrzucić hipotezę o zgodności rozkładów w jednym przypadku na, nawet wtedy, gdy rozkład doświadczalny jest realizacją modelu teoretycznego. 2

g(χ2) Zauważmy, że test χ2 może być sformułowany nieco inaczej: zamiast odczytywania dla naszego χ2 prawdopodobieństwa P z tablic możemy najpierw założyć pewne prawdopodobieństwo P (czyli α), zobaczyć jaka granica całkowania χkr2 odpowiada temu prawdopodobieństwu i porównać nasz parametr χ2 już z liczbą - χkr2 ale pamiętając że porównanie zostało zrobione na poziomie P (czyli α). Taka taktyka jest przyjęta w skrypcie. P czy α χkr2 W tabeli 2 przeprowadzony został test χ2 dla rozkładu 432 pomiarów drgań wahadła (ograniczono się do liczenia wartości oczekiwanych pk drugą, dokładną metodą). Ponieważ warunkiem przeprowadzenia testu χ2 jest liczba zliczeń w każdym przedziale powyżej 5, połączone zostały ze sobą cztery pierwsze i cztery ostatnie przedziały histogramowania. Stopień swobody, gdzie m to liczba przedziałów histogramowania, wyniósł 8. Parametr χ2 policzony ze znanego Państwu wzoru: wyniósł 38.41 (czyli zredukowana wartość χ2 wyniosła 4.8). Oznacza to, patrząc na tabele 5 z instrukcji, że odrzucamy hipotezę o zgodności rozkładów na poziomie (z prawdopodobieństwem błędu pierwszego rodzaju) poniżej.1%. Tabela 6 z instrukcji, jako mniej dokładna, jest w tym wypadku mniej dla nas użyteczna ponieważ mówi nam że błąd pierwszego rodzaju jest poniżej.2%. czy χ2 χkr2? Wartości χkr2 dla paru wartości α w granicach.1-1% można odczytać z tabeli 5 z instrukcji. Widzimy że podane α są małe co skutkuje dużą tolerancją testu χ2 przykładowo jeśli dopuścimy możliwość odrzucenia prawdziwej hipotezy z prawdopodobieństwem α= 1% dla zagadnienia w którym stopień swobody wyniósł 6 odczytujemy χkr2= 16.81 co daje nam dużą szansę że obliczone dla naszego przypadku χ2 będzie od χkr2 mniejsze i test χ2 i hipoteza o zgodności rozkładów nie będzie odrzucona. Jeśli jednak obliczone χ2 będzie większe niż 16.81 możemy zmienić nasz warunek na α, z mniejszą α χkr2 rośnie a więc szanse na to że χ2< χkr2 rosną. W tabeli 3 przedstawiono wymyślony rozkład okresów drgań wahadła taki by dobrze pasował do rozkładu Gaussa. Parametr χ2 wyniósł 1.61 (zredukowana wartość.). Widzimy, że w tym przypadku tabela 5 jest dla nasz bezużyteczna a z tabeli 6 odczytujemy że odrzucenie hipotezy wiązało by się z błędem pierwszego rodzaju 99%. Tutaj lepiej powiedzieć że nasze pomiary są niesprzeczne z hipotezą o zgodności rozkładów w 99% (na poziomie 99%). Bibliografia: J.R Taylor, Wstęp do analizy błędu pomiarowego, PWN, 1995 www.wikipedia.org 3

Wartości eksperymentalne Wartości oczekiwane (z rozkładu teoretycznego, tu: rozkładu Gaussa) metoda przybliżona metoda dokładniejsza liczba zliczeń nk częstość pk gęstość fk [s -1 ] ½ przedziału T1/2 [s] fk G(T1/2) [s -1 ] pk =G(T1/2) Δ Nk = pk N w nowych zmiennych z pk =F(zk+1)-F(zk) fk= pk/ Δ [s -1 ] Nk=N pk (3.5-3.8] 1.2.8 3.65.49.1.64 (-3.23, -2.85].2.5.67 (3.8-3.11] 1.2.8 3.95.145.4 1.87 (-2.85, -2.47].5.15 1.99 (3.11-3.14] 1.2.8 3.125.367.11 4.76 (-2.47, -2.1].11.37 4.8 (3.14-3.17] 14.32 1.8 3.155.88.24 1.48 (-2.1, -1.72].25.83 1.71 23.53 1.77 3.185 1.545.46.3 (-1.72, -1.35].46 1.53 19.79 25.58 1.93 3.215 2.564.77 33.22 (-1.35, -.97].78 2.58 33.48 75.174 5.79 3.245 3.691.111 47.84 (-.97, -.59].112 3.72 48.21 67.155 5.17 3.275 4.613.138 59.79 (-.59, -.22].135 4.51 58.45 79.183 6.1 3.35 5.4.15 64.85 (-.22,.16].151 5.2 65.1 32.74 2.47 3.335 4.71.141 61.4 (.16,.54].142 4.73 61.26 47.19 3.63 3.365 3.848.115 49.87 (.54,.91].113 3.77 48.9 33.76 2.55 3.395 2.728.82 35.36 (.91, 1.29].83 2.76 35.81.46 1.54 3.425 1.679.5 21.76 (1.29, 1.67].51 1.7 22.3 (3.44-3.47] 1.23.77 3.455.897.27 11.62 (1.67, 2.4].27.89 11.58 (3.47-3.5] 1.2.8 3.485.416.12 5.39 (2.4, 2.42].13.43 5.57 (3.5-3.53] 1.2.8 3.515.167.5 2.17 (2.42, 2.8].5.17 2.25 (3.53-3.56] 2.5.15 3.545.58.2.76 (2.8, 3.17].2.6.79 suma: 432 1 1 432 1 432 średnia Tśr 3.37 s μ niepewność standardowa pojedynczego pomiaru st.8 s σ Tabela 1. Wartości eksperymentalne oraz wartości oczekiwane z rozkładu Gaussa okresu drgań wahadła. 4

(3.5-3.8] (3.8-3.11] (3.11-3.14] (3.14-3.17] (3.44-3.47] (3.47-3.5] (3.5-3.53] (3.53-3.56] gęstośd [s -1 ] (3.5-3.8] (3.8-3.11] (3.11-3.14] (3.14-3.17] (3.44-3.47] (3.47-3.5] (3.5-3.53] (3.53-3.56] (3.5-3.8] (3.8-3.11] (3.11-3.14] (3.14-3.17] (3.44-3.47] (3.47-3.5] (3.5-3.53] (3.53-3.56] liczba zliczeń częstośd 9 8 7 5 4 3 1..18.16.14.12.1.8.6.4.2. 7 6 5 4 3 2 1 Wykres 1. Histogram okresów drgań wahadła wraz z naniesioną krzywą teoretyczną wyznaczoną metodą przybliżoną oraz metodą dokładniejszą 5

Wartości eksperymentalne liczba zliczeń nk Wartości oczekiwane pk =F(zk+1)-F(zk) w nowych Nk=N pk zmiennych z 17 23 25 75 67 79 32 47 33 14 18.45 19.79 33.48 48.21 58.45 65.1 61.26 48.9 35.81 22.3.52.11.52 2.15 14.89 1.25 2.97 13.97.7.22.19 2.7 suma: 432 χ 2 38.41 ν=8 liczba stopni swobody χ 2/ν 4.8 liczba zliczeń (- -3.17] (3.44- ] (-, (-1.72, (-1.35, (-.97, (-.59, (-.22, (.16, (.54, (.91, (1.29, (1.67, -1.72] -1.35] -.97] -.59] -.22].16].54].91] 1.29] 1.67] ].427.458.775.1116.1353.157.1418.1132.829.51.475 9 8 7 5 4 3 1 6 Tabela 2 + Wykres 2. Wartości eksperymentalne oraz wartości oczekiwane liczby zliczeń nk okresu drgań wahadła oraz obliczony parametr χ 2

Wartości eksperymentalne liczba zliczeń nk (- -3.17] 19 21 33 48 54 73 47 36 22 (3.44- ] 19 suma: ν=8 pk =F(zk+1)-F(zk) Nk=N pk.427.458.775.1116.1353.157.1418.1132.829.51 18.45 19.79 33.48 48.21 58.45 65.1 61.26 48.9 35.81 22.3.17.75.7.93.34.96.26.74.98.5.475.52.11 432 χ 2 1.61 liczba stopni swobody χ 2/ν. liczba zliczeń Wartości oczekiwane w nowych zmiennych z (- (-1.72 (-1.35 (-.97 (-.59 (-.22 (.16 (.54 (.91 (1.29, -1.72], -1.35], -.97], -.59], -.22],.16],.54],.91], 1.29], 1.67] (1.67, ] 8 7 5 4 3 1 7 Tabela 3 + Wykres 3. Wartości eksperymentalne (wymyślone) oraz wartości oczekiwane liczby zliczeń nk okresu drgań wahadła oraz wyliczony parametr χ 2