ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW



Podobne dokumenty
HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Wykład 3 Hipotezy statystyczne

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i rozkład normalny cd.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Analiza niepewności pomiarów

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Kolokwium ze statystyki matematycznej

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Testowanie hipotez statystycznych.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna dla leśników

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Spis treści 3 SPIS TREŚCI

Testowanie hipotez statystycznych

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Hipotezy statystyczne

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Testowanie hipotez statystycznych. Wprowadzenie

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Hipotezy statystyczne

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka matematyczna i ekonometria

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Testowanie hipotez statystycznych.

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyka matematyczna i ekonometria

Oszacowanie i rozkład t

Testowanie hipotez statystycznych.

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Weryfikacja hipotez statystycznych testy t Studenta

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

166 Wstęp do statystyki matematycznej

Wydział Matematyki. Testy zgodności. Wykład 03

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Test lewostronny dla hipotezy zerowej:

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

Metody Statystyczne. Metody Statystyczne.

Zawartość. Zawartość

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WNIOSKOWANIE STATYSTYCZNE

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

STATYSTYKA MATEMATYCZNA narzędzie do opracowywania i interpretacji wyników pomiarów

Wnioskowanie statystyczne. Statystyka w 5

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Zadania ze statystyki, cz.6

Statystyczne Metody Opracowania Wyników Pomiarów

1 Podstawy rachunku prawdopodobieństwa

Testowanie hipotez statystycznych

Rozkłady statystyk z próby

STATYSTYKA

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

INFORMATYKA W CHEMII Dr Piotr Szczepański

Dokładne i graniczne rozkłady statystyk z próby

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Rozkład Gaussa i test χ2

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Transkrypt:

ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną rozkładem Gaussa i przyjmijmy, że jest to rozkład N(µ,σ), to własności rozkładu mogą być pomocne w sformułowaniu kryterium odrzucania wyników obarczonych błędem grubym. ( µ 1σ < x < µ + 1σ ) = 0.6827 ( µ - 2σ < x < µ + 2σ ) = 0.9545 ( µ - 3σ < x < µ + 3σ ) = 0.9973 Jeżeli jako oszacowanie µ przyjmiemy x sr, a jako 0.5 oszacowanie σ odchylenie standardowe pojedynczego 0.4 pomiaru s to możemy przyjąć, że odrzucamy taki pomiar x, dla którego x x sr >= 3 s Gdyż prawdopodobieństwo tego, że taka wartość pojawi się przypadkowo w serii pomiarów 0.3 0.2 0.1 0 o dyspersji s jest bardzo małe µ 3σ µ 2σ µ 1σ µ µ + 1σ µ + 2σ µ + 3σ (równe 0.0027). Zmienna losowa x (np. wynik pomiaru) Gęstość prawdopodobieństwa Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 1

RZEDZIAŁY UFNOŚCI WARTOŚCI ŚREDNIEJ W wielu przypadkach informacja o wyniku pomiarów nie jest wystarczająca potrzebna jest jeszcze wiedza o tym, z jakim prawdopodobieństwem wartość prawdziwa mieści się w określonym przedziale wokół wyniku pomiarów. rzedział taki nazywamy przedziałem ufności, a prawdopodobieństwo, że wartość prawdziwa mieści się w tym przedziale - poziomem ufności. Określonemu poziomowi ufności γ odpowiada wiele możliwych przedziałów ufności. W przypadku rozkładu Gaussa przedział ufności definiuje się zazwyczaj tak, aby był symetryczny względem wartości oczekiwanej (prawdziwej) µ. µ f(x)dx = f(x)dx = a b µ rzyjmijmy, że na podstawie serii n pomiarów x 1,..., x n wyznaczamy wartość średnią x SR, rozkład wyników jest rozkładem normalnym N(µ,σ) a dyspersja rozkładu σ jest znana lub przynajmniej dokładnie oszacowana w oparciu o wyniki pomiarów (tzn. seria liczy co najmniej kilkanaście pomiarów). Jeżeli zdefiniujemy nową zmienną losową u jako: xsr µ u = σ/ n to zmienna ta podlega rozkładowi Gaussa N(0,1). 1 2 γ Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 2

Z własności rozkładu Gaussa: ( 1 ( 2 ( 3 µ 1) = 0.6827 σ/ n µ 2) = 0.9545 σ/ n µ 3) = 0.9973 σ/ n rzekształcając powyższe wyrażenie możemy zapisać: [( (σ / n) ) µ ( + (σ / n) )] = 0. 6827 [( 2 (σ( / n) ) µ ( + 2 (σ / n) )] =. [( x 3 (σ / n) ) µ ( x + 3 (σ / n) )] = 0. 9973 sr sr 0 9545 Wyrażenia te definiują przedziały ufności o poziomach ufności odpowiednio: 0.6827, 0.9545, 0.9973. Należy zwrócić uwagę na to, że chociaż wartość oczekiwana rozkładu (i odpowiadająca jej wartość prawdziwa) nie jest zmienną losową, to mówimy o prawdopodobieństwie tego, iż znajduje się ona w określonym przedziale. W tym przypadku, podobnie jak przy metodzie największej wiarygodności, prawdopodobieństwo nie ma interpretacji częstościowej, lecz jest miarą naszej wiedzy na temat wyznaczanej wielkości. Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 3

Rozkład Studenta W praktyce najczęściej mamy jednak do czynienia z sytuacją, gdy dyspersja pomiarów nie jest znana, a może być jedynie oszacowana na podstawie serii liczącej kilka wyników. Wówczas jako estymator dyspersji przyjmuje się odchylenie standardowe pojedynczego pomiaru n 2 ( xi ) sx = i= 1 n 1 W takim przypadku możemy w sposób analogiczny do zmiennej u zdefiniować zmienną losową t : xsr µ xsr µ t = = s / n s x jednakże zmienna ta nie podlega w ogólności rozkładowi Gaussa. Rozkład prawdopodobieństwa, który opisuje zmienną t nosi nazwę rozkładu Studenta (nie dlatego, że lubią go studenci lecz od pseudonimu angielskiego statystyka W.S. Gosseta, który swoje prace tak właśnie podpisywał). Funkcja gęstości prawdopodobieństwa dla tego rozkładu wyraża się wzorem: ν + 1 ν+ 1 Γ 2 2 2 t f ( t, ν ) = 1+ ν ν Γ νπ 2 arametr ν nosi nazwę ilości stopni swobody, a funkcja gamma Eulera Γ(x) jest uogólnieniem silni na zbiór liczb rzeczywistych tzn. Γ(x) = (x-1) Γ(x-1). Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 4

Krzywa przedstawiająca rozkład Studenta jest dla małych wartości stopnia swobody szersza od krzywej Gaussa, jednakże już dla ν = kilkanaście przyjmuje kształt bliski krzywej Gaussa. 0.45 0.4 0.35 0.3 Gaussa Studenta - 1 stopnień swobody Studenta - 5 stopni swobody Studenta - 15 stopni swobody f(t,ν) 0.25 0.2 0.15 0.1 0.05 0-6 -5-4 -3-2 -1 0 1 2 3 4 5 6 t Wartość oczekiwana rozkładu E(t) =0, a wariancja istnieje tylko dla ν > 2 i wynosi ν V(t) = ν 2 Trzeba podkreślić, iż z powyższego faktu wynika, że dla rozkładu Studenta o małych wartościach ν odchylenie standardowe nie jest dobrym estymatorem dyspersji. Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 5

W rozważanym przypadku zmiennej t wyznaczonej w oparciu o wartość średnią i odchylenie standardowe wyznaczone na podstawie serii n pomiarów liczba stopni swobody określona jest właśnie przez liczbę pomiarów i wynosi ν= n -1 Interesować nas będą przedziały ufności o poziomach ufności γ przyjmujących te same wartości jak w przedstawionym wcześniej przypadku dla zmiennej u tzn. 0.6827, 0.9545 oraz 0.9973. rzedziały te wyznaczamy z gęstości prawdopodobieństwa rozkładu Studenta. o odpowiednich wyliczeniach otrzymuje się następujące wartości przedziałów ufności: [( x k s ) ( x k s )] 0. sr 1 µ + sr 1 = [( x k s ) ( x k s )] 0. sr 2 µ + sr 2 = [( x k s ) µ ( x + k s )] = 0. 9973 sr 3 sr ( b t b ) = f ( t,n 1)dt = γ 3 b b 6827 9545 Wartości k 1, k 2,k 3 zależą od ilości stopni swobody, czyli liczby pomiarów. rzykładowe wartości zawarte są w tabeli. n 3 4 5 10 15 20 50 1.242 1.186 1.142 1.076 1.056 1.045 1.029 3.381 2.922 2.688 2.307 2.200 2.151 2.067 9.778 6.993 5.737 4.047 3.654 3.481 3.203 Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 6 k 1 k 2 k 3

TESTOWANIE HIOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy taką hipotezę dotyczącą badanej populacji, która nadaje się do sprawdzenia metodami statystycznymi na podstawie wyników badań próby. W tym sensie hipotezy dotyczące mierzonych wielkości i weryfikowane na podstawie wyników pomiarów mają charakter hipotez statystycznych. Hipotezami statystycznymi są m.in.. następujące stwierdzenia: - średnie miesięczne wynagrodzenie w gospodarce narodowej w olsce wynosi 2200 zł, - wartość przyspieszenia ziemskiego wynosi g=9.81 m/s 2, - wyniki dwóch niezależnych pomiaru oporu elektrycznego wynoszące R=352 Ω z niepewnością u(r)=18 Ω oraz R=385 Ω z niepewnością u(r)=15 Ω są zgodne ze sobą, - ilość rozpadów promieniotwórczych zachodzących w jednostce czasu jest zmienną losową o rozkładzie oissona. Hipotezy statystyczne dzielimy na: Hipotezy parametryczne - dotyczące parametrów rozkładów prawdopodobieństwa. Hipotezy nieparametryczne - które nie dotyczą parametrów rozkładów prawdopodobieństwa ( a np. rodzaju rozkładu jakiemu podlega dana zmienna losowa). Weryfikacji hipotez statystycznych dokonuje się za pomocą testów statystycznych. Testowanie polega na wyznaczeniu wartości funkcji testowej, która jest zmienną losową wyznaczoną na podstawie próby. Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 7

rocedura testowania hipotezy statystycznej przebiega następująco: 1. W zależności od rodzaju problemu, którego dotyczy hipoteza przyjmujemy odpowiednią funkcję testową. 2. Wyznaczamy wartość funkcji testowej na podstawie danych z próby (wyników pomiarów). 3. rzyjmujemy wartość poziomu istotności α. Wartość ta pozwala określić granice tzw. obszaru krytycznego. Wartość poziomu istotności jest równa prawdopodobieństwu tego, że w wyniku testu odrzucimy hipotezę mimo, iż jest ona prawdziwa. Dlatego też w praktyce przyjmuje się wartości α znacznie mniejsze od 0.1. 4. Jeżeli wyznaczona wartość funkcji testowej jest zawarta w obszarze krytycznym hipotezę możemy odrzucić. 5. Jeżeli wyznaczona wartość funkcji testowej mieści się poza obszarem krytycznym, wówczas nie ma podstaw do odrzucenia hipotezy. Należy jednak podkreślić, że wynik ten nie jest dowodem słuszności hipotezy - nie możemy zatem powiedzieć, że uzyskany wynik potwierdza hipotezę. Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 8

TESTOWANIE ZGODNOŚCI WARTOŚCI ŚREDNIEJ Z ZADANĄ WARTOŚCIĄ I ZGODNOSCI WARTOŚCI ŚREDNICH Hipoteza jaką w tym przypadku formułujemy jest następująca: wynik pomiaru x sr jest zgodny z zadaną wartością x z. Jest ona równoznaczna z pytaniem czy wartość x z jest równa prawdziwej wartości wielkości mierzonej (wartości oczekiwanej µ). Sytuacjami, w których przeprowadzamy tego typu test jest stwierdzenie zgodności wyniku pomiarów z wartością tablicową (a więc o wiele dokładniejszą) lub z wartością z góry założoną. Z pierwszą przypadkiem mamy często do czynienia na pracowni studenckiej, z drugim podczas sprawdzania czy dany egzemplarz wyrobu jest zgodny z założeniami (np. wyprodukowany opornik ma opór założony jako nominalny). Najwygodniejszą funkcją testową jest wyrażenie: t xz = u( x sr ) Jeżeli x z = µ to zmienna t jest zmienną losową o rozkładzie: - Gaussa N(0,1) jeśli x sr wyznaczone zostało na podstawie co najmniej kilkudziesięciu pomiarów (czyli u(x sr ) jest dość dokładnym oszacowaniem dyspersji), -Studenta o E(t)=0 i n-1 stopniach swobody (n - liczba pojedynczych pomiarów wykorzystanych do wyznaczenia średniej) jeśli x sr wyznaczono na podstawie kilku kilkunastu pomiarów. Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 9

Oznacza to, iż prawdopodobieństwo, że t będzie zacznie różniło się od zera jest niewielkie. Jeśli więc t jest znacznie większe lub mniejsze od 0, to oznacza iż x z nie jest zgodne z wartością średnią z pomiarów. 0.5 W celu przeprowadzenia testu określamy dwustronny obszar 0.4 krytyczny o poziomie istotności α. Za wartość α przyjmuje się 0.3 przeważnie 0.05 lub 0.003, co odpowiada w przybliżeniu 0.2 odległości pomiędzy x sr a x z 0.1 równej co najmniej 2 u(x sr ) lub 0.5α 0.5α 3 u(x sr ) dla rozkładu Gaussa 0 albo co najmniej k 2 u(x sr ) lub 4 3 2 1 0 1 2 3 4 k 3 u(x sr ) dla rozkładu Studenta. Zmienna losowa t Zatem jeżeli x sr - x z > k u(x sr ) gdzie k = 2 lub k 2 albo k = 3 lub k 3 to na poziomie istotności odpowiednio 0.05 lub 0.003 hipotezę o zgodności wartości średniej z zadaną możemy odrzucić. W analogiczny sposób przeprowadza się testowanie zgodności dwóch wartości średnich x 1sr i x 2sr określonych z niepewnościami u(x 1sr ) i u(x 2sr ) (zgodności dwóch wyników niezależnie przeprowadzonych pomiarów) z tym, że jako funkcję testową przyjmuje się wówczas 1 2 t = 2 2 u x ) + u( x ) Gęstość prawdopodobieństwa ( sr1 sr2 Dr Adam Michczyński - METODY ANALIZY DANYCH OMIAROWYCH 10 10