Komputerowa Analiza Danych Doświadczalnych

Podobne dokumenty
Komputerowa analiza danych doświadczalnych

Komputerowa analiza danych doświadczalnych

Weryfikacja hipotez statystycznych

Metoda największej wiarygodności

Komputerowa Analiza Danych Doświadczalnych

Komputerowa analiza danych doświadczalnych

Komputerowa analiza danych doświadczalnych

Komputerowa Analiza Danych Doświadczalnych

Statystyka matematyczna dla leśników

Ważne rozkłady i twierdzenia c.d.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Komputerowa analiza danych doświadczalnych

STATYSTYKA

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez statystycznych.

Rozkłady statystyk z próby

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Ważne rozkłady i twierdzenia

Wykład 3 Hipotezy statystyczne

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

166 Wstęp do statystyki matematycznej

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

KADD Metoda najmniejszych kwadratów funkcje nieliniowe

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna i ekonometria

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Prawdopodobieństwo i rozkład normalny cd.

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Własności statystyczne regresji liniowej. Wykład 4

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Wnioskowanie statystyczne. Statystyka w 5

Testowanie hipotez statystycznych.

Statystyka matematyczna i ekonometria

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Estymacja punktowa i przedziałowa

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Metody Statystyczne. Metody Statystyczne.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

WYKŁAD 8 ANALIZA REGRESJI

Spis treści 3 SPIS TREŚCI

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Estymacja parametrów w modelu normalnym

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Hipotezy statystyczne

Hipotezy statystyczne

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Testowanie hipotez statystycznych

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Testowanie hipotez statystycznych cd.

1 Podstawy rachunku prawdopodobieństwa

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Kolokwium ze statystyki matematycznej

Metody probabilistyczne

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Analiza niepewności pomiarów

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Oszacowanie i rozkład t

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

PDF created with FinePrint pdffactory Pro trial version

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Testowanie hipotez statystycznych.

STATYSTYKA MATEMATYCZNA

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Transkrypt:

Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 34 58 5 konsultacje: poniedziałek: 0-, środa: - www: http://www.if.pw.edu.pl/~gos/students/kadd Politechnika Warszawska Wydział Fizyki Pok. 7b (wejście przez 5)

METODA AJWIĘKSZEJ WIARYGODOŚCI

Metoda największej wiarygodności Iloraz wiarygodności Do tej pory: estymacja wartości oczekiwanej, wariancji (bez wnikania jak konstruować estymatory). - p parametrów, l= l, l,...,l p - określone funkcją prawdopodobieństwa: - dla zmiennych losowych f =f x,l Przeprowadzone doświadczeń (lub pobrana próba elementowa), pojedyncze doświadczenie (pomiar wielkości x lub pobranie próby o liczebności ) może doprowadzić do uzyskania wyniku x (j). Doświadczeniu przypisujemy liczbę: x= x, x,..., x n To prawdopodobieństwo a posteriori.. Mówi ono po uzyskaniu wyniku, jakie było prawdopodobieństwo uzyskania tego właśnie wyniku (tzn. wartości x (j) ). dp j =f x j ;l dx x i ( j) < x ( j) x i ( j) +dx i ( j) i=,,..., n 3

Metoda największej wiarygodności Iloraz wiarygodności Dla próby (niezależnych) elementów, prawdopodobieństwo uzyskania wyniku: Wynosi: x, x,..., x dp= j= Gdy prawdopodobieństwo zależy od np. parametrów: Q= j= j= f x j ;l d x f x j ;l d x Zbiór parametrów typu pierwszego jest Q razy bardziej prawdopodobny niż zbiór parametrów typu drugiego. Jest to iloraz wiarygodności. L= j= f x j ;l d x f x j ; l d x Funkcja wiarygodności - Jest zmienną losową. 4

Iloraz wiarygodności - przykład Rzut asymetryczną monetą,, na podstawie uzyskanych wyników próbujemy ustalić, czy moneta należy do klasy A, czy do klasy B monet. A orzeł /3 /3 reszka /3 /3 B Próba to 5 rzutów: orzeł i 4 reszki. L A = 3 3 4 L B = 3 3 4 Q= L A L B =8 Z dużą dozą prawdopodobieństwa moneta należy do klasy monet A. 5

Metoda największej wiarygodności - ajwiększą ufnością obdarzony zbiór parametrów, którego funkcja wiarygodności osiąga maksymalną wartość. - Wyznaczenia maksimum: : przyrównać do zera pierwszą pochodną funkcji wiarygodności względem l i. - Ułatwienie obliczeń rachunkowych logarytm funkcji wiarygodności L: L ł=ln L= i= Logarytmiczna funkcja wiarygodności. ln f x j ;l L(l) L(l) l max l l 3 max l max l max l 6

Metoda największej wiarygodności Jeśli wektor l ma tylko jedną składową: l, należy rozwiązać równanie wiarygodności: dł ' ł '= dl =0 ł= i= x j ;l = W przypadku ogólnym, wektor l ma p składowych: dł ' dl i =0 i= d ln f x j ;l = dl d dl f x j ;l f x j ;l i=,,..., p f f ' = i= x j ;l 7

Powtarzanie pomiarów o różnej dokładności - przykład Pomiar danej wielkości różnymi przyrządami pomiarowymi - pomiary będą układały się wokół wartości rzeczywistej, - zakładamy, że niepewności będą miały rozkład normalny, - pojedynczy pomiar: : pobieranie próby o liczebności z rozkładu normalnego o wart. średniej i war. σ. Prawdopodobieństwo a posteriori dla uzyskanej wartości x (j) (j) : f x j ;l dx= exp x j l dx j j Dla pomiarów funkcja wiarygodności: L= j= exp x j l dx j j Logarytm funkcji wiarygodności: ł= x j l const j= j l max = Równanie wiarygodności: dł dl = x j l =0 j= j= j= x j j j Wynik najbardziej wiarygodny jest średnią ważoną pomiarów, wagi są odwrotnościami wariancji. 8

Oszacowanie parametru rozkładu hipergeometrycznego Jeśli estymowany parametr może przyjmować wartości dyskretne: Prawdopodobieństwo wyłowienia n ryb, z których k było zaznaczonych. wszystkich ryb, K zaznaczone: Szukane, dla którego L osiągnie maksimum. Iloraz: L k ;n, K, = K k K n k n L k ;n, K, L k ;n,k, = n k n K k L osiąga maksimum dla wartości całkowitej, najbliższej nk/k 9

ierówność informacyjna Jak skonstruować estymator o optymalnych własnościach? ) Estymator jest nieobciążony, jeśli wartość obciążenia B(l) wynosi 0 dla każdej próby: B l =E S l=0 ) Wariancja estymatora ma być jak najmniejsza: S minimalna Często należy szukać kompromisu między minimalnym obciążeniem, a minimalną wariancją (ze względu na fakt istnienia nierówności informacyjnej). Wariancja przybiera minimalną wartość, kiedy estymator S jest stałą (wariancja wynosi wtedy 0). Jeśli estymator Gęstość prawdopodobieństwa próby (losowej): Wartość oczekiwana: S x, x,..., x jest funkcją próby x, x,..., x f x, x,..., x ;l =f x ;l f x ;l... f x ;l,to łączna E S = S x, x,..., x f x ;l f x ;l... f x ;l dx dx...dx 0

ierówność informacyna, estymator o min. wariancji E S =B l l Wyrażenie można różniczkować. B ' l Można dowieść, że nierówność informacyjna: B ' l S I l Informacja próby ze względu na l. I l =E ł ' =E { f ' x ;l f x ;l } ierówność informacyjna: : związek między obciążeniem, wariancją i informacją zawartą w próbie. ie został wybrany żaden konkretny estymator, a nierówność stanowi ograniczenie od dołu dla wariancji estymatora. Jest to ograniczenie dla minimalnej wariancji (ograniczenie Cramera-Rao). Kiedy obciążenie nie zależy od l: S I l

Estymator o min. wariancji, estymator wystarczający Jaki jest warunek osiągnięcia minimalnej wariancji,, kiedy zachodzi wzór: Można dowieść, że kiedy: A co za tym idzie: B ' l S = I l ł= A l S E S l= ł dl=b l S C l D L=d exp B l S C l (*) Estymatory związane z funkcja wiarygodności zapewniają minimalną wariancję (zgodnie Z nierównością informacyjną) estymatory o minimalnej wariancji. Dla estymatora nieobciążonego, można dowieść, że: S = I l S = A l Jeśli zamiast relacji (*) zachodzi słabszy warunek: To S jest estymatorem wystarczającym dla l. L=g S,l c x, x,..., x

Estymator parametru rozkładu Poissona Rozkład Poissona: f k = k k! e Funkcja wiarygodności dla próby ł= j= k, k,..., k [k j ln ln k j! ] dł ' d =ł '= [ j= ł= k j k ]= j= [k j ] Średnia arytmetyczna k jest nieobciążonym estymatorem o minimalnej wariancji. 3

Estymator parametru rozkładu dwumianowego Funkcja wiarygodności dla rozkładu dwumianowego o parametrach: p = λ oraz q = p = - λ. L k ; = Otrzymujemy stąd: n! k! n k! k n k ł=ln L=k ln n k ln ln ł '= k n k = n k n n! k! n k! Średnia arytmetyczna k/n jest estymatorem o minimalnej wariancji /n 4

Prawo kombinacji błędów p. pomiar danej wielkości różnymi przyrządami pomiarowymi. dł dl =ł '= j= x j l j ł '= j= x j j j ł '= j= x j { j j j } S= x j j To nieobciążony estymator wartości średniej l. Ma też minimalną wariancję. j Wariancja: S = j= Prawo kombinacji niepewności lub uśrednianie niepewności w kwadratach. S = j Kiedy jest jednakowa dokładność pomiarów: x / x... x n S= x S = /n 5

Własności asymptotyczne estymatorów i f. wiarygodności Próba jest duża ( ). Estymator S zdefiniowany jako rozwiązanie równania wiarygodności: dł l dl =ł ' l = j= f ' x j ;l =0 f x j ;l l max Zakładając, że istnieje druga pochodna ł(l) względem l rozwijamy ł'(l) w szereg Taylora: ł ' l =ł ' l max l l max ł ' ' l max... ł ' ' l max = f ' x j ' ;l j= f x j ;l l max Wyrażenie to wartość średnia z próby; kiedy duże zastąpić można wartością oczekiwaną: { ł ' ' l max = E f ' x j ;l } f x j ;l l max ' ł ' ' l max =E ł ' ' l max = E ł l max = I l max = /b b zależy jedynie od wartości gęstości prawdopodobieństwa f i estymatora l max max. 6

Własności asymptotyczne estymatorów i f. wiarygodności Funkcję wiarygodności (k= const): L l =k exp{ l l max /b } Można dowieść, że: S=l max l max E S =l To nieobciążony estymator o minimalnej wariancji: l max =b = I l max = E ł ' l max = E ł ' ' l max Estymator ma ww. własności w granicznym przypadku dla dużych. Funkcja wiarygodności jest asymptotycznie normalna. Funkcja wiarygodności L(l) to miara prawdopodobieństwa, że wartość prawdziwa l 0 l=l max ± l max =l max ± l Funkcja wiarygodności asymptotycznie dąży do rozkładu normalnego; Prawdopodobieństwo tego, że wartość prawdziwa: l max l max l 0 l max l wynosi 68.3% par. l = l. 7

Jednoczesna estymacja kilku parametrów Mamy estymować jednocześnie p parametrów: l = (l, l,..., l p ł l i =0 i=,,..., p Otrzymamy niepewności parametrów,, a nie same parametry. ). Zgodnie z równaniami: ależy uwzględnić także korelacje między parametrami i ich niepewności. logarytmiczna funkcja wiarygodności: ł x, x,..., x ;l = i= rozwijając w szereg Taylora wokół punktu: ln f x j ; l p ł l =ł l max ł l k= l k l k max p k l max n= ł l k l max =0 k=,,..., p l max = l max,l max,...,l p max p m= ł l n l m l max l n l max n l m l max m... 8

Jednoczesna estymacja kilku parametrów Rozwinięcie upraszcza się: A= ł l ł l l... ł l l p ł ł ł... l l l l l p............ ł ł ł... l l p l l p l p l=l max ł l ł l max = l l max T A l l max... 9

Jednoczesna estymacja kilku parametrów Kiedy : E B=E A = ł l E ł ł... E l l l l p ł E E ł l l l... E ł l l p............ ł ł E E... E ł l l p l l p l p l=l max Funkcja wiarygodności: L=k exp { l l max T l l max } Ma postać p -wymiarowego rozkładu normalnego z wartością średnią l max oraz z macierzą kowariancji C = B -. Wariancje estymatorów to elementami diagonalne, a elementy pozadiagonalne opisują kowariancje poszczególnych estymatorów. Pierwiastek kwadratowy z wariancji to odchylenie standardowe. 0

Jednoczesna estymacja kilku parametrów Za pomocą estymatora i jego błędu możliwe jest określenie przedziału obejmującego wartość prawdziwą z prawdopodobieństwem 68.3%.. W przypadku wieloparametrowym funkcja wiarygodności to wielowymiarowy rozkład normalny, przedział ten określone jest nie tylko przez niepewności, ale poprzez pełną macierz kowariancji. Dla przypadku dwu-wymiarowego mamy do czynienia z elipsą kowariancji. Wykładnik rozkładu normalnego: l l max T B l l max = g l = {ł l ł l max } Elipsę kowariancji określa warunek: g l =={ł l ł l max } Dla innych wartości g(l) otrzymuje się inne elipsoidy ufności. Wewnątrz hiper - elipsoidy ufności obszar ufności: g l =={ł l ł l max }=const

Wyznaczanie wartości średniej i wariancji r. normalnego Celem jest wyznaczenie wartości parametrów λ (wartości średniej ) oraz λ (odch. standardowego) z próby o liczebności z rozkładu normalnego. (Pomiar zasięgu cząstek α w materii, który podlega rozkładowi normalnemu wokół wartości średniej). Oba parametry są estymowane. Funkcja wiarygodności: L= j= exp x j ł= x j ln const j= Układ równań wiarygodności: ł = x j =0 j= ł = 3 j= x j =0

Wyznaczanie wartości średniej i wariancji r. normalnego Rozwiązania: = j= x j = j= x j W celu wyznaczenia macierzy B: ł = ł = x j 3 ł = 3 x j 4 B= / 0 0 / C=B = / 0 0 / Elementy diagonalne to błędy poszczególnych parametrów: = / = / Oba parametry nie są ze sobą skorelowane. 3

WERYFIKACJA HIPOTEZ STATYSTYCZYCH

Weryfikacja hipotez statystycznych Poziom istotności określa prawdopodobieństwo popełnienia błędu I rodzaju (błąd polegający na odrzuceniu hipotezy zerowej, która w rzeczywistości jest prawdziwa) ; Maksymalny błąd, jaki jesteśmy w stanie zaakceptować ( ( = 0.0, 0.03, 0.05) Poziom ufności - określa prawdopodobieństwo wyznaczenia takiego przedziału ufności, że rzeczywista wartość parametru znajduje się w tym przedziale ufności. 5

Weryfikacja hipotez statystycznych - Wyznaczane są wartość parametrów, jakie nie są całkowicie nieznane. - Są pewne przypuszczenia,, co do ich wartości (przewidywania modeli, dotychczasowe wyniki). - Zadanie próby (pomiaru) to weryfikacja (test) tej hipotezy. - Procedura weryfikacji hipotez statystycznych to test statystyczny. - Pobrano 0-elementową próbę,, uzyskana średnia arytmetyczną - Założenie: : zmienna losowa pochodzi z populacji opisanej rozkładem normalnym. - Jeśli przyjmiemy hipotezę za słuszną,, zmienna losowa ma rozkład normalny z m= 0 oraz s = - Jakie jest prawdopodobieństwo zaobserwowania wartości? - Korzystając z tabel dystrybuanty rozkładu normalnego: x=0.54 x 0.54 P x 0.54 ={ 0 0.54 0 }=0.6 - Gdy hipoteza prawdziwa, istnieje prawdopodobieństwo 6%, że próba o liczebności 0 może mieć wartość średnią różniącą się więcej niż o 0.54 od wartości 0 średniej z populacji. - Hipoteza jest prawdziwa czy nie? Odpowiedź musi być uzyskana w inny sposób. / 0 - Źródłem trudności jest probabilistyczny charakter wyników,, które można usunąć wprowadzając. 6

Weryfikacja hipotez statystycznych ) Ustalamy określoną wartość prawdopodobieństwa α. ) Zakładając, że hipoteza prawdziwa pytamy: prawdopodobieństwo, że zostaną zaobserwowane określone wartości próby < α? P x 0.54 3) ierówność spełniona jest mało prawdopodobne, aby próba pochodziła z rozkładu określonego przez testowaną hipotezę statystyczną. Hipotezą odrzucamy. 4) ierówność niespełniona omawiane prawdopodobieństwo przewyższa wartość α,, nie wnioskujemy, że hipoteza jest prawdziwa, lecz, że nie ma podstaw do odrzucenia hipotezy na zadanym poziomie istotności (hipoteza nie jest sprzeczna z wynikiem uzyskanym wskutek poboru próby). Wybór poziomu istotności α zależy od badanego problemu. - Przy badaniu kontroli jakości ołówków można przyjąć %. - W stawkach ubezpieczeniowych czasem wartość 0.0 jest za duża. - W analizie danych zazwyczaj stosuje się wartości: 5%, %, 0,%. 7

Weryfikacja hipotez statystycznych - a podstawie tablic statystycznych dystrybuanty rozkładu normalnego określamy granice dla dla x odpowiadające powyższym poziomom istotności: 0.05={ 0.96 }={ 0 0.6 0 } 0.0={ 0.58 }={ 0 0.8 0 } 0.00={ 0 3.9 }={ 0.04 0 } Do odrzucenia hipotezy wymagane jest, aby wartość średnia przekraczała odpowiednio: 0.6, 0.8,.04. W niektórych przypadkach ważny jest znak rozpatrywanej wielkości wartości średniej. Badamy odchylenia w jedną stronę i pytamy, czy spełniony jest warunek: P x x ' α α/ α/ 8

Test równości wariancji (test F-Fishera) Porównywanie wariancji populacji o jednakowych wartościach średnich. - Problem: : pomiar tej samej wielkości dwoma przyrządami pomiarowymi. - Jeśli pomiary będą miały jednakowe wariancje dokładność przyrządów taka sama. - Założenie: : populacje mają rozkład normalny. - Pobierane próby o liczebności oraz. - Dla obu liczona jest wariancja wariancja (estymator wariancji) i obliczany jest iloraz: F= s s - Jeśli hipoteza o równości wariancji jest prawdziwa F. - Dla każdej próby można skonstruować statystykę o rozkładzie X : X = s = f s X = s = f s f = f = Liczby stopni swobody (ang. DF) 9

Test równości wariancji (test F-Fishera) Przy równych wariancjach: F= f X f X Prawdopodobieństwo,, że wartość ilorazu jest mniejsza od Q: Można zdefiniować: W Q =P X X Q f W Q = f f Q 0 t X X f t f df f =f f F= f f Q W F =P s s F Dystrybuanta rozkładu Fishera 30

Test równości wariancji (test F-Fishera) Gęstość prawdopodobieństwa: f F = f f f f f f f F f f f F f f f = 0; f =, 3,..., 8 3

Test równości wariancji (test F-Fishera) Można dowieść,, że dla f >: E F = f f Granica F' : α P s s F ' = F' = F α -α -α to to kwantyl rozkładu F. F P s s F ' =P s s F = - Jeśli przy weryfikacji hipotezy otrzymaliśmy wartość ilorazu wariancji wyższą niż niż F' = F α -α - Hipoteza: - Wartości F' = F α -α -α są prawdziwa dla poziomu istotności α. są stabelaryzowane. 3

Test równości wariancji (test F-Fishera) - a ogół używa się testu dwustronnego: iloraz wariancji znajduje się pomiędzy dwiema wartościami granicznymi F'' ' α oraz F''' : α P s s F ' ' = P s s F ' ' ' = - Ponieważ F jest ilorazem to: s s F ' ' ' f, f - Pierwszy argument odpowiada: ilości stopni swobody dla rozkładu drugiego, drugi argument: ilości stopni swobody dla rozkładu pierwszego. - Z wartości tablicowych F - ½α ½ - Weryfikować należy tylko hipotezę: - ierówność spełniona hipotezę odrzucamy. s s F ' ' ' f, f P s s F ' ' f, f = P s s F ' ' f, f = s g s k f / f g, f k > dla wszystkich rozsądnych wielkości α. s g s k 33

Test równości wariancji (test F-Fishera) - przykład Za pomocą dwóch przyrządów zmierzono odległość (00cm): umer pomiaru Przyrząd Przyrząd 3 4 5 6 7 8 9 0 00 0 03 98 97 98 0 0 99 0 97 0 03 96 00 0 00 Wartość średnia DF Wariancja F= 6.5/3.7 =.8 00 9 34/9 = 3.7 99.8 6 39/6 = 6.5 F ' ' 0. 6,9 =F 0.95 6,9 =3.37.8 3.37 ie ma podstaw do odrzucenia hipotezy 34

Test Studenta. Porównanie wartości średnich - Zmienna losowa o rozkładzie normalnym. - Pobierana próba o liczebności oraz znanej wartości średniej. - Wariancja zmiennej losowej: x = x - Dla dostatecznie dużych prób: wartość średnia z próby (na mocy centralnego twierdzenia granicznego) ma rozkład normalny (, ). y= x x x - Zmienna: opisuje standardowy rozkład Gaussa. - a ogół wartość odchylenia standardowego nieznana. Estymator wariancji: x σ( x) s x = x i x i= s x = x i x i= - Pytanie: : Jak bardzo wielkość znormalizowana będzie odbiegać od standardowego rozkładu normalnego, jeśli odchylenie standardowe zastąpić pierwiastkiem kwadratowym z estymatora wariancji? Jako, że zawsze można przesunąć początek układu współrzędnych, to możliwe jest zawsze uzyskanie x=0 35

Test Studenta. Porównanie wartości średnich Rozważmy zmienną: Ponieważ wielkość Można dowieść,, że: t= x = x s x s x t= x f X s x =f s x F t =P t t =P x f X f f t = t f f ma rozkład X o licznie stopni swobody f= -: f t f t F t = t f f f f dt f 36

Test Studenta. Porównanie wartości średnich f f t = t f f f f f =,,... 0 37

Test Studenta. Porównanie wartości średnich - Rozważmy zmienną: P t t =F t - Wartości graniczne odpowiadające danemu poziomowi istotności: t ' f t dt= 0 - Kwantyle są stabelaryzowane. t ' =t ZASTOSOWAIE: - Hipoteza: : wartość oczekiwana z populacji mającej rozkład normalny równa jest L. - Pobieramy próbę o liczebności, wartości oczekiwanej oraz wariancji (policzonych). - Jeśli przy zadanym poziomie istotności zachodzi warunek: t = x L s x t ' =t - To hipotezę odrzucamy (test dwustronny). t = x±l s x t ' =t (test jednostronny). 38

Uogólnienie testu Studenta (porównanie w. średnich) - Pobieramy próby o liczebności oraz z populacji i X oraz Y. - Hipoteza: równość wartości średnich: - Z CTG że wartości średnie mają rozkład normalny. - Wariancje: x = x - Estymatory wariancji: s x= = x y j= x= y y = y Ma rozkład zbliżony do rozkładu normalnego. = x y x j x s y = j= y j y =0 - Jeśli hipoteza jest prawdziwa to. Podlega rozkładowi normalnemu: - Hipoteza zakłada (na ogół), że wartości średnie zostały uzyskane z tej samej populacji, czyli obie wariancje są identyczne. 39

Uogólnienie testu Studenta (porównanie w. średnich) - Estymator: s = s x s y s x= s - Można udowodnić, że: /s s y= s Podlega rozkładowi Studenta z liczbą stopni swobody: f = + -. - Równość wartości średnich można zweryfikować tzw. testem różnic Studenta. - Powyższa wielkość liczona na podstawie wyników dwóch prób. Jej wartość bezwględną porównujemy z kwantylem rozkładu Studenta o liczbie stopni swobody f = + - dla zadanego poziomu istotności α.. Jeśli zachodzi nierówność: t = s = x y s t ' =t s =s x s y= s - Hipotezę o równości wartości średnich należy odrzucić. 40

Test równości wartości średnich (test Studenta) - przykład Wyniki pomiarów stężenia kwasu neuraminowego w czerwonych ciałkach w krwi pacjentów zmarłych wskutek pewnej choroby (kolumna A) i dla grupy porównawczej pacjentów zdrowych (kolumna B). = x y =.3 s = 5s x 6 s y s = 3 s =.88 =5 f = =9.5 A 4 8 9 5 7 8 3 8 3 6 3 4.88.08 B 6 0 9 8 9 9 = 6 = 7 w. średnia = 0.3 w. średnia = 9.0 Wariancja = 7.8/5 Wariancja = 0/6 t / =.08 Materiał doświadczalny ie jest wystarczający. 4

Test X z maksymalna liczbą stopni swobody - pomiarów g : i i=,,..., wraz z błędami σ. i - Wartość g i jest wynikiem pomiaru prawdziwej,, nieznanej wielkości h. i h = g + ε. i i i - ε i to wielkość losowa o rozkładzie normalnym o m = 0 oraz σ. i i - Weryfikowana hipoteza: określa wartości h. i Zakładamy, że h = f oraz i=,,..,. i i - Jeśli hipoteza jest prawdziwa, to wszystkie wielkości będą miały rozkład Gaussa. - Wielkość: T = u i = i= i= g i f i i - Hipoteza fałszywa poszczególne wartości u i u i = g i f i i Podlega rozkładowi X o stopniach swobody. przyjmują duże wartości. i=,,..., - Hipoteza odrzucona dla zadanego poziomu istotności α spełniona jest zależność: T X X - kwantyl rozkładu X o stopniach swobody. 4

Test X z mniejszą liczbą stopni swobody - Załóżmy, że wielkość g (przedmiot pomiaru) tot funkcja niezależnej zmiennej kontrolowanej t, (której wartość znamy g = g(t) ). - Poszczególne pomiary g odpowiadają i pewnym wartościom t. i h. = h(t ). i i - ajprostszy przypadek hipotezy, kiedy: f(t) = h(t) = at + b. - Hipoteza może określać wartości liczbowe parametrów a, b. - Znamy wtedy wszystkie wartości f, kiedy f = h. i i i - Hipoteza prawdziwa wielkość T podlega rozkładowi X o stopniach swobody. - Hipoteza zakłada istnienie związku liniowego,, pomiędzy zmienną kontrolowaną, a zmienną h parametry a oraz b są nieznane. Budowane są ich estymatory: : (będące funkcjami zmierzonych wartości g i - Hipoteza: oraz ich błędów σ ). i h i =h t i =f i = at i b - Estymatory (funkcje zmierzonych wartości), nie zawsze są unormowane oraz niezależne. - W celu wyznaczenia wartości estymatorów wprowadza się równania więzów, - DF ulega zmniejszeniu do -. 43

Test X i doświadczalny rozkład gęstości - Zakładamy istnienie dystrybuanty F(x) odpowiadającej gęstości prawdopodobieństwa f(x). - Zakres zmienności zmiennej losowej x dzielimy na r przedziałów: - Poprzez całkowanie f(x) w poszczególnych przedziałach dostajemy prawdopodobieństwo zaobserwowania zmiennej w danym przedziale: - Z pobranej próby o liczebności n oznaczamy przez n i w danym przedziale. Zachodzi relacja: - a podstawie hipotezy dot. gęstości prawdopodobieństwa: n = n p. i i liczbę takich elementów próby, jakie znalazły się - Przedmiot weryfikacji: hipoteza zakładająca, że dla dużych wartości liczb n, i ich wariancja wynosi n oraz, i że rozkład u i - Słuszne jest: - Suma kwadratów: można przybliżyć rozkładem Gaussa. u i = n i np i - Jeśli przyjęta hipoteza jest prawdziwa, to, że statystyka X ma (dla dużych n) rozkład X. - Zmienne nie są niezależne, DF = r-. i= n p i r X = i= r n i =n u i = p i =P x i = u i = n i np i,,..., r i f x dx i= - Jeśli doświadczenie pozwala wyznaczyć p parametrów, to DF zmniejsza się do f = r - - p. r i= n i n i np i n p i r p i = 44

Test X i dopasowanie rozkładu Poissona W oddziaływaniach fotonów z protonami,, wodorowa komora pęcherzykowa naświetlona została wiązką fotonów o wielkiej energii. Fotony konwertują w pary e+e-. Częstość występowania zdjęć z 0,,, parami e+e- powinna podlegać rozkładowi Poissona. Estymator o największej wiarygodności parametru z rozkładu Poissona: = k k Liczba stopni swobody: = r k n k (r = 8, p = ) n k =.33 Liczba par elektronowych na zdjęciu k 0 3 4 5 6 7 8 Liczba zdjęć zawierających k par 47 69 84 76 49 6 3 - Przewidywania Rozkładu Poissona 34.4 80. 93.7 7.8 4.6 9.9 7.8.5 (0.7) n p k 4.6.56.00 0.4 0.96 0.76.3 0.0 - n k n p k n p k n = 355 X = 0.44 Dla poziomu istotności α = % Otrzymujemy z tabeli X 0.99 =6.8 ie ma podstaw do odrzucenia hipotezy. 45

Test X i dopasowanie rozkładu Poissona X = k n k n p k n p k 46

KOIEC WYKŁADU 9