Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 34 58 5 konsultacje: poniedziałek: 0-, środa: - www: http://www.if.pw.edu.pl/~gos/students/kadd Politechnika Warszawska Wydział Fizyki Pok. 7b (wejście przez 5)
METODA AJWIĘKSZEJ WIARYGODOŚCI
Metoda największej wiarygodności Iloraz wiarygodności Do tej pory: estymacja wartości oczekiwanej, wariancji (bez wnikania jak konstruować estymatory). - p parametrów, l= l, l,...,l p - określone funkcją prawdopodobieństwa: - dla zmiennych losowych f =f x,l Przeprowadzone doświadczeń (lub pobrana próba elementowa), pojedyncze doświadczenie (pomiar wielkości x lub pobranie próby o liczebności ) może doprowadzić do uzyskania wyniku x (j). Doświadczeniu przypisujemy liczbę: x= x, x,..., x n To prawdopodobieństwo a posteriori.. Mówi ono po uzyskaniu wyniku, jakie było prawdopodobieństwo uzyskania tego właśnie wyniku (tzn. wartości x (j) ). dp j =f x j ;l dx x i ( j) < x ( j) x i ( j) +dx i ( j) i=,,..., n 3
Metoda największej wiarygodności Iloraz wiarygodności Dla próby (niezależnych) elementów, prawdopodobieństwo uzyskania wyniku: Wynosi: x, x,..., x dp= j= Gdy prawdopodobieństwo zależy od np. parametrów: Q= j= j= f x j ;l d x f x j ;l d x Zbiór parametrów typu pierwszego jest Q razy bardziej prawdopodobny niż zbiór parametrów typu drugiego. Jest to iloraz wiarygodności. L= j= f x j ;l d x f x j ; l d x Funkcja wiarygodności - Jest zmienną losową. 4
Iloraz wiarygodności - przykład Rzut asymetryczną monetą,, na podstawie uzyskanych wyników próbujemy ustalić, czy moneta należy do klasy A, czy do klasy B monet. A orzeł /3 /3 reszka /3 /3 B Próba to 5 rzutów: orzeł i 4 reszki. L A = 3 3 4 L B = 3 3 4 Q= L A L B =8 Z dużą dozą prawdopodobieństwa moneta należy do klasy monet A. 5
Metoda największej wiarygodności - ajwiększą ufnością obdarzony zbiór parametrów, którego funkcja wiarygodności osiąga maksymalną wartość. - Wyznaczenia maksimum: : przyrównać do zera pierwszą pochodną funkcji wiarygodności względem l i. - Ułatwienie obliczeń rachunkowych logarytm funkcji wiarygodności L: L ł=ln L= i= Logarytmiczna funkcja wiarygodności. ln f x j ;l L(l) L(l) l max l l 3 max l max l max l 6
Metoda największej wiarygodności Jeśli wektor l ma tylko jedną składową: l, należy rozwiązać równanie wiarygodności: dł ' ł '= dl =0 ł= i= x j ;l = W przypadku ogólnym, wektor l ma p składowych: dł ' dl i =0 i= d ln f x j ;l = dl d dl f x j ;l f x j ;l i=,,..., p f f ' = i= x j ;l 7
Powtarzanie pomiarów o różnej dokładności - przykład Pomiar danej wielkości różnymi przyrządami pomiarowymi - pomiary będą układały się wokół wartości rzeczywistej, - zakładamy, że niepewności będą miały rozkład normalny, - pojedynczy pomiar: : pobieranie próby o liczebności z rozkładu normalnego o wart. średniej i war. σ. Prawdopodobieństwo a posteriori dla uzyskanej wartości x (j) (j) : f x j ;l dx= exp x j l dx j j Dla pomiarów funkcja wiarygodności: L= j= exp x j l dx j j Logarytm funkcji wiarygodności: ł= x j l const j= j l max = Równanie wiarygodności: dł dl = x j l =0 j= j= j= x j j j Wynik najbardziej wiarygodny jest średnią ważoną pomiarów, wagi są odwrotnościami wariancji. 8
Oszacowanie parametru rozkładu hipergeometrycznego Jeśli estymowany parametr może przyjmować wartości dyskretne: Prawdopodobieństwo wyłowienia n ryb, z których k było zaznaczonych. wszystkich ryb, K zaznaczone: Szukane, dla którego L osiągnie maksimum. Iloraz: L k ;n, K, = K k K n k n L k ;n, K, L k ;n,k, = n k n K k L osiąga maksimum dla wartości całkowitej, najbliższej nk/k 9
ierówność informacyjna Jak skonstruować estymator o optymalnych własnościach? ) Estymator jest nieobciążony, jeśli wartość obciążenia B(l) wynosi 0 dla każdej próby: B l =E S l=0 ) Wariancja estymatora ma być jak najmniejsza: S minimalna Często należy szukać kompromisu między minimalnym obciążeniem, a minimalną wariancją (ze względu na fakt istnienia nierówności informacyjnej). Wariancja przybiera minimalną wartość, kiedy estymator S jest stałą (wariancja wynosi wtedy 0). Jeśli estymator Gęstość prawdopodobieństwa próby (losowej): Wartość oczekiwana: S x, x,..., x jest funkcją próby x, x,..., x f x, x,..., x ;l =f x ;l f x ;l... f x ;l,to łączna E S = S x, x,..., x f x ;l f x ;l... f x ;l dx dx...dx 0
ierówność informacyna, estymator o min. wariancji E S =B l l Wyrażenie można różniczkować. B ' l Można dowieść, że nierówność informacyjna: B ' l S I l Informacja próby ze względu na l. I l =E ł ' =E { f ' x ;l f x ;l } ierówność informacyjna: : związek między obciążeniem, wariancją i informacją zawartą w próbie. ie został wybrany żaden konkretny estymator, a nierówność stanowi ograniczenie od dołu dla wariancji estymatora. Jest to ograniczenie dla minimalnej wariancji (ograniczenie Cramera-Rao). Kiedy obciążenie nie zależy od l: S I l
Estymator o min. wariancji, estymator wystarczający Jaki jest warunek osiągnięcia minimalnej wariancji,, kiedy zachodzi wzór: Można dowieść, że kiedy: A co za tym idzie: B ' l S = I l ł= A l S E S l= ł dl=b l S C l D L=d exp B l S C l (*) Estymatory związane z funkcja wiarygodności zapewniają minimalną wariancję (zgodnie Z nierównością informacyjną) estymatory o minimalnej wariancji. Dla estymatora nieobciążonego, można dowieść, że: S = I l S = A l Jeśli zamiast relacji (*) zachodzi słabszy warunek: To S jest estymatorem wystarczającym dla l. L=g S,l c x, x,..., x
Estymator parametru rozkładu Poissona Rozkład Poissona: f k = k k! e Funkcja wiarygodności dla próby ł= j= k, k,..., k [k j ln ln k j! ] dł ' d =ł '= [ j= ł= k j k ]= j= [k j ] Średnia arytmetyczna k jest nieobciążonym estymatorem o minimalnej wariancji. 3
Estymator parametru rozkładu dwumianowego Funkcja wiarygodności dla rozkładu dwumianowego o parametrach: p = λ oraz q = p = - λ. L k ; = Otrzymujemy stąd: n! k! n k! k n k ł=ln L=k ln n k ln ln ł '= k n k = n k n n! k! n k! Średnia arytmetyczna k/n jest estymatorem o minimalnej wariancji /n 4
Prawo kombinacji błędów p. pomiar danej wielkości różnymi przyrządami pomiarowymi. dł dl =ł '= j= x j l j ł '= j= x j j j ł '= j= x j { j j j } S= x j j To nieobciążony estymator wartości średniej l. Ma też minimalną wariancję. j Wariancja: S = j= Prawo kombinacji niepewności lub uśrednianie niepewności w kwadratach. S = j Kiedy jest jednakowa dokładność pomiarów: x / x... x n S= x S = /n 5
Własności asymptotyczne estymatorów i f. wiarygodności Próba jest duża ( ). Estymator S zdefiniowany jako rozwiązanie równania wiarygodności: dł l dl =ł ' l = j= f ' x j ;l =0 f x j ;l l max Zakładając, że istnieje druga pochodna ł(l) względem l rozwijamy ł'(l) w szereg Taylora: ł ' l =ł ' l max l l max ł ' ' l max... ł ' ' l max = f ' x j ' ;l j= f x j ;l l max Wyrażenie to wartość średnia z próby; kiedy duże zastąpić można wartością oczekiwaną: { ł ' ' l max = E f ' x j ;l } f x j ;l l max ' ł ' ' l max =E ł ' ' l max = E ł l max = I l max = /b b zależy jedynie od wartości gęstości prawdopodobieństwa f i estymatora l max max. 6
Własności asymptotyczne estymatorów i f. wiarygodności Funkcję wiarygodności (k= const): L l =k exp{ l l max /b } Można dowieść, że: S=l max l max E S =l To nieobciążony estymator o minimalnej wariancji: l max =b = I l max = E ł ' l max = E ł ' ' l max Estymator ma ww. własności w granicznym przypadku dla dużych. Funkcja wiarygodności jest asymptotycznie normalna. Funkcja wiarygodności L(l) to miara prawdopodobieństwa, że wartość prawdziwa l 0 l=l max ± l max =l max ± l Funkcja wiarygodności asymptotycznie dąży do rozkładu normalnego; Prawdopodobieństwo tego, że wartość prawdziwa: l max l max l 0 l max l wynosi 68.3% par. l = l. 7
Jednoczesna estymacja kilku parametrów Mamy estymować jednocześnie p parametrów: l = (l, l,..., l p ł l i =0 i=,,..., p Otrzymamy niepewności parametrów,, a nie same parametry. ). Zgodnie z równaniami: ależy uwzględnić także korelacje między parametrami i ich niepewności. logarytmiczna funkcja wiarygodności: ł x, x,..., x ;l = i= rozwijając w szereg Taylora wokół punktu: ln f x j ; l p ł l =ł l max ł l k= l k l k max p k l max n= ł l k l max =0 k=,,..., p l max = l max,l max,...,l p max p m= ł l n l m l max l n l max n l m l max m... 8
Jednoczesna estymacja kilku parametrów Rozwinięcie upraszcza się: A= ł l ł l l... ł l l p ł ł ł... l l l l l p............ ł ł ł... l l p l l p l p l=l max ł l ł l max = l l max T A l l max... 9
Jednoczesna estymacja kilku parametrów Kiedy : E B=E A = ł l E ł ł... E l l l l p ł E E ł l l l... E ł l l p............ ł ł E E... E ł l l p l l p l p l=l max Funkcja wiarygodności: L=k exp { l l max T l l max } Ma postać p -wymiarowego rozkładu normalnego z wartością średnią l max oraz z macierzą kowariancji C = B -. Wariancje estymatorów to elementami diagonalne, a elementy pozadiagonalne opisują kowariancje poszczególnych estymatorów. Pierwiastek kwadratowy z wariancji to odchylenie standardowe. 0
Jednoczesna estymacja kilku parametrów Za pomocą estymatora i jego błędu możliwe jest określenie przedziału obejmującego wartość prawdziwą z prawdopodobieństwem 68.3%.. W przypadku wieloparametrowym funkcja wiarygodności to wielowymiarowy rozkład normalny, przedział ten określone jest nie tylko przez niepewności, ale poprzez pełną macierz kowariancji. Dla przypadku dwu-wymiarowego mamy do czynienia z elipsą kowariancji. Wykładnik rozkładu normalnego: l l max T B l l max = g l = {ł l ł l max } Elipsę kowariancji określa warunek: g l =={ł l ł l max } Dla innych wartości g(l) otrzymuje się inne elipsoidy ufności. Wewnątrz hiper - elipsoidy ufności obszar ufności: g l =={ł l ł l max }=const
Wyznaczanie wartości średniej i wariancji r. normalnego Celem jest wyznaczenie wartości parametrów λ (wartości średniej ) oraz λ (odch. standardowego) z próby o liczebności z rozkładu normalnego. (Pomiar zasięgu cząstek α w materii, który podlega rozkładowi normalnemu wokół wartości średniej). Oba parametry są estymowane. Funkcja wiarygodności: L= j= exp x j ł= x j ln const j= Układ równań wiarygodności: ł = x j =0 j= ł = 3 j= x j =0
Wyznaczanie wartości średniej i wariancji r. normalnego Rozwiązania: = j= x j = j= x j W celu wyznaczenia macierzy B: ł = ł = x j 3 ł = 3 x j 4 B= / 0 0 / C=B = / 0 0 / Elementy diagonalne to błędy poszczególnych parametrów: = / = / Oba parametry nie są ze sobą skorelowane. 3
WERYFIKACJA HIPOTEZ STATYSTYCZYCH
Weryfikacja hipotez statystycznych Poziom istotności określa prawdopodobieństwo popełnienia błędu I rodzaju (błąd polegający na odrzuceniu hipotezy zerowej, która w rzeczywistości jest prawdziwa) ; Maksymalny błąd, jaki jesteśmy w stanie zaakceptować ( ( = 0.0, 0.03, 0.05) Poziom ufności - określa prawdopodobieństwo wyznaczenia takiego przedziału ufności, że rzeczywista wartość parametru znajduje się w tym przedziale ufności. 5
Weryfikacja hipotez statystycznych - Wyznaczane są wartość parametrów, jakie nie są całkowicie nieznane. - Są pewne przypuszczenia,, co do ich wartości (przewidywania modeli, dotychczasowe wyniki). - Zadanie próby (pomiaru) to weryfikacja (test) tej hipotezy. - Procedura weryfikacji hipotez statystycznych to test statystyczny. - Pobrano 0-elementową próbę,, uzyskana średnia arytmetyczną - Założenie: : zmienna losowa pochodzi z populacji opisanej rozkładem normalnym. - Jeśli przyjmiemy hipotezę za słuszną,, zmienna losowa ma rozkład normalny z m= 0 oraz s = - Jakie jest prawdopodobieństwo zaobserwowania wartości? - Korzystając z tabel dystrybuanty rozkładu normalnego: x=0.54 x 0.54 P x 0.54 ={ 0 0.54 0 }=0.6 - Gdy hipoteza prawdziwa, istnieje prawdopodobieństwo 6%, że próba o liczebności 0 może mieć wartość średnią różniącą się więcej niż o 0.54 od wartości 0 średniej z populacji. - Hipoteza jest prawdziwa czy nie? Odpowiedź musi być uzyskana w inny sposób. / 0 - Źródłem trudności jest probabilistyczny charakter wyników,, które można usunąć wprowadzając. 6
Weryfikacja hipotez statystycznych ) Ustalamy określoną wartość prawdopodobieństwa α. ) Zakładając, że hipoteza prawdziwa pytamy: prawdopodobieństwo, że zostaną zaobserwowane określone wartości próby < α? P x 0.54 3) ierówność spełniona jest mało prawdopodobne, aby próba pochodziła z rozkładu określonego przez testowaną hipotezę statystyczną. Hipotezą odrzucamy. 4) ierówność niespełniona omawiane prawdopodobieństwo przewyższa wartość α,, nie wnioskujemy, że hipoteza jest prawdziwa, lecz, że nie ma podstaw do odrzucenia hipotezy na zadanym poziomie istotności (hipoteza nie jest sprzeczna z wynikiem uzyskanym wskutek poboru próby). Wybór poziomu istotności α zależy od badanego problemu. - Przy badaniu kontroli jakości ołówków można przyjąć %. - W stawkach ubezpieczeniowych czasem wartość 0.0 jest za duża. - W analizie danych zazwyczaj stosuje się wartości: 5%, %, 0,%. 7
Weryfikacja hipotez statystycznych - a podstawie tablic statystycznych dystrybuanty rozkładu normalnego określamy granice dla dla x odpowiadające powyższym poziomom istotności: 0.05={ 0.96 }={ 0 0.6 0 } 0.0={ 0.58 }={ 0 0.8 0 } 0.00={ 0 3.9 }={ 0.04 0 } Do odrzucenia hipotezy wymagane jest, aby wartość średnia przekraczała odpowiednio: 0.6, 0.8,.04. W niektórych przypadkach ważny jest znak rozpatrywanej wielkości wartości średniej. Badamy odchylenia w jedną stronę i pytamy, czy spełniony jest warunek: P x x ' α α/ α/ 8
Test równości wariancji (test F-Fishera) Porównywanie wariancji populacji o jednakowych wartościach średnich. - Problem: : pomiar tej samej wielkości dwoma przyrządami pomiarowymi. - Jeśli pomiary będą miały jednakowe wariancje dokładność przyrządów taka sama. - Założenie: : populacje mają rozkład normalny. - Pobierane próby o liczebności oraz. - Dla obu liczona jest wariancja wariancja (estymator wariancji) i obliczany jest iloraz: F= s s - Jeśli hipoteza o równości wariancji jest prawdziwa F. - Dla każdej próby można skonstruować statystykę o rozkładzie X : X = s = f s X = s = f s f = f = Liczby stopni swobody (ang. DF) 9
Test równości wariancji (test F-Fishera) Przy równych wariancjach: F= f X f X Prawdopodobieństwo,, że wartość ilorazu jest mniejsza od Q: Można zdefiniować: W Q =P X X Q f W Q = f f Q 0 t X X f t f df f =f f F= f f Q W F =P s s F Dystrybuanta rozkładu Fishera 30
Test równości wariancji (test F-Fishera) Gęstość prawdopodobieństwa: f F = f f f f f f f F f f f F f f f = 0; f =, 3,..., 8 3
Test równości wariancji (test F-Fishera) Można dowieść,, że dla f >: E F = f f Granica F' : α P s s F ' = F' = F α -α -α to to kwantyl rozkładu F. F P s s F ' =P s s F = - Jeśli przy weryfikacji hipotezy otrzymaliśmy wartość ilorazu wariancji wyższą niż niż F' = F α -α - Hipoteza: - Wartości F' = F α -α -α są prawdziwa dla poziomu istotności α. są stabelaryzowane. 3
Test równości wariancji (test F-Fishera) - a ogół używa się testu dwustronnego: iloraz wariancji znajduje się pomiędzy dwiema wartościami granicznymi F'' ' α oraz F''' : α P s s F ' ' = P s s F ' ' ' = - Ponieważ F jest ilorazem to: s s F ' ' ' f, f - Pierwszy argument odpowiada: ilości stopni swobody dla rozkładu drugiego, drugi argument: ilości stopni swobody dla rozkładu pierwszego. - Z wartości tablicowych F - ½α ½ - Weryfikować należy tylko hipotezę: - ierówność spełniona hipotezę odrzucamy. s s F ' ' ' f, f P s s F ' ' f, f = P s s F ' ' f, f = s g s k f / f g, f k > dla wszystkich rozsądnych wielkości α. s g s k 33
Test równości wariancji (test F-Fishera) - przykład Za pomocą dwóch przyrządów zmierzono odległość (00cm): umer pomiaru Przyrząd Przyrząd 3 4 5 6 7 8 9 0 00 0 03 98 97 98 0 0 99 0 97 0 03 96 00 0 00 Wartość średnia DF Wariancja F= 6.5/3.7 =.8 00 9 34/9 = 3.7 99.8 6 39/6 = 6.5 F ' ' 0. 6,9 =F 0.95 6,9 =3.37.8 3.37 ie ma podstaw do odrzucenia hipotezy 34
Test Studenta. Porównanie wartości średnich - Zmienna losowa o rozkładzie normalnym. - Pobierana próba o liczebności oraz znanej wartości średniej. - Wariancja zmiennej losowej: x = x - Dla dostatecznie dużych prób: wartość średnia z próby (na mocy centralnego twierdzenia granicznego) ma rozkład normalny (, ). y= x x x - Zmienna: opisuje standardowy rozkład Gaussa. - a ogół wartość odchylenia standardowego nieznana. Estymator wariancji: x σ( x) s x = x i x i= s x = x i x i= - Pytanie: : Jak bardzo wielkość znormalizowana będzie odbiegać od standardowego rozkładu normalnego, jeśli odchylenie standardowe zastąpić pierwiastkiem kwadratowym z estymatora wariancji? Jako, że zawsze można przesunąć początek układu współrzędnych, to możliwe jest zawsze uzyskanie x=0 35
Test Studenta. Porównanie wartości średnich Rozważmy zmienną: Ponieważ wielkość Można dowieść,, że: t= x = x s x s x t= x f X s x =f s x F t =P t t =P x f X f f t = t f f ma rozkład X o licznie stopni swobody f= -: f t f t F t = t f f f f dt f 36
Test Studenta. Porównanie wartości średnich f f t = t f f f f f =,,... 0 37
Test Studenta. Porównanie wartości średnich - Rozważmy zmienną: P t t =F t - Wartości graniczne odpowiadające danemu poziomowi istotności: t ' f t dt= 0 - Kwantyle są stabelaryzowane. t ' =t ZASTOSOWAIE: - Hipoteza: : wartość oczekiwana z populacji mającej rozkład normalny równa jest L. - Pobieramy próbę o liczebności, wartości oczekiwanej oraz wariancji (policzonych). - Jeśli przy zadanym poziomie istotności zachodzi warunek: t = x L s x t ' =t - To hipotezę odrzucamy (test dwustronny). t = x±l s x t ' =t (test jednostronny). 38
Uogólnienie testu Studenta (porównanie w. średnich) - Pobieramy próby o liczebności oraz z populacji i X oraz Y. - Hipoteza: równość wartości średnich: - Z CTG że wartości średnie mają rozkład normalny. - Wariancje: x = x - Estymatory wariancji: s x= = x y j= x= y y = y Ma rozkład zbliżony do rozkładu normalnego. = x y x j x s y = j= y j y =0 - Jeśli hipoteza jest prawdziwa to. Podlega rozkładowi normalnemu: - Hipoteza zakłada (na ogół), że wartości średnie zostały uzyskane z tej samej populacji, czyli obie wariancje są identyczne. 39
Uogólnienie testu Studenta (porównanie w. średnich) - Estymator: s = s x s y s x= s - Można udowodnić, że: /s s y= s Podlega rozkładowi Studenta z liczbą stopni swobody: f = + -. - Równość wartości średnich można zweryfikować tzw. testem różnic Studenta. - Powyższa wielkość liczona na podstawie wyników dwóch prób. Jej wartość bezwględną porównujemy z kwantylem rozkładu Studenta o liczbie stopni swobody f = + - dla zadanego poziomu istotności α.. Jeśli zachodzi nierówność: t = s = x y s t ' =t s =s x s y= s - Hipotezę o równości wartości średnich należy odrzucić. 40
Test równości wartości średnich (test Studenta) - przykład Wyniki pomiarów stężenia kwasu neuraminowego w czerwonych ciałkach w krwi pacjentów zmarłych wskutek pewnej choroby (kolumna A) i dla grupy porównawczej pacjentów zdrowych (kolumna B). = x y =.3 s = 5s x 6 s y s = 3 s =.88 =5 f = =9.5 A 4 8 9 5 7 8 3 8 3 6 3 4.88.08 B 6 0 9 8 9 9 = 6 = 7 w. średnia = 0.3 w. średnia = 9.0 Wariancja = 7.8/5 Wariancja = 0/6 t / =.08 Materiał doświadczalny ie jest wystarczający. 4
Test X z maksymalna liczbą stopni swobody - pomiarów g : i i=,,..., wraz z błędami σ. i - Wartość g i jest wynikiem pomiaru prawdziwej,, nieznanej wielkości h. i h = g + ε. i i i - ε i to wielkość losowa o rozkładzie normalnym o m = 0 oraz σ. i i - Weryfikowana hipoteza: określa wartości h. i Zakładamy, że h = f oraz i=,,..,. i i - Jeśli hipoteza jest prawdziwa, to wszystkie wielkości będą miały rozkład Gaussa. - Wielkość: T = u i = i= i= g i f i i - Hipoteza fałszywa poszczególne wartości u i u i = g i f i i Podlega rozkładowi X o stopniach swobody. przyjmują duże wartości. i=,,..., - Hipoteza odrzucona dla zadanego poziomu istotności α spełniona jest zależność: T X X - kwantyl rozkładu X o stopniach swobody. 4
Test X z mniejszą liczbą stopni swobody - Załóżmy, że wielkość g (przedmiot pomiaru) tot funkcja niezależnej zmiennej kontrolowanej t, (której wartość znamy g = g(t) ). - Poszczególne pomiary g odpowiadają i pewnym wartościom t. i h. = h(t ). i i - ajprostszy przypadek hipotezy, kiedy: f(t) = h(t) = at + b. - Hipoteza może określać wartości liczbowe parametrów a, b. - Znamy wtedy wszystkie wartości f, kiedy f = h. i i i - Hipoteza prawdziwa wielkość T podlega rozkładowi X o stopniach swobody. - Hipoteza zakłada istnienie związku liniowego,, pomiędzy zmienną kontrolowaną, a zmienną h parametry a oraz b są nieznane. Budowane są ich estymatory: : (będące funkcjami zmierzonych wartości g i - Hipoteza: oraz ich błędów σ ). i h i =h t i =f i = at i b - Estymatory (funkcje zmierzonych wartości), nie zawsze są unormowane oraz niezależne. - W celu wyznaczenia wartości estymatorów wprowadza się równania więzów, - DF ulega zmniejszeniu do -. 43
Test X i doświadczalny rozkład gęstości - Zakładamy istnienie dystrybuanty F(x) odpowiadającej gęstości prawdopodobieństwa f(x). - Zakres zmienności zmiennej losowej x dzielimy na r przedziałów: - Poprzez całkowanie f(x) w poszczególnych przedziałach dostajemy prawdopodobieństwo zaobserwowania zmiennej w danym przedziale: - Z pobranej próby o liczebności n oznaczamy przez n i w danym przedziale. Zachodzi relacja: - a podstawie hipotezy dot. gęstości prawdopodobieństwa: n = n p. i i liczbę takich elementów próby, jakie znalazły się - Przedmiot weryfikacji: hipoteza zakładająca, że dla dużych wartości liczb n, i ich wariancja wynosi n oraz, i że rozkład u i - Słuszne jest: - Suma kwadratów: można przybliżyć rozkładem Gaussa. u i = n i np i - Jeśli przyjęta hipoteza jest prawdziwa, to, że statystyka X ma (dla dużych n) rozkład X. - Zmienne nie są niezależne, DF = r-. i= n p i r X = i= r n i =n u i = p i =P x i = u i = n i np i,,..., r i f x dx i= - Jeśli doświadczenie pozwala wyznaczyć p parametrów, to DF zmniejsza się do f = r - - p. r i= n i n i np i n p i r p i = 44
Test X i dopasowanie rozkładu Poissona W oddziaływaniach fotonów z protonami,, wodorowa komora pęcherzykowa naświetlona została wiązką fotonów o wielkiej energii. Fotony konwertują w pary e+e-. Częstość występowania zdjęć z 0,,, parami e+e- powinna podlegać rozkładowi Poissona. Estymator o największej wiarygodności parametru z rozkładu Poissona: = k k Liczba stopni swobody: = r k n k (r = 8, p = ) n k =.33 Liczba par elektronowych na zdjęciu k 0 3 4 5 6 7 8 Liczba zdjęć zawierających k par 47 69 84 76 49 6 3 - Przewidywania Rozkładu Poissona 34.4 80. 93.7 7.8 4.6 9.9 7.8.5 (0.7) n p k 4.6.56.00 0.4 0.96 0.76.3 0.0 - n k n p k n p k n = 355 X = 0.44 Dla poziomu istotności α = % Otrzymujemy z tabeli X 0.99 =6.8 ie ma podstaw do odrzucenia hipotezy. 45
Test X i dopasowanie rozkładu Poissona X = k n k n p k n p k 46
KOIEC WYKŁADU 9