Komputerowa analiza danych doświadczalnych

Komputerowa aaliza daych doświadczalych Wykład 6.04.06 dr iż. Łukasz Graczykowski lgraczyk@if.pw.edu.pl Semestr leti 05/06

Własości rozkładu ormalego Cetrale twierdzeie graicze Fukcja charakterystycza Rozkłady wielowymiarowe elipsa kowariacji

Rozkład ormaly stadardowy Gęstość prawdopodobieństwa: x / f x ϕ 0 x= e π rozkład o średiej 0 i wariacji Dystrybuata ie ma postaci aalityczej korzystamy z tabel Rozkład jest uormoway: e x / dx= π Jeśli wprowadzimy zmieą: Y = X a/ b Otrzymamy rozkład Gaussa: f y ϕ y = e y a / b π b średia przesuięcie: ^y =a wariacja szerokość: σ Y =b KADD 06, Wykład 6 3 / 9

Rozkład ormaly stadardowy - własości Pukt przegięcia rozkładu: stadardowego x=± Gaussa x=a±b Załóżmy, że zamy dystrybuatę: F 0 x Φ0 x=p X x Ze względu a asymetrię gęstości: P X > x = Φ0 x = ϕ 0 x Aalogiczie, wewątrz przedziału x: P X x= Φ0 x Dystrybuatę r. orm. moża uogólić a r. Gaussa: Φ y=φ0 x a b KADD 06, Wykład 6 4 / 9

Rozkład ormaly stadardowy - własości Wtedy szczególie iteresujące jest obliczeie występowaia zmieej los. dla wielokrotości odchyleia stadardowego: P Y a σ = Φ 0 Otrzymamy wtedy: P Y a σ=68,3 % b = Φ0 b P Y a >σ=3,7 % P Y a σ=95,4 % P Y a > σ =4,6 % P Y a 3 σ =99,8 % P Y a >3 σ =0, % Z Wykładu pamiętamy, że współczyik rozszerzeia iepewość typu A zwykle jest między a 3 tu widać dlaczego W auce przez odchyleie stadardowe określamy rówież różice w obserwowaym sygale eksperymetalym w stosuku do sytuacji, gdy efektu fizyczego ie ma KADD 06, Wykład 6 5 / 9

Cetrale twierdzeie graicze

Cetrale twierdzeie graicze Dlaczego rozkład ormaly jest tak waży w rachuku prawdopodobieństwa i statystyce? Mówi o tym cetrale twierdzeie graicze ag. cetral limit theorem jedo z ajważiejszych twierdzeń rachuku prawdopodobieństwa: jeżeli zmiee losowe Xi są zmieymi iezależymi o jedakowych wartościach średich a i odchyleiach stadardowych b, to rozkład ormaly ma zmiea: X =lim X i E X =a, σ X =b i= poadto, zmiea ξ= X =lim X i i= E ξ=a, σ xi=b / ma rozkład ormaly z: Iymi słowy mając iezależych zmieych o jedakowym dowolym! rozkładzie, to ich suma dla dużych zbiega do rozkładu ormalego KADD 06, Wykład 6 7 / 9

Cetrale twierdzeie graicze przykład Wyobraźmy sobie eksperymet polegający a rzucie kostką kostkami i obserwowaiu całkowitej liczby oczek: koleje rzuty kostką kostkami są iezależe jeśli rzucamy kostką jedokrotie albo kostką, to prawdopodobieństwo uzyskaia daej wartości jest jedakowe jeśli rzucamy kostką dwukrotie albo kostkami, to prawdopodobieństwo uzyskaia sumy oczek ie jest już jedakowe jeśli rzucimy kostką -krotie -kostkami rozkład ormaly KADD 06, Wykład 6 8 / 9

Cetrale twierdzeie graicze przykład Wykoajmy doświadczeie rzutu moetą zmiee losowe Xi przybierają wartości i 0 z prawdopodobieństwem p i q=-p: jak już wiemy z rozważań rozkładu dwumiaowego: E X i= p, σ X i = pq X = X i atomiast rozkład dwumiaowy ma zmiea: i= k k rzutów, k razy wypada wartość : P X =k =W k = p q k wprowadźmy teraz zmieą uormowaą: E X =p, σ X =pq U = i= X i p = p p p p X i p i= = X p p p wtedy rozkład prawdopodobieństwa ma postać: P X =k =W k = P U =k p/ p p wraz ze zwiększaiem liczby sąsiedie wartości, jakie przyjmuje zmiea losowa U będą leżeć coraz bliżej siebie iech Δ U będzie odległością pomiędzy wartościami KADD 06, Wykład 6 9 / 9

Cetrale twierdzeie graicze przykład Wówczas, w graicy dużych, rozkład zmieej skokowej: P U /Δ U staje się gęstością prawdopodobieństwa zmieej ciągłej, który zgodie z cetralym twierdzeiem graiczym musi mieć stadardowy rozkład ormaly Iaczej: CTG mówi, że rozkład średiej z pewej próby losowej z dowolego rozkładu będzie dążył do rozkładu ormalego: wyobraźmy sobie, że oszacować średi wzrost w populacji 8-letich dziewczyek μ wybieramy losowo 00 8-latek i liczymy średią wartość z próby losowej x asz kolega wykouje aalogicze doświadczeie dostaje iy wyik x KADD 06, Wykład 6 0 / 9

Cetrale twierdzeie graicze przykład Iaczej: CTG mówi, że rozkład średiej z pewej próby losowej z dowolego rozkładu będzie dążył do rozkładu ormalego: wyobraźmy sobie, że oszacować wzrost w populacji 8-letich dziewczyek w Polsce. Rozkład populacji ma: μ, σ wybieramy losowo 00 8-latek i liczymy średią wartość z próby losowej x asz kolega wykouje aalogicze doświadczeie dostaje iy wyik x zaczyamy więc pracować razem, zowu wybieramy 00 8-latek i dostajemy trzeci wyik x 3 ale przecież jest tylko jede prawdziwy średi wzrost 8-latek w całej populacji! poieważ średia z próby jest rówież zmieą losową, możemy wykoać wielokrotie próbę losową i dostać wiele średich otrzymujemy rozkład wartości średiej z próby jeśli mamy dużo prób losowych rozkład wartości średiej dąży do rozkładu ormalego CTG: N μ, σ / KADD 06, Wykład 6 / 9

Model Laplace a iepewości pomiarowych

Model Laplace a iepewości pomiarowych W 783 roku Laplace zapropoował astępującą iterpretację iepewości pomiarowych: iech m0 będzie wartością prawdziwą rozważaej wielkości mierzoej pomiar jest zakłócay przez dużą liczbę iezależych czyików, z których każdy powoduje odchyleie rzędu ε każde zakłóceie powoduje rówe prawdopodobieństwo wywołaia zmiay mierzoej wartości zarówo o +ε i -ε iepewość pomiaru jest zatem sumą poszczególych zakłóceń rozkład iepewości opisay jest w takim przypadku rozkładem dwumiaowym KADD 06, Wykład 6 3 / 9

Model Laplace a iepewości pomiarowych przy braku zakłóceń prawdopodobieństwo uzyskaia m0 będzie oczywiście wyosić przy jedym zakłóceiu prawdopodobieństwo dzieli się po rówo a dwie możliwości m0+ε oraz m0-ε tak samo się dzieje przy każdym kolejym zakłóceiu oczywiście prawdopodobieństwa prowadzące do tego samego wyiku pomiarowego się sumują jeśli p=q=/, to model zachowuje się idetyczie jak tzw. trójkąt Pascala obrazek po prawej aalogiczie jak w przykłade z CTG, wprowadzamy zmieą stadardową: ϵ X i ϵ U = i= ϵ w graicy rozkład jest ormaly z wartością oczekiwaą 0 i odchyleiem stadardowym ϵ/ Wiosek: iepewości opisae rozkładem Gaussa są wyikiem wielu małych iezależych zaburzeń KADD 06, Wykład 6 4 / 9

Fukcja charakterystycza rozkładu

Fukcja charakterystycza rozkładu Dotychczas zajmowaliśmy się tylko zmieymi losowymi rzeczywistymi każdej realizacji zdarzeia losowego moża przypisać liczbę rzeczywistą zmieą losową Defiicję moża uogólić a zmiee losowe zespoloe, składające się z dwóch zmieych losowych rzeczywistych: Z = X +iy Wartość oczekiwaa z własości wart. ocz.: E Z= E X +i E Y Aalogiczie, zmiee losowe zespoloe są iezaleze, jeżeli odpowiedio ich części rzeczywiste i urojoe są iezależe Po co am to wszystko? Do zdefiiowaia fukcji charakterystyczej rozkładu: X jest zmieą losową rzeczywistą o rozkładzie fx i dystrybuacie Fx Fukcja charakterystycza zdefiiowaa jest jako wartość ϕt =E expitx oczekiwaa: ϕ t = exp itx f xdx Zatem dla ciągłej zmieej losowej jest to trasformata Fouriera: KADD 06, Wykład 6 6 / 9

Fukcja charakterystycza rozkładu zatem dla ciągłej zmieej losowej jest to trasformata Fouriera: ϕt = expitx f x dx dla rozkładów dyskretych: ϕt = expitx i P X = x i i= jeśli zdefiiujemy momety: λ = E X = x f x dx widać, ze moża je otrzymać przez -krote różiczkowaie fukcji charakterystyczej w pukcie t=0: d ϕt ϕ t = =i x expitx f x dx ϕ 0=i λ dt dla zmieej losowej przesuiętej o wartość oczekiwaą: Y = X x^ fukcja charakterystycza zmieej Y daa jest jako: ϕy t = expit x x^ f x dx=ϕt exp it x^ ϕ t = expitx f xdx wówczas -ta pochoda wiązaa jest z mometem zmieej X względem wartości oczekiwaej: ϕ 0=i μ =i E X x ^ y '' w szczególości wariacja: σ X = ϕy 0 KADD 06, Wykład 6 7 / 9

Fukcja charakterystycza rozkładu odwracając trasformatę Fouriera możemy z fukcji charakterystyczej otrzymać fukcję gęstości: f x= exp itxϕt dt istieje ścisły jedozaczy związek między dystrybuatą a fukcją charakterystyczą, awet wtedy, gdy mamy do czyieia z rozkładem dyskretyym, wtedy: i F b F a= π expitb expita t ϕt dt fukcji charakterystyczej i dystrybuaty moża używać zamieie i przechodzić z jedej do drugiej w miarę potrzeb fukcja charakterystycza sumy dwóch iezależych zmieych: W = X +Y ϕw t =E exp it X +Y =E expitx expity = =E expitx E exp ity =ϕx t ϕ y t KADD 06, Wykład 6 8 / 9

Fukcja charakterystycza rozkładu Przykładowe własości fukcji charakterystyczej dla wybraych rozkładów: rozkład Poissoa: ϕt =exp λ e it suma rozkładów Poissoa jest rówież rozkładem Poissoa: ϕt =exp λ λ e it σ t ϕt =exp it x^ exp rozkład ormaly: jeżeli a=0, wówczas fukcja charakterystycza o średiej rówej 0 ma postać z dokładością do czyika ormalizacyjego gęstości prawdopodobieństwa rozkładu ormalego. Iloczy wariacji obu rozkładów jest rówy rozkład jedorody: ϕt = f x=, a x b b a si b at e ia+ b t / b at suma rozkładów Gaussa: ϕu t =ϕx ϕy =expit x^ exp σ x t / exp it y^ exp σ y t / =exp it x^ + ^y exp σ x +σ y t / KADD 06, Wykład 6 9 / 9

Wielowymiarowy rozkład Gaussa

Wielowymiarowy rozkład Gaussa Rozważmy wektor zmieych losowych: Gęstość prawdopodobieństwa wielowymiarowego rozkładu ormalego: T ϕ x =k exp x a B x a =k exp g x X = X, X,..., X gdzie a jest -wymiarowym wektorem wart. oczekiwaych, atomiast B jest dodatio określoą macierzą symetryczą o wymiarze x Z symetrii rozkładu ormalego: ϕ x=e X a =... x aϕ x dx... dx =0 T g x = x a B x a E X =a Jeśli zróżcziczkujemy to wyrażeie względem a:... [ I x a x at B ] ϕ x dx... dx =0 Z def. wartości oczekiwaej zawartość awiasu kwadratowego wyosi 0: E I X a X at B =0 E X a X at B=I Czyli: C=E X a X at =B Macierz C jest macierzą kowariacji zmieych losowych X KADD 06, Wykład 6 / 9

Wielowymiarowy rozkład Gaussa Przedyskutujmy rozkład dwóch zmieych: X = X, X Macierz C ma wtedy astępującą postać: Odwracając macierz C otrzymamy: σ cov X, X C= B = cov X, X σ σ cov X, X B= σ σ cov X, X cov X, X σ W przypadku zmieych iezależych kowariacje wyoszą 0: /σ 0 B 0= 0 /σ Wstawiając B0 do ogólego wzoru otrzymamy łączą gęstość dwóch iezależych zmieych losowych jako iloczy dwóch rozkładów D: x a x a ϕ x, x =k exp KADD 06, Wykład 6 σ exp σ, k= π σ σ / 9

Wielowymiarowy rozkład Gaussa Współczyik k w ogólym przypadku: det B k= π Wprowadźmy teraz zmiee zredukowae: I współczyik korelacji: ρ= Wtedy gęstość prawdopodobieństwa: X i ai U i = σ, i=, i cov X, X =cov U, U σ σ ρ ϕu, u =k exp ut B u =k exp g u, B= ρ ρ Szukamy liii stałej gęstości prawdopodobieństwa poprzez przyrówaie wykładika do wartości stałej: ut B u= u +u + u u ρ = g u=cost ρ Jeśli a momet przyjmiemy, że g u= i wstawimy pierwote zmiee x, x Otrzymamy rówaie elipsy elipsy kowariacji o środku w a,a, której osie główe tworzą kąt α z osiami główymi x, x: x a σ x a x a x a ρ σ + = ρ σ σ KADD 06, Wykład 6 tg α= ρ σ σ σ σ 3 / 9

Elipsa kowariacji x y Wzór ogóly a elipsę ieobrócoą: + = a b a i b to wielka i mała półoś elipsy W aszym przypadku elipsa jest dodatkowo obrócoa o kąt α, zależy od wsp. korelacji Elipsa kowariacji zawsze zdefiiowaa jest wewątrz prostokąta środku w a,a oraz bokach σ, σ Jeżeli współczyik korelacji wyosi ρ=± to elpisa kowariacji degeeruje się do prostej pokrywającej się z jedą z przekątych prostokąta Elipsa kowariacji jest liią stałego prawdopod. Rysuek po prawej: pukty i mają takie samo prawdopodobieństwo prawdopodobieństwo puktu 3 jest większe iż 4 KADD 06, Wykład 6 4 / 9

Elipsa kowariacji KADD 06, Wykład 6 Korelacja wydłuża i obraca elipsę Rozmiar elipsy zależy od wariacji Elipsa kowariacji zawiera pełą iformację o macierzy kowariacji w przypadku D W 3D elipsoida kowaraiacji W D hiperelipsoida kowariacji 5 / 9

Elipsa kowariacji covx,x=0.0 a = a = 0.0 σ = σ =.0 covx,x=0.5 a = a = 0.0 σ = σ =.0 KADD 06, Wykład 6 covx,x=0.75 a = a = 0.0 σ = σ =.0 covx,x=-0.5 a = a = 0.0 σ = σ =.0 6 / 9

Elipsa kowariacji Możemy wyzaczać rówież ie wartości: g u=cost Każda elipsa kowariacji określa obszar prawdopodobieństwa aalogiczie jak w przypadku D: P X a σ=68,3 % Wartość prawdopodobieństwa wewątrz elipsy zależy od iloścu wymiarów, w D: P=39,3 % KADD 06, Wykład 6 Ie liie stałego prawdopodobieństwa elipsy wyzaczają ie wartości prawdopodobieństwa 7 / 9

Elipsa kowariacji wykorzystaie KADD 06, Wykład 6 Elipsy stałego prawdopodobieństwa mają ścisłe powiązaie z przedziałami ufości o ich w przyszłości Np. ajczęściej określa się elipsę zawierającą prawdopodobieństwo 95% z wyików daych Przykład korelacja wzrostu stature - wagi weight człowieka Aalizy tego typu dwóch lub więcej zmieych jedocześie azywamy aalizą statystyką wielowymiarową multivariate aalysis, statistics 8 / 9

Elipsa kowariacji wykorzystaie KADD 06, Wykład 6 9 / 9

KONIEC