Komputerowa analiza danych doświadczalnych

Podobne dokumenty
Komputerowa analiza danych doświadczalnych

Komputerowa analiza danych doświadczalnych

Komputerowa analiza danych doświadczalnych

Komputerowa analiza danych doświadczalnych

Ważne rozkłady i twierdzenia c.d.

16 Przedziały ufności

STATYSTKA I ANALIZA DANYCH LAB II

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Lista 6. Estymacja punktowa

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Prawdopodobieństwo i statystyka r.

Komputerowa Analiza Danych Doświadczalnych

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Niezależność zmiennych, funkcje i charakterystyki wektora losowego, centralne twierdzenia graniczne

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

STATYSTYKA MATEMATYCZNA

θx θ 1, dla 0 < x < 1, 0, poza tym,

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

1 Twierdzenia o granicznym przejściu pod znakiem całki

Twierdzenia graniczne:

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Komputerowa analiza danych doświadczalnych

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE

oznaczają łączne wartości szkód odpowiednio dla k-tego kontraktu w t-tym roku. O składnikach naszych zmiennych zakładamy, że:

Prawdopodobieństwo i statystyka

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

KADD Metoda najmniejszych kwadratów

Estymacja przedziałowa

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Statystyka matematyczna. Wykład II. Estymacja punktowa

1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych (w zakresie materiału przedstawionego na wykładzie organizacyjnym)

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

Kurs Prawdopodobieństwo Wzory

z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X

Rozkład normalny (Gaussa)

Prawdopodobieństwo i statystyka r.

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Wykład 11 ( ). Przedziały ufności dla średniej

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

MODELE MATEMATYCZNE W UBEZPIECZENIACH. 1. Renty

40:5. 40:5 = υ5 5p 40, 40:5 = p 40.

Komputerowa analiza danych doświadczalnych

P = 27, 8 27, 9 27 ). Przechodząc do granicy otrzymamy lim P(Y n > Y n+1 ) = P(Z 1 0 > Z 2 X 2 X 1 = 0)π 0 + P(Z 1 1 > Z 2 X 2 X 1 = 1)π 1 +

1 Układy równań liniowych

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Statystyka i rachunek prawdopodobieństwa

1 Dwuwymiarowa zmienna losowa

P ( i I A i) = i I P (A i) dla parami rozłącznych zbiorów A i. F ( ) = lim t F (t) = 0, F (+ ) = lim t + F (t) = 1.

ZADANIA NA ĆWICZENIA 3 I 4

STATYSTYKA I ANALIZA DANYCH

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych

Komputerowa analiza danych doświadczalnych

Estymatory nieobciążone o minimalnej wariancji

Wykład 13: Zbieżność według rozkładu. Centralne twierdzenie graniczne.

0.1 ROZKŁADY WYBRANYCH STATYSTYK

Zdarzenia losowe, definicja prawdopodobieństwa, zmienne losowe

POLITECHNIKA OPOLSKA

Matematyka ubezpieczeń majątkowych r.

n k n k ( ) k ) P r s r s m n m n r s r s x y x y M. Przybycień Rachunek prawdopodobieństwa i statystyka

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

MACIERZE STOCHASTYCZNE

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Komputerowa analiza danych doświadczalnych

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Elementy rach. macierzowego Materiały pomocnicze do MES Strona 1 z 7. Elementy rachunku macierzowego

ANALIZA DANYCH DYSKRETNYCH

Wyższe momenty zmiennej losowej

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

Weryfikacja hipotez statystycznych

Znajdowanie pozostałych pierwiastków liczby zespolonej, gdy znany jest jeden pierwiastek

Elementy modelowania matematycznego

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

2. INNE ROZKŁADY DYSKRETNE

Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/17

Model ciągły wyceny opcji Blacka Scholesa - Mertona. Wzór Blacka - Scholesa na wycenę opcji europejskiej.

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

Rozkłady statystyk z próby Twierdzenia graniczne

Transkrypt:

Komputerowa aaliza daych doświadczalych Wykład 7 5.04.09 dr iż. Łukasz Graczykowski lukasz.graczykowski@pw.edu.pl Semestr leti 08/09

Wielowymiarowy rozkład Gaussa - przypomieie Cetrale twierdzeie graicze - przypomieie Sploty Pobieraie próby, estymatory

Wielowymiarowy rozkład Gaussa Gęstość prawdopodobieństwa wielowymiarowego X= ( X, X,..., X ) rozkładu ormalego: T ϕ( x)=k exp ( x a ) B ( x a ) ( det B k= ( π) ( ) ) gdzie a jest -wymiarowym wektorem wartości oczekiwaych E ( X ) =a Natomiast B jest dodatio określoą macierzą symetryczą o wymiarze x o astępującej defiicji: T C=E ( ( X a )( X a) )=B gdzie C jest macierzą kowariacji zmieych losowych X Dla dwóch zmieych losowych: X = ( X, X ) σ cov ( X, X ) C= B = cov ( X, X ) σ ( KADD 09, Wykład 7 ) 3 / 50

Wielowymiarowy rozkład Gaussa Jeżeli a momet uzamy, że zmiee losowe X i X są iezależe: /σ 0 B 0= 0 /σ ( ) Wstawiając B0 do ogólego wzoru otrzymamy łączą gęstość dwóch iezależych zmieych losowych jako iloczy dwóch rozkładów Gaussa w D, zajomy wzór: ( x a ) ( x a ) ϕ( x, x )=k exp exp, k = π σ σ σ σ ( ) ( ) Gdy zmiee losowe ie są iezależe (iezerowe kowariacje), musimy stosować wzór ogóly (poprzedi slajd)! KADD 09, Wykład 7 4 / 50

Elipsa kowariacji Przekroje poziome fukcji gęstości prawdopodobieństwa rozkładu Gaussa mają kształt elipsy zwaej elipsą kowariacji: elipsa kowariacji zależy od wartości oczekiwaych oraz odchyleń stadardowych i kowariacji elipsa kowariacji wyzacza obszar stałego prawdopodobieństwa Dla rozkładu D rówaie elipsy (elipsy kowariacji) o środku w (a,a), której osie główe tworzą kąt α z osiami główymi x, x: ( x a) σ x a x a ( x a ) ρ σ + = ρ σ σ Rysuek po prawej: tg α= ρ σ σ pukty i mają takie samo prawd. prawd. puktu 3 jest większe iż 4 KADD 09, Wykład 7 σ σ 5 / 50

Elipsa kowariacji cov(x,x)=0.0 a = a = 0.0 σ = σ =.0 cov(x,x)=0.5 a = a = 0.0 σ = σ =.0 KADD 09, Wykład 7 cov(x,x)=0.75 a = a = 0.0 σ = σ =.0 cov(x,x)=-0.5 a = a = 0.0 σ = σ =.0 6 / 50

Elipsa kowariacji KADD 09, Wykład 7 Korelacja wydłuża i obraca elipsę Rozmiar elipsy zależy od wariacji Elipsa kowariacji zawiera pełą iformację o macierzy kowariacji (w przypadku D) W 3D elipsoida kowaraiacji W D hiperelipsoida kowariacji 7 / 50

Elipsa kowariacji Każda elipsa kowariacji określa obszar prawdopodobieństwa aalogiczie jak w przypadku D: P ( X a σ)=68,3 % Wartość prawdopodobieństwa wewątrz elipsy zależy od ilości wymiarów, w D (dla elipsy σ): P=39,3 % KADD 09, Wykład 7 Ie liie stałego prawdopodobieństwa (elipsy) wyzaczają ie wartości prawdopodobieństwa 8 / 50

Elipsa kowariacji wykorzystaie KADD 09, Wykład 7 Elipsy stałego prawdopodobieństwa mają ścisłe powiązaie z przedziałami ufości (o ich w przyszłości) Np. ajczęściej określa się elipsę zawierającą prawdopodobieństwo 95% z wyików daych Przykład korelacja wzrostu (stature) - wagi (weight) człowieka Aalizy tego typu (dwóch lub więcej zmieych jedocześie) azywamy aalizą (statystyką) wielowymiarową (multivariate aalysis, statistics) 9 / 50

Elipsa kowariacji wykorzystaie Zależość kąta zgięcia w kostce od kąta zgięcia w biodrze u młodszych i starszych osób KADD 09, Wykład 7 0 / 50

Elipsa kowariacji wykorzystaie KADD 09, Wykład 7 / 50

Cetrale twierdzeie graicze

Cetrale twierdzeie graicze Cetrale twierdzeie graicze (ag. cetral limit theorem) jedo z ajważiejszych twierdzeń rachuku prawdopodobieństwa: jeżeli zmiee losowe Xi są zmieymi iezależymi o jedakowych wartościach średich a i odchyleiach stadardowych b, to rozkład ormaly ma zmiea: ξ= X =lim X i i= E ( ξ)=a, σ (ξ)=b / rozkład ormaly będzie mieć też zmiea: X =lim X i i= E ( X )=a, σ ( X )=b Iymi słowy mając iezależych zmieych o jedakowym (dowolym!) rozkładzie, to ich suma dla dużych zbiega do rozkładu ormalego KADD 09, Wykład 7 3 / 50

Sploty

Suma zmieych losowych jako splot https://www.quora.com/the-desity-fuctio-of-the-sum-of-two-radom-variables-is-the-covolutio-of-their-respective-desities-what-is-the-ituitio-behid-this Wyobraźmy sobie taką sytuację: Mieszkasz w wiosce obok rzeki Mieszkańcy wioski wrzucają do rzeki odpady biologicze Kocetracja odpadów w fukcji odległości od miejsca zrzutu (Pollutio Spread Fuctio, PSF) jest zależa od ich rozkładu przez mikroorgaizmy w rzece Ilość wrzucaych odpadów zależy od populacji miejscowości a rzece Jaka jest peła fukcja opisująca poziom zaieczyszczeń w rzece? Jest to splot dwóch rozkładów fukcji populacji oraz fukcji kocetracji odpadów Iymi słowy, zastępujemy każdy pukt w fukcji populacji przez fukcję kocetracji przeskalowaą przez wagę fukcji populacji KADD 09, Wykład 7 5 / 50

Suma zmieych losowych jako splot https://www.quora.com/the-desity-fuctio-of-the-sum-of-two-radom-variables-is-the-covolutio-of-their-respective-desities-what-is-the-ituitio-behid-this Zamieńmy teraz sytuację a kości do gry Pierwszy rzut kostką to fukcja populacji, 6,7% populacji mieszka km w dół rzeki 6,7% popopulacji km, itd. Drugi rzut kostką ozacza fukcję PSF jak bardzo daa miejscowość zaieszyszcza rzekę, i zowu 6,7% zaieczyszczeń ląduje km dalej od miasta, 6.7% km dalej od miasta, itp. Jak policzyć pełą fukcję zaieczyszczeń? Podmieiamy fukcję populacji poprzez fukcję zaieczyszczeń, dla każdego miasta KADD 09, Wykład 7 6 / 50

Suma zmieych losowych jako splot Rozważmy zmieą losową: U = X +Y Zakładamy iezależość zmieych: f ( x, y )=f x ( x ) f y ( y ) Wtedy dystrybuata zmieej U: F (u)=p(u u)=p ( X +Y u)= = f x ( x ) f y ( y ) dx dy A = f x ( x) dx = f y ( y ) dy y u x f y ( y ) dy A u y u= x+ y f x ( x) dx x Pole powierzchi A wyzacza taki obszar prawdopodobieństwa, że wartości u zmieej loswej U=X+Y spełiają waruek: U u Zgodie z defiicją dystrybuaty: F (u)=p(u u)=p(( ; u >) KADD 09, Wykład 7 7 / 50

Suma zmieych losowych jako splot Z dystrybuaty wyzaczamy fukcję gęstości zmieej U: df (u) f (u)= = f x ( x) f y (u x) dx= f y ( y ) f x (u y )dy (f x f y )(u) du Fukcja f(u) tak zdefiiowaa jest splotem fukcji fx(x) i fy(y) Powyższy wzór jest prawdziwy rówież wówczas, jeżeli zmiee X i Y są zdefiiowae tylko w pewym ograiczoym obszarze (wtedy ustalamy odpowiedie węższe i skończoe graice całkowaia) Rozpatrzmy przypadek splotu dwóch rozkładów jedorodych: 0 x< f x ( x)=, 0, w przeciwym razie { KADD 09, Wykład 7 } 0 y < f y ( y)=, 0, w przeciwym razie { } 8 / 50

Suma zmieych losowych jako splot Splot dwóch rozkładów jedorodych: 0 x< f x ( x)=, 0, w przeciwym razie { 0 y < f y ( y)=, 0, w przeciwym razie { } v=u x f (u)= f x ( x ) f y (u x) dx= f y (u x ) dv = dx 0 0 u } u f (u)= f y ( v) dv= f y ( v)dv u u Zmiea u zmieia się od 0 do, zatem rozważmy przypadki: u u (a) 0 u < : f (u)= f y ( v)dv = dv=u 0 0 (b) u < : f (u)= f y (v) dv= dv= u u KADD 09, Wykład 7 u 9 / 50

Suma zmieych losowych jako splot Rozpatrzmy przypadek splotu dwóch rozkładów jedorodych: 0 x< f x ( x)=, 0, w przeciwym razie { 0 y < f y ( y)=, 0, w przeciwym razie { } f (u)= f x ( x) f y (u x) dx= f y (u x ) 0 0 v=u x dv = dx u } u f (u)= f y ( v) dv= f y ( v)dv u u Zmiea u zmieia się od 0 do, zatem rozważmy przypadki: u u (a) 0 u < : f (u)= f y ( v)dv = dv=u 0 0 (b) u < : f (u)= f y (v) dv= dv= u u u https://e.wikipedia.org/wiki/covolutio#/media/file:covolutio_of_box_sigal_with_itself.gif KADD 09, Wykład 7 0 / 50

Suma zmieych losowych jako splot Aalogiczie będzie z sumą trzech zmieych losowych: / u, 0 u< f (u)= / ( u +6 u 3 ), u< / ( u 3 ), u<3 { } Zgodie z CTG im więcej rozkładów w splocie, tym bardziej rozkład sumy przypomia rozkład Gaussa: u=x u=x+x u=x+x+x3 u=x+x+x3+x4 KADD 09, Wykład 7 / 50

Sploty z rozkładem ormalym Przykład: Mierzymy zmieą X opisaą gęstością prawdopodobieństwa fx(x). Pomiar obarczoy jest iepewością Y mającą rozkład ormaly. Wyik jest zatem sumą zmieych losowych: U = X +Y Gęstość prawdopodobieństwa zmieej U wyosi wtedy: (u x) f (u)= f x ( x) f y (u x) dx= f x ( x)exp dx π σ σ ( ) Problem: eksperymetalie otrzymujemy fukcję f(u), ale tak aprawdę iteresuje as fx(x). Jak ją wyzaczyć? w ogólym przypadku jest to iemożliwe moża tego dokoać dla pewej ograiczoej klasy fukcji f(u) ajczęściej posługujemy się tutaj metodami Mote Carlo KADD 09, Wykład 7 / 50

Sploty z rozkładem ormalym przykład Przykład: Splot rozkładu jedostajego z rozkładem ormalym (o średiej rówej 0) W tym przypadku możliwe jest rozwiązaie aalitycze. Korzystamy ze wzorów: f ( x)= ; x a, b b a g ( y)= e y / σ π σ h (u)= f ( x) g (u x) dx f ( x)=0 ; x ℝ a, b Wtedy, wprowadzając zmieą v=( x u)/ σ otrzymujemy: b (b u)/ σ h (u)= exp ( (u x) / σ ) dx= exp v dv b a π σ a b a π (a u) /σ Z uwzględieiem stablicowaej dystrybuaty rozkładu ormalego: h (u)= b u a u Φ0 σ Φ0 σ b a ( ( ) ( ( ) f(x) )) h(u) KADD 09, Wykład 7 3 / 50

Sploty z rozkładem ormalym przykład Przykład: Splot dwóch rozkładów ormalych dodawaie iepewości w kwadracie Splot dwóch rozkładów ormalych o wartościach średich rówych 0 i wariacjach σ x, σ y ma postać rozkładu ormalego: f (u)= exp ( u / σ ), σ =σ x +σ y π σ Widzimy, że wariacje się dodają (odchyleia std. dodają się w kwadracie) Jeśli średie rozkładów róże od 0 wartości oczekiwae rówież się dodają KADD 09, Wykład 7 4 / 50

Zastosowaie splotów Cyfrowe przetwarzaie obrazów Akustyka Muzyka elektroicza W fizyce gdzie się pojawia superpozycja W plaowaiu radioterapii (rozkłady dawki) https://upload.wikimedia.org/wikipedia/e//4/lea.pg Playboy 97 stadardowy obrazek w grafice komput. https://developer.apple.com/library/cotet/documetatio/performace/coceptual/vimage/covolutiooperatios/covolutiooperatios.html KADD 09, Wykład 7 5 / 50

Zastosowaie splotów Bardzo ważym zastosowaiem splotów są badaia farmakokietycze leków kocetracja leku w osoczu krwi w czasie jest splotem fukcji absorpcji leku oraz jego elimiacji https://www.researchgate.et/publicatio/848 604_I_Vitro-I_Vivo_Correlatio_IVIVC_ad _Determiig_Drug_Cocetratios_i_Blood_ from_dissolutio_testig-a_simple_ad_practi cal_approach https://www.slideshare.et/jaspreetguraya/i-vitro-i-vivo-correlatio-ivivc https://upload.wikimedia.org/wikipedia/commos/7/7d/bupropio_bioe https://image.slidesharecd.com/pharmacokieticmodels-409300043-p hpapp0/95/pharmacokietic-models-8-638.jpg?cb=4037860 quivalecy_compariso.svg KADD 09, Wykład 7 6 / 50

Pobieraie próby

Pobieraie próby W przypadku pomiarów eksperymetalych ajczęściej ie zamy rozkładu prawdopodobieństwa opisującego day pomiar (p. parametru rozkładu Poissoa w rozpadach promieiotwórczych, czy parametrów rozkładu Gaussa opisującego jakąś populację) Te parametry chcemy wyzaczyć doświadczalie, ie jesteśmy jedak w staie zebrać ieskończeie wiele pomiarów W kosekwecji jesteśmy zmuszei przybliżać rozkład gęstości za pomocą rozkładu częstości (histogramu o skończoej liczbie wejść) Próbą (ag. sample) azywamy zespół doświadczeń wykoywaych w celu określeia kształtu (parametrów) poszukiwaego rozkładu: próba otrzymywaa jest poprzez wybór elemetów z (często ieskończoego) zbioru wszystkich możliwych doświadczeń (wszystkich możliwych pomiarów), zwaego populacją geeralą próbę o składikach azywamy próbą -wymiarową https://e.wikipedia.org/wiki/samplig_%8statistics KADD 09, Wykład 7 %9#/media/File:Simple_radom_samplig.PNG 8 / 50

Pobieraie próby Cała sztuka polega a odpowiedim wybraiu próby z populacji, by aproksymacja rozkładu gęstości była jemu jak ajwieriejsza Załóżmy, że rozkład zmieej losowej X opisyway jest fukcją f(x) iteresują as wartości zmieej X uzyskae przez poszczególe elemety próby Pobieramy l prób, każda o wymiarze, i zaobserwowaliśmy astępujące wartości zmieej X: () ( ). próba : X (), X,, X j -ta próba : X (j ), X (j ),, X (j) ( l) l -ta próba : X (l ), X (l),, X Oczywiście, to co pobraliśmy jest też zmieą losową! Elemety próby losowej (wartości zmieej X), są zmieą losową Każdą próbę możemy przedstawić jako wtektor (-wymiarową zmieą losową): X ( j)=( X ( j), X (j),, X (j)) Wektor ma rozkład gęstości prawdopodobieństwa: g ( x)=g ( x, x,, x ) KADD 09, Wykład 7 9 / 50

Pobieraie próby Aby moża było mówić o losowym pobieraiu próby: zmiee Xi muszą być iezależe, czyli: g ( x)=g ( x ) g ( x ) g ( x ) poszczególe rozkłady muszą być jedakowe i idetycze z rozkładem gęstości populacji: g ( x )=g ( x )= =g ( x )=f ( x) Należy podkreslić, że w rzeczywistym procesie pobieraia próby często bardzo trudo jest zapewić pełą losowość ie ma tutaj jedej recepty jak to zrobić (ależy starać się spełić powyższe waruki) przykładowo: prowadząc badaia kliicze leków powiiśmy zapewić w każdym ośrodku próbę losową i kotrolą pacjetów, która jest taka sama jak w iych ośrodkach, co bardzo często ie jest możliwe praktyczie KADD 09, Wykład 7 30 / 50

Pobieraie próby Teraz zdefiiujemy pojęcia, które charakteryzują próbę losową: fukcję elemetów próby losowej azywamy statystyką ajważiejszym przykładem statystyki jest średia z próby (ag. sample mea) zdefiiowaa jako średia z elemetów próby: X = ( X + X + + X ) https://upload.wikimedia.org/wikipedia/commos//7/empirical_cdf.pg KADD 09, Wykład 7 3 / 50

CTG - powtórzeie Przykład: wyobraźmy sobie, że szacujemy wzrost w populacji ośmioletich dzieci w Polsce. Rozkład populacji ma parametry: μ, σ wybieramy losowo 00 8-latków i liczymy średią wartość z próby losowej X asz kolega wykouje aalogicze doświadczeie dostaje iy wyik X zaczyamy więc pracować razem, zowu wybieramy 00 8-latków i dostajemy trzeci wyik X 3 ale przecież jest tylko jede prawdziwy średi wzrost 8-latek w całej populacji! poieważ średia z próby jest rówież zmieą losową, możemy wykoać wielokrotie próbę losową i dostać wiele średich otrzymujemy rozkład wartości średiej z próby jeśli mamy dużo prób losowych rozkład wartości średiej z prób dąży do rozkładu ormalego (CTG): N (μ, σ / ) KADD 09, Wykład 7 3 / 50

Pobieraie próby - przykład Przykład wzrost Polaków Niewątpliwie, wzrost Polaków (zmiea losowa X) podlega pewemu rozkładowi f(x) z dystrybuatą F(x) Pomiar wzrostu pojedyczego Polaka daje wartość x Losowy wybór tego jedego polaka to zmiea losowa X Jeżeli stworzymy -wymiarową próbę losową, tz. wybierzemy Polaków, to rozkład prawdopodobieństwa wyboru dla każdej z osób (od g(x) do g(x)) jest taki sam jak dla całej populacji i rówy f(x) Zadaiem estymacji jest zalezieie takiej statystyki (a więc fukcji określoej a wektorze X=(X,,X)), aby ajlepiej przybliżała oa rzeczywistą wartość parametru opisującego rzeczywisty rozkład zmieej losowej X KADD 09, Wykład 7 33 / 50

Estymatory Typowy problem aalizy daych: zamy (p. z prawa fizyczego) ogólą postać gęstości prawdopodobieństwa w daej populacji, ależy jedyie wyzaczyć parametry tego rozkładu. Przykład: mierzymy rozpad radioaktywy w czasie: N (t )= N 0 ( exp ( λ t )) parametr λ wyzaczamy a podstawie próby mierząc skończoą ilość razy ilość rozpadów w czasie wyik igdy ie będzie dokłady, bo próba jest skończoa, mamy problem estymacji parametrów poszukiwaa wielkość uzyskiwaa jest fukcją elemetów próby (statystyką) i jest azywaa estymatorem: S=S ( X, X,, X ) estymator jest ieobciążoy, jeżeli iezależie od liczebości próby jego wartość oczekiwaa jest rówa wartości estymowaego parametru: E ( S ( X, X,, X ) ) =λ, dla każdego estymator jest zgody, jeżeli jego wariacja zika: lim σ ( S ( X, X,, X ) )=0 KADD 09, Wykład 7 34 / 50

Estymatory wartość oczekiwaa Wartość średia ze wszystkich elemetów próby jest zmieą losową (jest fukcją zmieych losowych). Jej wartość oczekiwaa (tej średiej): E ( X )= E ( X )+ E ( X )+ + E ( X ) ) =E ( X )= x^, dla każdego ( Wiosek: wartość średia (arytmetycza) z próby to estymator ieobciążoy wartości oczekiwaej zmieej X w populacji Możemy obliczyć wariację wartości średiej: σ ( X )=E { X E ( X ) } = E = )} ^ ^ ^ E [( X x )+( X x )+ +( X x )] { } Z uwagi a iezależość zmieych kowariacje między zmieymi Xi zikają, czyli ostateczie: σ ( X )= σ ( X ) {( x + x + + x x^ lim σ ( X )=0 Wiosek: wartość średia (arytmetycza) z próby jest rówież estymatorem zgodym wartości oczekiwaej KADD 09, Wykład 7 35 / 50

Estymatory - wariacja Jak pamiętamy z defiicji wariacji, ie jest oa zmieą losową Możemy wariację przybliżyć przez średią arytmetyczą odchyleń kwadratowych od wartości średiej: S ' ( X )= ( X X ) +( X X ) + +( X X ) ) ( Wartość oczekiwaa tej wielkości: E ( S ' ( X ) )= E = E { { i= } { ( X i X ) = E i= ( X i ^x + x^ X ) i= } ( X i ^x ) + ( ^x X ) + i= ( X i ^x )( x^ X ) i= } = { E ( ( X i ^x ) ) E (( X ^x ) ) }= σ ( X ) σ ( X ) i= = σ (X) { ( )} Widać więc, że S' jest estymatorem obciążoym dla wariacji populacji mającym wartość oczekiwaą miejszą iż σ(x) KADD 09, Wykład 7 36 / 50

Estymatory - wariacja Możemy jedak iezaczie zmodyfikować defiicję wariacji z próby i wprowadzić estymator: S ( X )= ( X X ) +( X X ) + +( X X ) ) ( Otrzymyjemy estymator ieobciążoy wariacji populacji Jeśli wykorzystamy zay z CTG wzór: σ ( X )= σ ( X ) To otrzymamy estymator wariacji wartości średiej z próby: S ( X )= S ( X )= ( X i X ) ( ) i= Zaś odpowiadające odchyleie stadardowe (iepewość średiej z próby): Δ X = S ( X )=S ( X )= S( X) KADD 09, Wykład 7 S= S = ( X i X^ ) i = 37 / 50

Estymatory - wariacja Estymator wariacji wartości średiej z próby: S ( X )= S ( X )= ( X i X ) ( ) i= Zaś odpowiadające odchyleie stadardowe (estymator iepewość średiej z próby): Δ X = S ( X )=S ( X )= Jaka jest zaś iepewość wariacji z próby (bez wyprowadzeia)? czyli: estymator wariacji estymatora wariacji wartości średiej z próby? I tak dalej możemy tworzyć koleje poziomy estymatorów... Δ S =S S( X) KADD 09, Wykład 7 38 / 50

Estymatory - wariacja Podsumowując zatem estymatory ieobciążoe: wartości oczekiwaej populacji średia z próby (wyik doświadczeia): X = ( X + X + + X ) wariacji populacji wariacja z próby (aproksymowaa): S ( X )= ( X X ) +( X X ) + +( X X ) ) ( wariacji wartości średiej z próby (patrz iepewość typu A): S ( X )= S ( X )= ( X i X ) ( ) i= wariacji (aproksymowaej) wariacji z próby 4 Var ( S ) =S ( ) dalej możemy wyzaczać p. wariację wariacji aproksymowaego estymatora wariacji próby i tak dalej (w ieskończoość)... KADD 09, Wykład 7 39 / 50

Graficze przedstawieie próby

Graficze przedstawieie próby Rozważmy próbę: x, x,, x, która zależy od jedej zmieej losowej X Możemy tę próbę przedstawić jako wykres D pukty a osi x jedowymiarowy wykres puktowy wada: co w przypadku, gdy mamy dwa takie same pomiary? Z reguły stosujemy zatem wykres D, zway histogramem: dzielimy przedział zmieości x (lub jego część) a r przedziałów o jedakowej szerokości Δx: ξ, ξ,..., ξr środki przedziałów zajdują się w puktach: x, x,..., x r a osi y odkładamy liczbę elemetów próby przypadającą a day przedział:,,..., r tak otrzymay wykres azywamy wykresem częstości lub histogramem KADD 09, Wykład 7 4 / 50

Graficze przedstawieie próby iep. = k wykres schodkowy KADD 09, Wykład 7 4 / 50

Histogram szerokość przedziału KADD 09, Wykład 7 Im więcej przedziałów, tym iformacja o próbie jest dokładiejsza Większa ilość przedziałów powoduje jedak większe wahaia statystycze od puktu do puku Pole pod krzywą schodkową jest proporcjoale do wielkości próby (jeśli je przeskalujemy przez /, otrzymamy częstość) 43 / 50

Graficze przedstawieie próby - przykład Badamy iezay rozkład prawdopodobieństwa Symulujemy taką sytuację poprzez geerację 000 prób z rozkładu Gaussa o wartości średiej 0 i wariacji. Każda próba ma liczość (liczbę składików) r. Badamy zachowaie estymatorów charakterystyk rozkładu i estymatorów ich iepewości w fukcji liczości próby r X = ( X + X + + X ) estymator wartości oczekiwaej populacji σ ( X )=Δ X = (S ( X ))=S ( X )= iepewość wart. średiej - estymator odch. st.wartości średiej z próby (estymatora wart. oczekiwaej) średia z próby S ( X )= S ( X )= ( X X ) estymator odch. std. populacji S ( X )= i S( X ) S( X ) σ ( S ( X ))=Δ S ( X )= ( ) iepewość estymatora odch. std. populacji estymator odch. std. estymatora odch. std. populacji ( X X ) +( X X ) + +( X X ) } σ ( S ( X ))=Δ S ( X )=S ( X ) { estymator wariacji populacji KADD 09, Wykład 7 iepewość estymatora wariacji populacji estymator odch. std. estymatora wariacji populacji 44 / 50

Estymatory - histogramy r = 0 KADD 09, Wykład 7 45 / 50

Estymatory - histogramy r = 0 r = 50 KADD 09, Wykład 7 46 / 50

Wielowymiarowy rozkład Gaussa

Estymatory - histogramy r = 0 r = 50 KADD 09, Wykład 7 r = 00 48 / 50

Estymatory - histogramy r = 0 r = 50 KADD 09, Wykład 7 r = 00 r = 00 49 / 50

Estymatory - histogramy r = 0 r = 50 r = 00 r = 00 lim σ ( S ( X, X,, X ) )=0 KADD 09, Wykład 7 50 / 50

KONIEC