Komputerowa Analiza Danych Doświadczalnych

Podobne dokumenty
Ważne rozkłady i twierdzenia c.d.

Komputerowa Analiza Danych Doświadczalnych

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Spis treści 3 SPIS TREŚCI

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Metoda największej wiarygodności

Rozkłady statystyk z próby

Wnioskowanie statystyczne. Statystyka w 5

Weryfikacja hipotez statystycznych

Komputerowa Analiza Danych Doświadczalnych

Estymacja punktowa i przedziałowa

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Statystyka matematyczna dla leśników

Komputerowa analiza danych doświadczalnych

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych.

Komputerowa analiza danych doświadczalnych

Testowanie hipotez statystycznych.

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

STATYSTYKA MATEMATYCZNA

Estymacja parametrów rozkładu cechy

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Komputerowa analiza danych doświadczalnych

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Ważne rozkłady i twierdzenia

1 Podstawy rachunku prawdopodobieństwa

Estymacja parametrów, przedziały ufności etc

Rozkłady statystyk z próby. Statystyka

Statystyka i eksploracja danych

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Statystyka w przykładach

Oszacowanie i rozkład t

Komputerowa analiza danych doświadczalnych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Biostatystyka, # 3 /Weterynaria I/

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Komputerowa analiza danych doświadczalnych

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

STATYSTYKA

Zmienne losowe ciągłe i ich rozkłady

Zmienne losowe ciągłe i ich rozkłady

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Prawdopodobieństwo i statystyka

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka matematyczna dla leśników

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

STATYSTYKA wykład 5-6

Analiza niepewności pomiarów

Dokładne i graniczne rozkłady statystyk z próby

Metody probabilistyczne

1 Estymacja przedziałowa

Zmienne losowe. Statystyka w 3

WYKŁAD 5 TEORIA ESTYMACJI II

INFORMATYKA W CHEMII Dr Piotr Szczepański

Estymacja przedziałowa. Przedział ufności

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Rozkłady wielu zmiennych

Estymacja parametrów, przedziały ufności etc

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Wykład 3 Jednowymiarowe zmienne losowe

Wynik pomiaru jako zmienna losowa

Statystyka w analizie i planowaniu eksperymentu

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Komputerowa Analiza Danych Doświadczalnych

Statystyka w analizie i planowaniu eksperymentu

Metody Statystyczne. Metody Statystyczne.

Statystyka matematyczna

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

METODY STATYSTYCZNE W BIOLOGII

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Matematyka 2. dr inż. Rajmund Stasiewicz

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

O ŚREDNIEJ STATYSTYCZNEJ

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych.

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Zawartość. Zawartość

Dr Anna ADRIAN Paw B5, pok 407

Transkrypt:

Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd Politechnika Warszawska Wydział Fizyki Pok. 117b (wejście przez 115)

WIELOWYMIAROWY ROZKŁAD NORMALNY 2

Wielowymiarowy rozkład normalny Wektor zmiennych losowych: x= x 1, x 2,..., x n Gęstość prawdopodobieństwa rozkładu normalnego: x =k exp { 1 2 x a T B x a }=k exp{ 1 2 g x } a to n-wymiarowy wektor wartości oczekiwanych. Można dowieść, że czyli: C=B 1 E { x a x a T }B=I C jest macierzą kowariancji. Zmienne 2- wymiarowych: =[ 2 C=B 1 1 cov x 1, x 2 ] 2 cov x 1, x 2 2 1 [ 2 B= 2 cov x 1, x 2 ] 2 1 2 2 cov x 1, x 2 2 2 cov x 1, x 2 1 3

Wielowymiarowy rozkład normalny Dla znikających kowariancji: =[ 1 B 0 0 2 1 ] 1 0 2 2 x 1, x 2 =k exp{ 1 2 x 1 a 2 1 2 }exp{ 1 2 x 2 a 2 2 2 2 } 1 k = 2 1 2 Zmienne losowe zredukowane: Współczynnik korelacji: u i = x i a i i =cov x 1, x 2 1 2 =cov u 1, u 2 u 1, u 2 =k exp { 1 2 ut B u}=k exp { 1 2 g u } B= 1 1 2 [ 1 ] 1 4

Wielowymiarowy rozkład normalny Równanie elipsy o środku w a i a : 1 2 x 1 a 1 2 1 2 2 x 1 a 1 1 x 2 a 2 2 x 2 a 2 2 2 2 =1 2 Osie główne elipsy tworzą kąt α z osiami x oraz x. 1 2 tg 2 = 2 1 2 1 2 2 2 Półosie elipsy: 2 p 2 1 2 2 1 2 1 = 2 2 cos 2 2 1 2 sin cos 2 1 sin 2 2 p 2 1 2 2 1 2 2 = 2 2 sin 2 2 1 2 sin cos 2 1 cos 2 Elipsa o takich parametrach to elipsa kowariancji (dla 2D rozkładu normalnego). 5

cov(x,y) = = 0.0 m 1 = m 2 = 0.0 1 = 2 = 1.0 cov(x,y) = =0.75 m 1 = m 2 = 0.0 1 = 2 = 1.0 cov(x,y) = =0.5 m 1 = m 2 = 0.0 1 = 2 = 1.0 cov(x,y) = = -0.5 m 1 = m 2 = 0.0 1 = 2 = 1.0 6

cov(x,y)=0.0 m 1 = m 2 = 0.0 1 = 2 = 1.0 cov(x,y)=0.75 m 1 = m 2 = 0.0 1 = 2 = 1.0 cov(x,y)=0.5 m 1 = m 2 = 0.0 1 = 2 = 1.0 cov(x,y)=-0.5 m 1 = m 2 = 0.0 1 = 2 = 1.0 7

Wielowymiarowy rozkład normalny Linie stałego prawdopodobieństwa to elipsy (wzajemnie koncentryczne, leżą wewnątrz lub na zewnątrz elipsy kowariancji). W rozkładzie błędów dla zmiennej 1D,, (przy obszarze całkowania), (niezależnie od wielkości σ) była stała wartość. a σ x a+σ Dla zmiennej 2D,, należy uwzględnić wartości:, (nie prostokąt) 1, 2, x 2 2 Zmienne 3D elipsoida kowariancji. 1 Zmiennych nd hiperelipsoida w przestrzeni n-wymiarowej. x 1 8

Wielowymiarowy rozkład normalny Elipsoida kowariancji - hiperpowierzchnia w przestrzeni n-wymiarowej o równaniu g(x) ) = 1. Dla innych wartości g(x) = const - inne elipsoidy (wewnątrz - g<1 lub na zewnątrz - g>1 elipsoidy kowariancji. Można wykazać, że jeśli x ma rozkład normalny, to g(x) ) ma rozkład χ 2 o n stopniach swobody. Prawdopodobieństwo wystąpienia wartości wektora x wewnątrz elipsoidy g = const: g W = 0 f X 2 ;n d X 2 =P n 2, g 2 P to niepełna funkcja Gamma. Dla elipsoidy kowariancji: W n =P n 2, 1 2 Dla małych n: W = 0.68269; W = 0.39347; W = 0.19875; 1 2 3 W = 0.09020; W = 0.03734; W = 0.01439; 4 5 6 9

Wielowymiarowy rozkład normalny Aby wyznaczyć obszary, dla różnych n o tym samym prawdopodobieństwie: - ustalamy wartość W - obliczyć odpowiadającą mu wartość g. - g staje się kwantylem z prawdopodobieństwem w rozkładzie X 2 o n stopniach swobody. g=χ W 2 (n) Elipsoida odpowiadająca wartości g, że zawiera wektor x z prawdopodobieństwem W - elipsoida ufności. W= 0.9 wektor x leży wewnątrz elipsoidy ufności z prawdopodobieństwem 90%. Wariancje, odchylenia standardowe w przypadku N-wymiarowym. Prawdopodobieństwo uzyskania wartości zmiennej losowej x z przedziału a σ < x < a + σ i i i i i i nie zależy od liczby zmiennych n, (jak w przypadku zmiennej 1D) 68.3%. Słuszne tylko wtedy, gdy nie występują dodatkowe ograniczenia na przybierane wartości. 10

SPLOTY ROZKŁADÓW 11

Sploty rozkładów Przykład: rozkład kątów emisji cząstek wtórnych w rozpadach cząstek elementarnych. (do wyznaczenia własności cząstek, np. spinu). Kąt rozpadu = kąt emisji + błąd pomiaru (2 zmienne losowe, kąt emisji przypadkowy) Kąt rozpadu (rozkład) to splot (dwóch) innych rozkładów. Pierwotne wielkości: zmienne x, y,, suma: u = x + y Niezależność zmiennych: f(x, y) = f x (x)) f y (y). Dystrybuanta zmiennej u: : F(u) ) = P(u < u) = P(x x + y <u) Możliwe jest jej wyznaczenie poprzez całkowanie całkowanie funkcji f(x, y). y A u=a+y x 12

Sploty rozkładów F u = f x x f y y dx dy= u x f x x dx f y y dy= u y f y y dy f x x dx Gęstość prawdopodobieństwa: f u = df u du = f x x f y u x dx= f y y f x u y dy Wzór słuszny nawet wtedy, gdy zmienne x, y określone tylko w pewnym obszarze, (zmieniają się granice całkowania - zawężają się). 13

Sploty rozkładów jednostajnych f x x =1 x [0,1] f y y =1 y [0,1] 1 f u = 0 f y u x dx v=u x dv= dx f u = 0 u 1: 1 u 2: u f 1 u = 0 1 f 2 u = u 1 u f y v dv= 0 1 f y v dv= u 1 dv=u dv=2 u u 1 u u f y v dv= u 1 f y v dv 14

Sploty rozkładów Splot dwóch rozkładów normalnych dodawanie błędów w kwadratach. Splot 2 rozkładów normalnych o wartościach oczekiwanych 0 oraz odchyleniach standardowych x, y jest rozkładem normalnym: f u = 1 2 exp u2 2 2 2 = 1 2 2 2 Wartości oczekiwane oraz wariancje dodają się (odchylenia standardowe dodają się w kwadratach). 15

POBIERANIE PRÓBY 16

Pobieranie próby Nieznany rozkład prawdopodobieństwa? Jego aproksymacja rozkład częstości (otrzymany doświadczalnie). Próba - skończony zespół doświadczeń wykonywanych w celu określenia kształtu rozkładu. Otrzymywana ze zbioru elementów składającego się np. ze zbioru wszystkich możliwych do wyobrażenia doświadczeń i przypadków określonego typu. Zbiór ten jest nieskończony, populacja generalną. Próba ma n elementów próba n-wymiarowa. Rozkład zmiennej losowej x określony przez gęstość prawdopodobieństwa f(x). Szukamy wartości zmiennej x (uzyskane poprzez l poszczególnych elementów próby). 17

Pobieranie próby 1. próba:.. j. próba.. l. próba: x 1 1, x 2 1,..., x n 1 x 1 j, x 2 j,..., x n j x 1 l, x 2 l,..., x n l Wyniki grupowane w n-wymiarowe wektory przestrzeni prób: x j = x 1 j, x 2 j,..., x n j Rozkład gęstości prawdopodobieństwa: g x =g x 1, x 2,..., x n 18

Pobieranie próby Pobieranie próby losowe: (a) poszczególne zmienne losowe muszą być niezależne g x =g 1 x 1 g 2 x 2... g n x n (b) poszczególne rozkłady muszą być jednakowe i identyczne z rozkładem gęstości dla populacji. g 1 x 1 =g 2 x 2 =...=g n x n W rzeczywistym procesie pobierania próby niezwykle trudno jest zachować pełną losowość. Wszystkie n elementów próby porządkujemy w kolejności niemalejącej, W n x =n x /n dystrybuanta empiryczna. - funkcja schodkowa, zwiększą się o 1/n; - przybliżenie dystrybuanty, - dąży do tej dystrybuanty <=> n bardzo duże, (n -> inf). 19

Pobieranie próby Statystyka - funkcja elementów. Wartość średnia a z próby (średnia arytmetyczna z próby): x= 1 n (x 1+x 2 +...+ x n ) Przy znanej postaci matematycznej gęstości prawdopodobieństwa dla populacji, gdy trzeba wyznaczyć z populacji wartość parametru (-ów): Rozpad promieniotwórczy (liczba rozpadających się jąder w przedziale czasowym (0, t)): N t =N 0 1 exp t wyznaczony na podstawie skończonej próby (mierząc skończoną liczbę r. promieniotwórczych). Wynik nie może być dokładny (ograniczoną liczebność próby). Parametry są więc estymowane. Estymowana wartość otrzymywana za pomocą pobierania próby (jest więc statystyką, estymatorem. S=S x 1, x 2,..., x n 20

Pobieranie próby Estymator nieobciążony: : (niezależnie od liczebności próby) jego wartość oczekiwana jest równa wartości estymowanego parametru (n dowolne). E {S x 1, x 2,..., x n }= Estymator zgodny: wariancja znika dla dowolnie dużej próby. lim n S =0 (Czasami podaje się dolną granicę wariancji dla estymatorów. Jeśli znajdziemy S 0, którego wariancja jest równa tej granicy to stosowanie go pozwala uzyskać maksymalną efektywność w estymacji parametrów. To estymator efektywny parametru. 21

Pobieranie próby z populacji typu ciągłego Wartość średnia ze wszystkich elementów próby (średnia arytmetyczna) to zmienną losową. Jej wartość oczekiwana: Jest ona równa wartości oczekiwanej zmiennej x. Ponieważ powyższa równość jest spełniona dla każdego n, to jest to wartość średnia (średnia arytmetyczna) to estymator nieobciążony dla wartości oczekiwanej zmiennej x w populacji. E { x}= 1 n {E x 1 E x 2... E x n }= x Funkcja charakterystyczna wartości średniej: x t ={ x n t } n ={ x t n } n 22

Pobieranie próby z populacji typu ciągłego Wariancja wartości średniej (średniej arytmetycznej): σ 2 ( x)=e { x E( x)} 2 =E {( x 1+ x 2 +...+x n n 2 x) } 2 x = 1 n 2 E {[ x 1 x x 2 x... x n x ] 2 } Wszystkie elementy próby niezależne, wszystkie kowariancje E { x i x x j x }=0 2 x = 1 n 2 x i j Wartość średnia z próby to estymator zgodny wartości oczekiwanej. 23

Pobieranie próby z populacji typu ciągłego Wariancja to nie zmienna losowa (nie można wyznaczyć doświadczalnie). Wyznaczenie estymatora wariancji: : (w pierwszym przybliżeniu: średnia arytmetyczna odchyleń kwadratowych od wartości średniej z próby): S ' 2 = 1 n { x 1 x 2 x 2 x 2... x n x 2 } Można dowieść, że: E S ' 2 = n 1 n 2 x S' 2 to estymator obciążony dla wariancji. Estymator nieobciążony wariancji: S 2 = 1 n 1 { x 1 x 2 x 2 x 2... x n x 2 } 24

Pobieranie próby z populacji typu ciągłego Estymator wariancji wartości średniej: S 2 x = 1 n s2 x = 1 n n n 1 i=1 Błąd wartości średniej z próby: x= S 2 x =S x = 1 n s x Wariancja wyrażenia: x i x 2 var S 2 = 2 2 n 1 2 n 1 Błąd wariancji z próby: s 2 =s 2 2 n 1 Estymator odchylenia standardowego próby i jego błąd: s= s 2 = 1 n 1 x i x 2 s= s 2 n 1 25

WIZUALIZACJA 26

Przedstawianie próby w postaci graficznej Zmierzona została 1000 razy grubość pręta ołowianego. W jaki sposób przedstawić wyniki pomiarów oraz wyznaczyć grubość wraz z błędem? 1) Określamy przedział zmienności grubości x 2) Określamy na ile przedziałów o jednakowej grubości go podzielimy 27

Przedstawianie próby w postaci graficznej 28

Przedstawianie próby w postaci graficznej 29

KONIEC WYKŁADU 6 30