Agata Boratyńska. WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 2017
|
|
- Edyta Zielińska
- 6 lat temu
- Przeglądów:
Transkrypt
1 1 Agata Boratyńska WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 017
2 Agata Boratyńska Wykłady ze statystyki matematycznej Literatura W. Niemiro Rachunek prawdopodobieństwa i statystyka matematyczna, SNS 1999 W. Niemiro Statystyka, wniem/statystyka/statystyka.pdf J. Koronacki i J. Mielniczuk Statystyka WNT 004 J. Jóźwiak i J. Podgórski, Statystyka od podstaw, PWE 1994 H. Kassyk-Rokicka, Statystyka, zbiór zadań, 005 lub inne wydania W. Krysicki Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, cz.. PWN 1998 D. Silvey Wnioskowanie statystyczne, PWN R. Zieliński Siedem wykładów wprowadzających do statystyki matematycznej, PWN rziel/7all.pdf wojtek.zielinski.statystyka.info/moj ojciec/public html/7all.pdf A. Boratyńska Zadania ze statystyki matematycznej, aborata/ekonomia/wykladsm.pdf A. Boratyńska Wykłady ze statystyki matematycznej, aborata/ekonomia/zadsek.pdf A. Boratyńska Slajdy z kolejnych wykładów aborata/wne sm php A. Jokiel-Rokita i R. Magiera, Modele i metody statystyki matematycznej w zadaniach, Oficyna Wydawnicza GiS, Wrocław 005 A.D. Aczel, Statystyka w zarządzaniu, PWN W. Zieliński Tablice statystyczne. C.R. Rao Statystyka i prawda, PWN 1994 Lavine M. (013) Introduction to Statistical Thought
3 Agata Boratyńska Wykłady ze statystyki matematycznej 3 Statystyka jest bardziej sposobem myślenia lub wnioskowania niż pęczkiem recept na młócenie danych w celu odsłonięcia odpowiedzi C. R. Rao... statystyka jest nauką o tym, jak wykorzystywać informacje do analizy i wytyczania kierunków działania w warunkach niepewności. V. Barnett Comparative Statistical Inference Nauka nie stara się wyjaśniać, a nawet niemal nie stara się interpretować, zajmuje się ona głównie budową modeli. Model rozumiany jest jako matematyczny twór, który, po dodaniu słownej interpretacji, opisuje badane zjawiska. Jedynym i właściwym uzasadnieniem takiego tworu matematycznego jest oczekiwanie, że sprawdzi się on w działaniu. John von Neumann Kłamstwo, wierutne kłamstwo, statystyka Liczby nie kłamią ale kłamcy liczą Ch. H. Grosvenor Prawa naukowe nie są formułowane na mocy autorytetów ani uzasadniane przez wiarę czy średniowieczną filozofię. Jedynym sądem odwoławczym dla nowej wiedzy jest statystyka P.C. Mahanalobis
4 Agata Boratyńska Wykłady ze statystyki matematycznej 4 Tematyka zajęć Statystyka opisowa Indeksy (tylko na ćwiczeniach) Model statystyczny, pojęcie statystyka Estymacja punktowa Estymacja przedziałowa Weryfikacja hipotez statystycznych Wstęp do statystyki bayesowskiej
5 Agata Boratyńska Wykłady ze statystyki matematycznej 5 STATYSTYKA - nauka poświęcona metodom badania i analizowania zjawisk masowych; polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w postaci zestawień tabelarycznych, wykresów, diagramów itp. Zajmuje się zbieraniem, przetwarzanie, przedstawianiem danych oraz wniskowaniem na ich podstawie. STATYSTYKA MATEMATYCZNA - dział matematyki stosowanej oparty na rachunku prawdopodobieństwa, zajmuje się badaniem zbiorów i wnioskowaniem o pewnych charakterystykach cech (zmiennych losowych) na podstawie znajomości podzbiorów i obserwacji wartości zmiennej losowej w postaci próby losowej.
6 Agata Boratyńska Wykłady ze statystyki matematycznej 6 STATYSTYKA OPISOWA, WSTĘPNA ANALIZA DANYCH. populacja - zbiór obiektów z wyróżnioną cechą, zbiorowość poddawana badaniu. cecha - wielkość losowa charakteryzująca obiekty danej populacji lub interesująca badacza zmienna losowa: cecha ilościowa (mierzalna): skokowa np: ocena, liczba dzieci ciągła np: waga, zarobki jakościowa (niemierzalna) np: kolor oczu, płeć, wykształcenie jednostka badania - element populacji poddany badaniu próba - wybrana część populacji poddana badaniu, zbiór jednostek badania jednostka cecha X cecha Y cecha Z... 1 x 1 y 1 z 1... x y z... 3 x 3 y 3 z badanie pełne - obejmuje całą populację (np. spis powszechny) badanie reprezentacyjne - obejmuje część populacji Wnioskowanie o całej populacji na podstawie próby losowej wymaga metod rachunku prawdopodobieństwa.
7 Agata Boratyńska Wykłady ze statystyki matematycznej 7 PREZENTACJA DANYCH Cel: przejrzystość Sposób: tabela lub wykres, zależy od danych Szereg rozdzielczy punktowy (tablica kontyngencji) wartości cechy liczności częstość częstość (liczba jednostek) skumulowana x 1 n 1 f 1 = n 1 n f 1 x n f = n n f 1 + f x k n k f k = n k n 1 Razem n 1 PRZYKŁAD 1. W grupie 0 studentów oceny z egzaminu ze statystyki były następujące: Dane w szeregu ocena liczba studentów częstość częstość skumulowana 0,10 0, ,30 0, ,5 0, ,0 0, ,05 0,90 5 0,10 1 Razem 0 1
8 Agata Boratyńska Wykłady ze statystyki matematycznej 8 Przejrzystym sposobem prezentacji jest wykres słupkowy. Wykres słupkowy: - wykres słupkowy liczności - wykres słupkowy częstości - dystrybuanta empiryczna (wykres słupkowy skumulowany)
9 częstość skumulowana liczba studentów częstość Agata Boratyńska Wykłady ze statystyki matematycznej 9 PRZYKŁAD 1 cd, wykresy słupkowe, dystrybuanta empiryczna Wykres słupkowy (diagram) liczności ocena z egzaminu Wykres słupkowy (diagram) częstości ocena z egzaminu 7 0,35 6 0,30 5 0,5 4 0,0 3 0,15 0,10 1 0,05 0,00 3,00 3,50 4,00 4,50 5,00 ocena 0,00,00 3,00 3,50 4,00 4,50 5,00 ocena histogram częstości skumulowanych (dystrybuanta empiryczna) 1,0 1,00 0,80 0,60 0,40 0,0 0,00 0,00 1,00,00 3,00 4,00 5,00 6,00 ocena
10 Agata Boratyńska Wykłady ze statystyki matematycznej 10 Szereg rozdzielczy przedziałowy Uwagi: c i = c i 1+c i przedział środek przedziału liczności częstości (c 0, c 1 ] c 1 n 1 f 1 = n 1 n (c 1, c ] c n f = n n (c k 1, c k ] c k n k f k = n k n Najczęściej klasy o jednakowej szerokości lub o zbliżonej liczności Liczba klas k spełnia 3 4 n k n liczbę klas można też dobierać ustalając szerokość, jedna z reguł to gdzie IQR - rozstęp międzykwartylowy b, 64 IQR n 1 3 Jeżeli liczba klas jest równa k i klasy są jednakowej długości, to długość b spełnia gdzie X 1:n - najmniejsza obserwacja X n:n - największa obserwacja b X n:n X 1:n k
11 Agata Boratyńska Wykłady ze statystyki matematycznej 11 PRZYKŁAD. Powierzchnię mieszkań w pewnym osiedlu podaje tabela 3,45 33,1 34,36 35,78 37,79 38,54 38,91 38,96 39,50 39,67 39,80 41,45 41,55 4,7 4,40 4,45 44,5 44,50 44,70 44,83 44,90 45,10 45,90 46,5 47,65 48,10 48,55 48,90 49,00 49,4 49,55 49,65 49,70 49,90 50,90 51,40 51,50 51,65 51,70 51,80 51,98 5,00 5,10 5,30 53,65 53,89 53,90 54,00 54,10 55,0 55,30 55,56 55,6 56,00 56,70 56,80 56,90 56,95 57,13 57,45 57,70 57,90 58,00 58,50 58,67 58,80 59,3 63,40 63,70 64,0 64,30 64,60 65,00 66,9 66,78 67,80 68,90 69,00 69,50 73,0 76,80 77,10 77,80 78,90 79,50 8,70 83,40 84,50 84,90 85,00 86,00 89,10 89,60 93,00 96,70 98,78 103,00 107,90 11,70 118,90 przedział środek liczba mieszkań częstości razem 100 1
12 Agata Boratyńska Wykłady ze statystyki matematycznej 1 WYKRESY Histogram - jest to wykres słupkowy, którego podstawę stanowią przedziały klasowe, a wysokości słupków sa proporcjonalne do liczności n i poszczególnych klas. Jeżeli wysokości są równe licznościom klas to mamy histogram liczności, jeżeli są równe częstościom to histogram częstości. W sytuacji, gdy klasy nie mają równej długości wysokość słupków określa się wg wzoru gdzie f i - to częstość, a b i - szerokość klasy. (porównaj histogramy - przykład 1,,3) h i = f i b i Łącząc punkty o współrzędnych ( c i, n i ) otrzymujemy łamaną liczności, a łącząc punkty o współrzędnych ( c i, f i ) albo ( c i, h i ) łamaną częstości. W szeregu rozdzielczym możemy również podawać liczności i częstości skumulowane. przedział liczności częstości skumulowane cn i skumulowane cf i (c 0, c 1 ] n 1 f 1 = n 1 n (c 1, c ] n 1 + n f 1 + f (c k 1, c k ] n 1 + n n k = n f 1 + f f k = 1 Jeżeli wysokości słupków histogramu są równe licznościom (częstościom) skumulowanym to otrzymujemy histogram liczności (częstości) skumulowanych. Łącząc punkty o współrzędnych (c i, cn i ) otrzymujemy łamaną liczności skumulowanych, a łącząc punkty o współrzędnych (c i, cf i ) otrzymujemy łamaną częstości skumulowanych.
13 częstości częstość skumulowana Agata Boratyńska Wykłady ze statystyki matematycznej 13 PRZYKŁAD cd. Wykresy 0,35 Histogram częstości Łamana częstości skumulowanych 0,30 0,5 1,0 1,00 0,0 0,80 0,15 0,60 0,10 0,40 0,05 0,0 0, powierzchnia mieszkania 0,00 0,00 0,00 40,00 60,00 80,00 100,00 10,00 powierzchnia mieszkania
14 Agata Boratyńska Wykłady ze statystyki matematycznej 14 PRZYKŁAD 3. Dane asymetryczne Szereg rozdzielczy 0,0007 histogram c i 1 c i n i h i , , , , , , , , > , ,0006 0,0005 0,0004 histogram 0,0003 0,000 0,
15 Agata Boratyńska Wykłady ze statystyki matematycznej 15 CHARAKTERYSTYKI PRÓBKOWE miary położenia miary zróżnicowania, zmienności, rozproszenia miary asymetrii miary koncentracji MIARY POŁOŻENIA: klasyczne - średnia arytmetyczna pozycyjne: mediana, moda, kwantyle Średnia arytmetyczna X z próby losowej X 1, X,..., X n (dane surowe) dane z szeregu rozdzielczego punktowego X = X 1 + X X n n X = 1 k x i n i n i=1 dane z szeregu rozdzielczego przedziałowego X 1 k c i n i n i=1 PRZYKŁAD 1 cd. X = = 3.5
16 Agata Boratyńska Wykłady ze statystyki matematycznej 16 PRZYKŁAD cd. dla danych z szeregu rozdzielczego X = 1 ( ) = Uwaga: jeżeli dostępne są dane surowe zaleca się korzystanie ze wzoru pierwszego.
17 Agata Boratyńska Wykłady ze statystyki matematycznej 17 Mediana Med z próby losowej jest to liczba, taka że co najmniej 50% obserwacji przyjmuje wartość nie większą od niej i co najmniej 50% obserwacji wartość nie mniejszą od niej. Wyliczamy ją w następujący sposób: dane surowe: ustawiamy rosnąco, i-tą obserwację w ciągu ustawionym rosnąco oznaczamy symbolem X i:n i nazywamy i-tą statystyką pozycyjną W szczególności X 1:n = min{x 1, X,..., X n } X n:n = max{x 1, X,..., X n } { X n+1 Med = :n gdy n nieparzyste 1 (X n :n + X n+ :n) gdy n parzyste dane z szeregu rozdzielczego przedziałowego Med c L + gdzie c L - dolna granica klasy mediany b - szerokość klasy mediany n M - liczność klasy mediany M - numer klasy b n M ( ) n M 1 n i i=1 PRZYKŁAD 1 cd. Med = X 10:0+X 11:0 = 3,5+3,5 = 3, 5 PRZYKŁAD cd. dla danych z szeregu rozdzielczego M = 3, n 3 = 33, c L = 50, b = 10 Med (50 34) = 54, 85 33
18 Agata Boratyńska Wykłady ze statystyki matematycznej 18 Moda (dominanta) M o - wartość najczęściej powtarzająca się w próbie (często zakłada się, że nie może być to wartość największa ani najmniejsza) Przy danych z szeregu rozdzielczego Mo c L + n Mo n Mo 1 (n Mo n Mo 1 ) + (n Mo n Mo+1 ) b gdzie n Mo - liczność najliczniejszej klasy zwanej klasą mody, c L - lewy koniec klasy mody PRZYKŁAD 1 cd. Mo = 3 PRZYKŁAD cd. Mo = 53, PRZYKŁAD 3 cd. Mo , , = 354, 56 0, , ,
19 Agata Boratyńska Wykłady ze statystyki matematycznej 19 PRZYKŁAD 4. Miesięczne zarobki zasadnicze pracowników z wyższym wykształceniem w pewnej firmie zarobki liczba osób Razem 31 X = 3506 Med = X 16:31 = 3100 Mo = 3000 Jeżeli z danych wyrzucimy największą obserwację to mediana i moda się nie zmienią a średnia będzie równa 33 Uwagi: średnia jest nieodporna na obserwacje odstające, mediana jest najbardziej odporna na zaburzenia, niedokładności pomiaru, zmiany, wartości odstające moda - stosuje się do danych pogrupowanych
20 Agata Boratyńska Wykłady ze statystyki matematycznej 0 Kwantyle Kwantyl próbkowy rzędu p = Q p liczba taka, że odsetek wartości nie większych niż Q p wynosi co najmniej p, a wartości nie mniejszych co najmniej 1 p. Q p = { Xnp:n+X np+1:n gdy np Z X [np]+1:n w pp lub Q p = X [np]+1:n Kwartyle: Pierwszy kwartyl (dolny kwartyl) Q 1/4 - to taka wartość cechy, że co najmniej 5% obserwacji przyjmuje wartość nie większą od niej i co najmniej 75% obserwacji wartość nie mniejszą od niej. Drugi kwartyl = Mediana Trzeci kwartyl (kwartyl górny) Q 3/4 - to taka wartość cechy, że co najmniej 75% obserwacji przyjmuje wartość nie większą od niej i co najmniej 5% obserwacji wartość nie mniejszą od niej. PRZYKŁAD 1 cd. Przy danych z szeregu rozdzielczego Q 1/4 = X 5:0 + X 6:0 Q 3/4 = X 15:0 + X 16:0 Q 1/4 c L + b n M1 = 3 = 4 n M i=1 n i gdzie c L - dolna granica klasy kwartyla b - szerokość klasy kwartyla n M1 - liczność klasy kwartyla M 1 - numer klasy Q 3/4 c L + b n M3 3n M i=1 n i
21 Agata Boratyńska Wykłady ze statystyki matematycznej 1 gdzie c L - dolna granica klasy kwartyla b - szerokość klasy kwartyla n M3 - liczność klasy kwartyla M 3 - numer klasy PRZYKŁAD cd. Za Q 1/4 odpowiada obserwacja o numerze n 4 kwartyla jest klasa druga M = = 5, stąd klasa Q 1/ (5 11) = Za Q 3/4 odpowiada obserwacja o numerze 3 n = 75, stąd klasą kwartyla jest klasa 4 czwarta M = 4 Q 3/ (75 67) = Kwartyle dzielą próbę na cztery części (ze względu na liczność), w każdej jest w przybliżeniu 5% obserwacji. Porównanie wskaźników dla danych surowych i szeregu rozdzielczego PRZYKŁAD cd. PRZYKŁAD 3 cd. miara dane surowe szereg rozdzielczy średnia 59,58 58,70 mediana 55,5 54,85 Q 1/4 47,88 46,09 Q 3/4 67,9 66,67 miara dane surowe szereg rozdzielczy średnia 99, ,9 mediana Q 1/4 417,5 450 Q 3/4 84,5 945,45
22 Agata Boratyńska Wykłady ze statystyki matematycznej MIARY ROZPROSZENIA Rozstęp czyli odległość między największą i najmniejszą obserwacją r = X n:n X 1:n Rozstęp międzykwartylowy IQR = Q 3/4 Q 1/4 podaje długość odcinka, na którym leży 50% środkowych wartości w uporządkowanej niemalejąco próbie. Uwaga: rozstęp jest funkcją tylko krańcowych obserwacji, jest nieodporny na obserwacje odstające, tej wady pozbawiony jest rozstęp międzykwartylowy Wariancją z próby losowej X 1, X,..., X n (dane surowe) nazywamy liczbę Ŝ = 1 n (X i n X) i=1 = 1 ( n ) Xi n n X i=1 Dla danych pogrupowanych w szeregu rozdzielczym otrzymujemy Ŝ 1 k n i ( c i n X) i=1 Przy danych pogrupowanych w szeregu rozdzielczym stosuje się jeszcze poprawkę związaną z założeniem rozkładu równomiernego danych na poszczególnych przedziałach S = 1 n k i=1 n i ( c i X) 1 1n k n i (c i c i 1 ) i=1 Odchylenie standardowe Ŝ = Ŝ lub S = S Odchylenie przeciętne d = 1 n ni=1 X i X
23 Agata Boratyńska Wykłady ze statystyki matematycznej 3 W sytuacji gdy chcemy porównać rozrzut dwóch lub więcej prób korzystamy ze współczynnika zmienności V = Ŝ X 100% PRZYKŁAD 1 cd. r = 5 = 3 IQR = 4 3 = 1 Ŝ = 1 0 { ( 3, 5) + 6(3 3, 5) + 5(3, 5 3, 5) +4(4 3, 5) + 1(4, 5 3, 5) + (5 3, 5) } = 0, 63 Ŝ = 0, 658 = 0, 79 d = 1 { 3, , , 5 3, , , 5 3, , 5 } = 0, 6 PRZYKŁAD cd. Dla danych z szeregu rozdzielczego r = 90 IQR 66, 67 46, 09 = 0, 58 Ŝ 331, 31 Ŝ 18, 0 S = 3, 98 S = 17, 97 Wariancja z danych surowych d 13, 96 Ŝ = 333, 85
24 Agata Boratyńska Wykłady ze statystyki matematycznej 4 WYKRES RAMKOWY, PUDEŁKO Z WĄSAMI X max Kwartyl górny wąsy mediana Kwartyl dolny X min Obs. odstające WYKRES RAMKOWY, uwagi Maksymalna długośc wąsa to 1, 5IQR Obserwacje odstające są to obserwacje o wartościach x < x lub x > x gdzie { [ x = min X i : X i Q 1/4 3 ]} IQR, Q 1/4 { x = max X i : X i [Q 3/4, Q 3/4 + 3 ]} IQR Pozwala na jednym rysunku przedstawić wiadomości dotyczące położenia, rozproszenia i kształtu rozkładu empirycznego badanej cechy. Na wykresie zaznacza się kwartyle, średnią, medianę, największą i najmniejszą obserwację, obserwacje odstające. pozwala porównywać próby losowe ze wzgledu na wymienione parametry
25 Agata Boratyńska Wykłady ze statystyki matematycznej 5 Dane Przykład 1 Dane Przykład
26 Agata Boratyńska Wykłady ze statystyki matematycznej 6 WSKAŹNIKI ASYMETRII Współczynnik asymetrii (klasyczny) A = M 3 S 3 gdzie M 3 jest trzecim momentem centralnym równym dla danych surowych M 3 = 1 n (X i n X) 3, i=1 dla danych pogrupowanych w szeregu rozdzielczym otrzymujemy Pozycyjny miernik asymetrii Współczynnik skośności M 3 1 k n i ( c i n X) 3 i=1 A = Q 3/4 Med + Q 1/4 Q 3/4 Q 1/4 A 1 = X Mo S Asymetria dodatnia (prawostronna) - wskaźniki asymetrii dodatnie Asymetria ujemna (lewostronna) - wskaźniki asymetrii ujemne PRZYKŁAD 1 cd. A = 0, 08, PRZYKŁAD cd. A = 1, 10 A 1 = 3,5 3,5 0,79 = 0 A 1 = 58,7 53, 18, = 0, 30 PRZYKŁAD 3cd. A 1 = 4398,9 354, ,97 = 0, 46
27 Agata Boratyńska Wykłady ze statystyki matematycznej 7 INDEKSY STATYSTYCZNE Zbiór wartości danej cechy lub wartości określonego zjawiska zaobserwowany w różnych (ale chronologicznych) momentach czasu nazywamy szeregiem czasowym. PRZYKŁAD. cena akcji w kolejnych dniach stycznia, zarobki w pewnej gałęzi przemysłu w kolejnych latach, wielkość produkcji w kolejnych miesiącach Indeksy statystyczne służą do badania dynamiki zjawiska na podstawie danych z kolejnych okresów czasowych (na podstawie szeregu czasowego). y t - poziom zjawiska (wartość cechy) w chwili (okresie) t, t {0, 1,,..., n} t = y t y t 1 - przyrost absolutny δ t = yt y t y t - przyrost względny względem wartości w chwili t. INDEKSY PROSTE - mierniki tempa zmian zjawiska Indeks łańcuchowy dynamiki i t t 1 = yt y t 1 Tempo zmian wartości zjawiska w okresie t w stosunku do okresu t 1 jest równe (i t t 1 1)100% = yt y t, gdzie t jest ustaloną chwilą (ustalo- Indeks jednopodstawowy dynamiki i t t nym okresem) czasu. Tempo zmian wartości zjawiska w okresie t w stosunku do okresu t jest równe (i t t 1)100% Związki między indeksami: jeśli t > t to jeśli t < t to i t t 1 = t i t t = i t t = t=t +1 t t=t +1 i t t i t 1 t, i t t 1, 1 i t t 1.
28 Agata Boratyńska Wykłady ze statystyki matematycznej 8 Średnie tempo zmian wartości zjawiska ( n ) 1 ( ) 1 n yn n ( ) 1 r = ī g 1 = i t t 1 1 = 1 = n in 0 1 t=1 y 0 Średnie tempo zmian wartości zjawiska określa tempo zmian zjawiska jakie powinno występować przez cały okres (0, n), aby przyrost z okresu (0, n) rozłożyć równomiernie w czasie. Zatem y n = y 0 (r + 1) n.
29 Agata Boratyńska Wykłady ze statystyki matematycznej 9 AGREGATOWE INDEKSY WARTOŚCI, ILOŚCI I CEN. Indeksy agragatowe oceniają dynamikę zjawiska w niejednorodnej zbiorowości (np. dynamika cen różnych artykułów, dynamika spożycia różnych produktów, dynamika sprzedaży, produkcji kilku dóbr). Dane z dwóch okresów (momentów) czasowych: t = 0 - okres podstawowy i t = 1 okres badany produkt cena jednostki ilość wartość t = 0 t = 1 t = 0 t = 1 t = 0 t = 1 1 p 10 p 11 q 10 q 11 w 10 = p 10 q 10 w 11 = p 11 q 11 p 0 p 1 q 0 q 1 w 0 = p 0 q 0 w 1 = p 1 q j p j0 p j1 q j0 q j1 w j0 = p j0 q j0 w j1 = p j1 q j k p k0 p k1 q k0 q k1 w k0 = p k0 q k0 w k1 = p k1 q k1 Agregatowy indeks wartości I w = kj=1 w j1 kj=1 w j0 informuje o łącznej zmianie wartości wszystkich produktów w momencie badanym do momentu podstawowego
30 Agata Boratyńska Wykłady ze statystyki matematycznej 30 Agregatowy indeks cen określa wpływ zmian cen na dynamikę wartości (gdyby ilości w obu momentach czasu były niezmienione), mówi o przeciętnych zmianach cen wszystkich rozważanych produktów Agregatowy indeks cen Laspeyresa LI p = Agregatowy indeks cen Paaschego kj=1 p j1 q j0 kj=1 p j0 q j0 = kj=1 p j1 p j0 p j0 q j0 kj=1 p j0 q j0 P I p = kj=1 p j1 q j1 kj=1 p j0 q j1 Agregatowy indeks cen Fishera F I p = LI pp I p Agregatowy indeks ilości określa wpływ zmian ilości na dynamikę wartości (gdyby w obu momentach ceny były niezmienione), informuje o przeciętnych zmianach ilości poszczególnych produktów w obu porównywanych momentach czasu Agregatowy indeks ilości Laspeyresa LI q = Agregatowy indeks ilości Paaschego kj=1 p j0 q j1 kj=1 p j0 q j0 = kj=1 q j1 q j0 p j0 q j0 kj=1 p j0 q j0 P I q = kj=1 p j1 q j1 kj=1 p j1 q j0 Agregatowy indeks ilości Fishera F I q = LI qp I q Związki między indeksami I w = L I pp I q = L I qp I p = F I pf I q
31 Agata Boratyńska Wykłady ze statystyki matematycznej 31 MODEL STATYSTYCZNY, PODSTAWOWE ZADANIA STATYSTYKI MATEMATYCZNEJ ZADANIE z rachunku prawdopodobieństwa Rzucamy niezależnie 100 razy symetryczną monetą. Oblicz: 1. prawdopodobieństwo wyrzucenia 60 orłów. wartość oczekiwaną liczby wyrzuconych orłów Rozwiązanie: Model probabilistyczny: X - liczba wyrzuconych orłów, zmienna losowa o rozkładzie dwumianowym bin(100, 1/) Odpowiedzi: 1. P (X = 60) = ( ) ( ) = EX = nθ = 50 ZADANIE ze statystyki matematycznej Rzucono niezależnie 100 razy pewna monetą uzyskując 60 orłów. Polecenia: 1. oszacuj prawdopodobieństwo uzyskania orła w pojedynczym rzucie;. czy moneta jest symetryczna Co znamy? Model probabilistyczny z dokładnością do parametru X - liczba wyrzuconych orłów, obserwowana zmienna losowa o rozkładzie dwumianowym, znamy n = 100 (liczba prób),
32 Agata Boratyńska Wykłady ze statystyki matematycznej 3 nieznamy θ prawdopodobieństwa sukcesu w pojedynczej próbie θ (0, 1) - nieznany parametr ( ) 100 P θ (X = x) = (θ) x (1 θ) 100 x x Wynik obserwacji x = 60, na jego podstawie chcemy wnioskować o nieznanym parametrze θ. Wnioskowanie statystyczne Zagadnienie estymacji - szacowanie nieznanego parametru lub funkcji na podstawie wyniku obserwacji; - estymacja punktowa - podanie oszacowania w postaci liczbowej; - estymacja przedziałowa - podanie oszacowania w postaci przedziału nazywanego przedziałem ufności Testowanie hipotez statystycznych - weryfikacja hipotezy dotyczącej nieznanej wielkości rozkładu obserwowanej zmiennej losowej na podstawie wyniku obserwacji predykcja (przewidywanie) - przewidywanie wartości zmiennej losowej nieobserwowanej Y za pomocą obserwowanej zmiennej X, rozkłady zmiennej Y i X zależą od tego samego parametru. Pole cenia w zadaniu z monetą: 1. wyznacz estymator lub przedział ufności parametru θ. zweryfikuj hipotezę H : θ = 1
33 Agata Boratyńska Wykłady ze statystyki matematycznej 33 MODEL STATYSTYCZNY (X, F X, P) X - przestrzeń wartości obserwowanej zmiennej losowej X F X - σ-ciało podzbiorów P - rodzina rozkładów prawdopodobieństwa indeksowanych pewnym parametrem θ P = {P θ : θ Θ} PRZYKŁAD (zadanie z monetą): model ( X = {0, 1,,..., 100}, X, P = {P θ : θ (0, 1)} ) gdzie P θ (X = x) = ( ) 100 x (θ) x (1 θ) 100 x Statystyką nazywamy zmienną losową T będącą funkcją obserwowanej zmiennej losowej X. Rozkład statystyki zależy od rozkładu zmiennej X Wnioskowanie statystyczne przeprowadza się na podstawie wybranych w modelu statystyk i ich wartości Przykłady modeli statystycznych Kontrola jakości i model dwumianowy, wnioskowanie o prawdopodobieństwie pojawienia się braku Sondaż opinii publicznej i model hipergeometryczny, wnioskowanie o popularności Pomiary i model normalny, wnioskowanie o wartości oczekiwanej i dokładności pomiarów Wypadki samochodowe i model Poissona, wnioskowanie o średniej liczbie wypadków Czas życia i model z rozkładem wykładniczym, wniskowanie o średnim czasie życia i prawdopodobieństwie przeżycia Porównania np skuteczności diet
34 Agata Boratyńska Wykłady ze statystyki matematycznej 34 PEWNE WAŻNE ROZKŁADY Rozkład χ Niech Z i N(0, 1), i = 1... k, Z i niezależne Rozkładem χ z k stopniami swobody nazywamy rozkład prawdopodobieństwa zmiennej losowej k Y = Zi i=1 i oznaczamy Y χ k gęstość EY = k i V ary = k p k (x) = 1 k Γ( k 1 exp ( 1 ) x 1 (0, ) (x) )xk kwantyl rzędu p - F 1 χ k wartość krytyczna rzędu α (p) - jest to liczba taka, że P {Y F 1 (p)} = p χ (α, k) = F 1 (1 α) χ k - jest to liczba, taka że prawdopodobieństwo zdarzenia Y > χ (α, k) jest równe α. χ k
35 Agata Boratyńska Wykłady ze statystyki matematycznej 35 Rozkład t-studenta Niech Z N(0, 1) i Y χ k oraz Z i Y niezależne, wtedy rozkład zmiennej losowej T = Z Y k nazywamy rozkładem t-studenta z k stopniami swobody i oznaczamy gęstość ET = 0 gdy k > 1 V art = k gdy k > k kwantyl rzędu p - F 1 t k T t k f k (x) = 1 Γ ( ) k+1 ( kπ Γ ( ) k wartość krytyczna dwustronna rzędu α 1 + x ) k+1 (p) - jest to liczba taka, że P {T F 1 (p)} = p ( t(α, k) = Ft 1 k 1 α ) - jest to liczba, taka że prawdopodobieństwo zdarzenia T > t(α, k) jest równe α. t k
36 Agata Boratyńska Wykłady ze statystyki matematycznej 36 Rozkład F (Fishera-Snedecora) Niech Y χ k i V χ r oraz zmienne Y i V są niezależne, wtedy rozkład zmiennej losowej F = Y/k V/r nazywamy rozkładem F z k i r stopniami swobody i oznaczamy F F k,r gęstość gdy x > 0 p k,r (x) = Γ ( ) k+r Γ ( k ) Γ ( r ) ( r k ) r x k 1 ( x + r k ) k+r 1 (0, ) (x) kwantyl rzędu p - F 1 F k,r (p) wartość krytyczna rzędu α F (α, k, r) = F 1 F k,r (1 α) - jest to liczba, taka że prawdopodobieństwo zdarzenia F > F (α, k, r) jest równe α.
37 Agata Boratyńska Wykłady ze statystyki matematycznej 37 Rozkłady pewnych statystyk w modelu normalnym X 1, X,..., X n i.i.d. N(µ, σ ), µ R, σ > 0 Własności X i S są niezależne; X N(µ, σ n ) E X = 1 n E n i=1 X i = 1 n nex 1 = µ V ar X = 1 n V ar n i=1 X i = 1 n nv arx 1 = σ n X = 1 n n X i=1 i S = 1 n n 1 (X i=1 i X) Zmienna n i=1 (X i µ) σ ma rozkład χ n (n 1)S = n (X i X) σ i=1 σ χ n 1 E (n 1)S σ = n 1 i V ar (n 1)S σ = (n 1) stąd ES = σ i V ars = σ4 n 1 X µ σ n N(0, 1) i (n 1)S σ χ n 1 zatem T = n X µ σ (n 1)S σ (n 1) = X µ n tn 1 S Niech X 1, X,..., X n i.i.d. N(µ 1, σ ) i Y 1, Y,..., Y m i.i.d. N(µ, σ ) Niech SX = 1 n n 1 (X i=1 i X)
38 Agata Boratyńska Wykłady ze statystyki matematycznej 38 i Wtedy (n 1)S X i zmienne sa niezależne, stąd σ SY = 1 m m 1 (Y i=1 i Ȳ ) χ n 1 (m 1)S Y σ χ m 1 (n 1)SX σ (n 1) (m 1)SY σ = S X S Y F n 1,m 1
39 Agata Boratyńska Wykłady ze statystyki matematycznej 39 ZAGADNIENIE ESTYMACJI Zagadnienie estymacji - szacowanie nieznanego parametru lub funkcji na podstawie wyników obserwacji; X 1, X,..., X n - niezależne zmienne losowe o tym samym rozkładzie (i.i.d.) P θ - próba losowa θ Θ - nieznany parametr, Θ R(R k ) Estymatorem parametru θ nazywamy dowolną funkcję ˆθ(X 1, X,..., X n ), której wartości należą do przestrzeni Θ, i której celem jest oszacowanie parametru θ. Metody wyznaczania estymatorów Charakterystyki próbkowe - estymatory w oparciu o dystrybuantę empiryczną estymatory metodą momentów estymatory metodą kwantyli estymatory metodą największej wiarogodności
40 Agata Boratyńska Wykłady ze statystyki matematycznej 40 CHARAKTERYSTYKI PRÓBKOWE - estymatory w oparciu o dystrybuantę empiryczną Model: (R, F) n, gdzie F rodzina dystrybuant na prostej rzeczywistej X = (X 1, X,..., X n ) - próbka losowa z rozkładu o dystrybuancie F Dystrybuanta empiryczna gdzie F n (X, t) = F n (t) = liczba X i, takich że X i t n F n (t) = 1 n Σ1 (,t](x i ) = 1 n Σ1 [x i:n, )(t) 1 (,t] (X i ) = jest zmienną losową dwupunktową, { 1 gdy Xi (, t] 0 w przeciwnym przypadku P F (1 (,t] (X i ) = 1) = F (t) Dystrybuanta empiryczna, przykład Próba losowa:
41 Agata Boratyńska Wykłady ze statystyki matematycznej 41 Dystrybuanta empiryczna, własności: jest statystyką jako funkcja próby losowej jest średnią z n zmiennych losowych o rozkładzie dwupunktowym (zero-jedynkowym) jest dystrybuantą rozkładu jednostajnego skupionego w punktach x 1, x,..., x n (wartości próby losowej) jako funkcja zmiennej t jest estymatorem dystrybuanty rozkładu obserwowanej zmiennej losowej X Własności F n jako statystyki 1. Wartość oczekiwana dystrybuanty empirycznej w danym punkcie ( ) 1 E F F n (t) = E F n Σn i=11 (,t] (X i ) = 1 n n ( E F 1 (,t] (X i ) ) = F (t). Wariancja dystrybuanty empirycznej w danym punkcie V ar F F n (t) = 1 F (t)(1 F (t)) n 3. CTG dla każdego z. P F x : F n (t) F (t) n N(0, 1) F (t)(1 F (t)) F n (t) F (t) n z Φ(z) F (t)(1 F (t)) 4. Twierdzenie Gliwenki Cantellego. Dla prawie wszystkich wartości x 1, x,..., x n Przykład. Zbieżność dystrybuanty empirycznej sup F n (t) F (t) 0 gdy n t
42 Agata Boratyńska Wykłady ze statystyki matematycznej 4 Dystrybuanta empiryczna dla dwóch próbek i dystrybuanta teoretyczna N=10 N=10 N=100 Charakterystyki próbkowe jako estymatory Charakterystyki próbkowe w oparciu o próbę (X 1, X,..., X n ) są równe charakterystykom liczbowym rozkładu zmiennej losowej, której dystryuanta jest równa dystrybuancie empirycznej w oparciu o próbę (X 1, X,..., X n ) WNIOSEK: średnia z próby - estymator wartości oczekiwanej mediana próbkowa - estymator mediany kwantyl próbkowy - estymator kwantyla rozkładu wariancja z próby - estymator wariancji itd
43 Agata Boratyńska Wykłady ze statystyki matematycznej 43 METODY WYZNACZANIA ESTYMATORÓW Estymacja metodą momentów (EMM) Model: X 1, X,..., X n i.i.d z rozkładu P θ, θ- nieznany parametr Postępowanie: Porównujemy momenty rozkładu teoretycznego (zależą od nieznanego(ych) parametru(ów)) do odpowiednich momentów empirycznych, z otrzymanego układu równań wyznaczamy nieznany parametr θ R (jednowymiarowa przestrzeń parametrów), rozwiąż (niewiadomą jest θ): E θ X = X θ = (θ 1, θ ) R, rozwiąż układ (niewiadomą jest θ): { Eθ X = X V ar θ X = Ŝ θ = (θ 1, θ,..., θ k ) (k-wymiarowa przestrzeń parametrów), rozwiąż układ (niewiadomą jest θ): E θ X = X V ar θ X = Ŝ E θ (X µ) 3 = 1 (Xi X) 3 n E θ (X µ) k = 1 (Xi X) k n gdzie µ = E θ X.
44 Agata Boratyńska Wykłady ze statystyki matematycznej 44 Przykład 1. X = (X 1, X,..., X n ), X i Ex(θ) i są niezależne, θ > 0 EMM(θ) =? Rozwiązujemy równanie: stąd E θ X i = + 0 xθe θx dx = 1 θ 1 θ = X EMM(θ) = ˆθ = 1 X Przykład. X = (X 1, X,..., X n ), X i Gamma(α, β) i są niezależne, α, β > 0 EMM(α) =? i EMM(β) =?. p α,β (x) = βα Γ(α) xα 1 e βx gdy x > 0 E α,β X i = α β V ar α,β X i = α β Otrzymujemy układ: Stąd: α = X β α = β Ŝ ˆβ = X i ˆα = X Ŝ Ŝ Przykład 3. Wyznaczyć EMM parametrów w rozkładzie P areto(θ, λ), θ >, λ > 0.
45 Agata Boratyńska Wykłady ze statystyki matematycznej 45 Rozwiązanie: X = (X 1, X,..., X n ), X i P areto(θ, λ) i są niezależne Otrzymujemy układ: p θ,λ (x) = θλ θ (λ + x) θ+1, x > 0 Stąd: ˆθ = λ θ 1 = X λ θ (θ 1) (θ ) = S S S X ˆλ = X(ˆθ 1).
46 Agata Boratyńska Wykłady ze statystyki matematycznej 46 EMK (estymacja metodą kwantyli) Model: X 1, X,..., X n i.i.d z rozkładu P θ, θ- nieznany parametr Postępowanie: Porównujemy kwantyle teoretyczne (są funkcjami nieznanych parametrów) z ich odpowiednikami z próby i z otrzymanych równań wyznaczamy parametry. θ R (jednowymiarowa przestrzeń parametrów), rozwiąż (niewiadomą jest θ): q 1 (θ) = Q 1 θ = (θ 1, θ ), rozwiąż układ (niewiadomą jest θ): F θ (Q 1 ) = 1 lub układ równoważny: q 1 (θ) = Q i q 3 (θ) = Q F θ (Q 1 4 ) = 1 4 i F θ (Q 3 4 ) = 3 4 θ = (θ 1, θ, θ 3 ). Otrzymujemy układ: F θ (Q 1 4 ) = 1 4 i F θ (Q 1 ) = 1 i F θ (Q 3 4 ) = 3 4 θ = (θ 1, θ, θ 3, θ 4 ). Rozważamy kwantyle rzędu 1 8, 3 8, 5 8 i 7 8.
47 Agata Boratyńska Wykłady ze statystyki matematycznej 47 Przykład 1. X 1, X,..., X n i.i.d, X i Ex(θ), θ > 0 EMK(θ) =? ( ) ( ) 1 F θ q 1 = 1 exp θq 1 = q 1 Rozwiązujemy równanie: 1 θ ln 1 = Q 1 = 1 θ ln 1 stąd EMK(θ) = ˆθ(X) = 1 Q 1 ln 1
48 Agata Boratyńska Wykłady ze statystyki matematycznej 48 Przykład. Niech X 1, X,..., X n i.i.d z rozkładu W eibull(c, τ), EMK(c) =? i EMK(τ) =? Dystrybuanta w rozkładzie Weibulla ma postać: F c,τ (x) = 1 exp ( cx τ ) x > 0 Otrzymujemy układ: Stąd Estymatory mają postać: 1 e cqτ 1 4 = e cqτ 3 4 = 3 4 { ln 0.75 = cq τ 1 4 ln 0.5 = cq τ 3 4 Q 1 4 Q 3 4 τ ˆτ = log Q 14 Q 34 = ln 0.75 ln 0.5. ( ) ln 0.75 ln 0.5 ĉ = ln 0.75 Qˆτ 1 4
49 Agata Boratyńska Wykłady ze statystyki matematycznej 49 ENW (estymacja metodą największej wiarogodności) Niech X 1, X,..., X n i.i.d. z rozkładu o gęstości f θ (x), gdzie θ jest nieznanym parametrem. Funkcją wiarogodności nazywamy funkcję zmiennej θ równą L(θ, x) = f θ (x 1 )f θ (x )... f θ (x n ) gdzie x = (x 1, x,..., x n ) jest próbką zaobserwowanych wartości zmiennych X 1, X,..., X n Estymatorem największej wiarogodności parametru θ (EN W (θ)) nazywamy argument maksimum funkcji L ENW (θ) = arg max L(θ, x). θ PRZYKŁAD 1. X bin(n, θ), wyznacz ENW (θ). Rozwiązanie L(θ, x) θ ( ) n L(θ, x) = θ x (1 θ) n x x ( ) n = θ x 1 (1 θ) n x 1 (x nθ) = 0 x ENW (θ) = X n ENW, przydatne związki 1. arg max θ L(θ, x) = arg max θ ln L(θ, x) (zamiast wyznaczać argument max funkcji L można wyznaczać argument max funkcji l(θ) = ln L(θ)). ENW (g(θ)) = g(enw (θ))
50 Agata Boratyńska Wykłady ze statystyki matematycznej Jeżeli θ = (θ 1,..., θ k ) jest parametrem ciągłym i L jest funkcją różniczkowalną, to ENW wyznaczamy rozwiązując układ równań: lub równoważny układ: L(θ, x) θ j = 0, j = 1,,..., k ln L(θ, x) θ j = 0, j = 1,,..., k. PRZYKŁAD. X 1, X,..., X n i.i.d Ex(θ), θ > 0. Wyznacz ENW (θ) Rozwiązanie Funkcja wiarogodności Pochodna ln L(θ,x) θ ( ) n L(θ, x) = θ n exp θ x i i=1 n ln L = n ln θ θ x i i=1 = n θ n i=1 x i Rozwiązujemy równanie n n θ x i = 0 i=1 ENW (θ) = 1 X PRZYKŁAD 3. X 1, X,..., X n i.i.d N(µ, σ). Wyznacz ENW (µ) i ENW (σ ). Rozwiązanie Niech v = σ. L(µ, v) = ( ) n 1 exp ( 1 πv v ) n (x i µ) i=1
51 Agata Boratyńska Wykłady ze statystyki matematycznej 51 ln L = n ln(π) n ln v 1 v Po obliczeniu pochodnych cząstkowych otrzymujemy układ { 1 ni=1 (x v i µ) = 0 n + 1 ni=1 (x v v i µ) = 0 n (x i µ) i=1 Stąd ENW (µ) = X ENW (σ ) = Ŝ = 1 n ni=1 ( Xi X ). PRZYKŁAD 4. Dane:
52 Agata Boratyńska Wykłady ze statystyki matematycznej 5 Wartości estymatorów ROZKŁAD WYKŁADNICZY EMM 0, ENW 0, ROZKŁAD PARETO EMM theta,48984 lambda 4458,4 ENW theta 1,90145 lambda 691,39 ROZKŁAD WEIBULLA EMK tau 0, c 0,0033 ENW tau 0,71316 c 0, ROZKŁAD GAMMA EMM alpha 0, beta 0, ENW alpha 0,65739 beta 0,00009 ROZKŁAD LOGARYTMICZNO-NORMALNY ENW 7,0464 1,4001 Wykresy gęstości 0,001 0,0008 0,0006 0,0004 histogram wykladniczy Pareto Weibulla Gamma Lognormal 0,
53 Agata Boratyńska Wykłady ze statystyki matematycznej 53 WŁASNOŚCI ESTYMATORÓW, PORÓWNYWANIE ESTYMATORÓW CEL: Badanie jakości estymatora. Czy przybliża szukaną wielkość? Czym jest błąd przybliżenia, jak go mierzyć? Badane własności: własności - ustalona liczebność próby: obciążenie ryzyko (błąd średniokwadratowy) wariancja efektywność Własności asymptotyczne: zgodność asymptotyczna normalność asymptotyczna efektywność
54 Agata Boratyńska Wykłady ze statystyki matematycznej 54 X = (X 1, X,..., X n ) - obserwowana zmienna losowa P θ - rozkład zmiennej X, θ -nieznany parametr ˆθ - estymator θ, ĝ - estymator funkcji g(θ) 1. Obciążenie estymatora Obciążenie estymatora parametru θ: B θ (ˆθ) = E θ ˆθ(X) θ Obciążenie estymatora funkcji g(θ): B θ (ĝ) = E θ ĝ(x) g(θ) Estymator ˆθ ( ĝ) jest estymatorem nieobciążonym θ Θ E θ ˆθ(X) = θ (Eθ ĝ(x) = g(θ)) PRZYKŁADY: X 1, X,..., X n i.i.d z rozkładu o nieznanej dystrybuancie F i nieznanych EX i = µ i V arx i = σ F n - dystrybuanta empiryczna (estymator F ) X - estymator µ S, Ŝ - estymatory σ
55 Agata Boratyńska Wykłady ze statystyki matematycznej 55 Badamy obciążenie: EF n (t) = F (t) = F n (t) estymator nieobciążony dystrybuanty F (t) E X = 1 n n E X i = 1 n nex 1 = µ = X - estymator nieobciążony wartości oczekiwanej i=1 ES = 1 ( n ) n 1 E (X i X) i=1 = 1 ( n ) n 1 E Xi n X = n i=1 n 1 EX 1 ES = n ( ( )) σ σ + µ n 1 n + µ = S jest estymatorem nieobciążonym wariancji = Ŝ - estymator obciążony ( n 1 EŜ = E n S ) = n 1 n σ B(Ŝ ) = n 1 n σ σ = 1 n σ n n 1 E X = σ Mówimy, że estymator jest asymptotycznie nieobciążony gdy θ Θ B(Ŝ ) = 1 n σ 0 gdy n + = lim B θ(ˆθ) = 0 n + Ŝ - estymator asymptotycznie nieobciążony
56 Agata Boratyńska Wykłady ze statystyki matematycznej 56. Ryzyko estymatora (błąd średniokwadratowy) Funkcję R(θ, ĝ) = E θ (ĝ(x) g(θ)) nazywamy ryzykiem estymatora ĝ przy kwadratowej funkcji straty lub błędem średniokwadratowym. Zachodzi R(θ, ĝ) = E θ (ĝ(x) g(θ)) = B θ(ĝ) + V ar θ (ĝ) Mówimy, że estymator ĝ 1 jest lepszy niż ĝ θ R(θ, ĝ 1 ) R(θ, ĝ ) i θ 0 R(θ 0, ĝ 1 ) < R(θ 0, ĝ ). Jeżeli ĝ jest estymatorem nieobciążonym funkcji g(θ), tzn. E θ (ĝ) = g(θ) dla każdego θ Θ, to R(θ, ĝ) = V ar θ (ĝ). WNIOSEK: Przy estymatorach nieobciażonych miernikiem jakości estymatora jest jego wariancja.
57 Agata Boratyńska Wykłady ze statystyki matematycznej 57 PRZYKŁAD 1. X 1, X,..., X n i.i.d P oiss(θ), θ > 0. Wyznacz ENW (θ) i oblicz jego ryzyko Rozwiązanie: L(θ, x) = e nθ θ x i xi! ln L(θ, x) = nθ + x i ln θ ln x i! ln L(θ, x) θ ENW (θ) = ˆθ = E θ X = θ = ˆθ estymator nieobciążony PRZYKŁAD. = n + Xi n xi R(θ, ˆθ) = V ar θ ˆθ = θ n X 1, X,..., X n i.i.d N(µ, σ ), oba parametry nieznane. Porównamy ryzyka estymatorów wariancji S i Ŝ θ = X R(µ, σ, S ) = V ar µ,σ S σ 4 ( ni=1 = (n 1) V ar (X i X) ) µ,σ σ = σ 4 σ4 (n 1) = (n 1) (n 1) Zatem R(µ, σ, Ŝ ) = V ar µ,σ Ŝ + B µ,σ(ŝ ) ( ) ( ) n 1 1 = V ar µ,σ n S + n σ ( ) n 1 σ 4 = n (n 1) + σ4 n = n 1 σ 4 n µ, σ R(µ, σ, Ŝ ) < R(µ, σ, S )
58 Agata Boratyńska Wykłady ze statystyki matematycznej 58 PRZYKŁAD 3. Model: X 1, X,..., X n i.i.d z rozkładu o nieznanej dystrybuancie F i nieznanych EX i = µ i V arx i = σ. Estymatory parametru µ: ˆµ 1 = X = 1 n X i n i=1 ˆµ = X 1 ˆµ 3 = Obciążenie: Ryzyko B µ ( X) = 0 B µ (ˆµ ) = 0 B µ (ˆµ 3 ) = µ R(µ, ˆµ 1 ) = V ar µ ( X) = σ n R(µ, ˆµ ) = V ar µ X 1 = σ > R(µ, ˆµ 1 ) R(µ, ˆµ 3 ) = V ar µ () + ( µ) = ( µ) R(µ, ˆµ 3 ) nieporównywalne z ryzykami pozostałych estymatorów bez znajomości parametrów UWAGI: Nie każde dwa estymatory danego parametru można porównać (porównaj przykład 3). Można ograniczac porównywanie estymatorów do pewnych klas estymatorów sensownych (np. nieobciążonych) Porównywanie ryzyka estymatorów nieobciążonych sprowadza się do porównywania wariancji i pozwala wyznaczać w pewnych modelach estymatory nieobciążone o minimalnej wariancji.
59 Agata Boratyńska Wykłady ze statystyki matematycznej 59 Statystyka ĝ jest estymatorem nieobciążonym o minimalnej wariancji (ENMW) parametru g(θ) ĝ jest estymatorem nieobciążonym dla każdego nieobciążonego estymatora ĝ mamy θ V ar θ (ĝ) V ar θ (ĝ )
60 Agata Boratyńska Wykłady ze statystyki matematycznej 60 INFORMACJA FISHERA X = (X 1, X,..., X n ) - obserwowana zmienna losowa p θ (x) - gęstość rozkładu zmiennej X Założenia: Θ jest przedziałem otwartym Nośnik rozkładu {x : p θ (x) > 0} nie zależy od θ Istnieje pochodna ln p θ(x) θ. Informacją Fishera nazywamy funkcję I n (θ) = X x ( ) ln pθ (X) I n (θ) = E θ θ ( pθ (x) θ p θ (x) ( Pθ (x) θ P θ (x) ) p θ (x)dx dla zmiennej ciągłej ) P θ (x) dla zmiennej dyskretnej PRZYKŁAD 1. X bin(n, θ), wyznacz Informację Fishera. Rozwiązanie: ( ) n p θ (x) = P θ (X = x) = θ x (1 θ) n x x ( ) n ln P θ (X = x) = ln + x ln θ + (n x) ln(1 θ) x ln p θ (x) θ = x θ n x 1 θ = x nθ θ(1 θ) ) = I(θ) = E θ ( X nθ θ(1 θ) n θ(1 θ)
61 Agata Boratyńska Wykłady ze statystyki matematycznej 61 Informacja Fishera, własności Interpretacja: jak wiele może powiedzieć próba wielkości n o wartości nieznanego parametru θ. Jeżeli p θ (x) jest dwukrotnie różniczkowalną funkcją zmiennej θ, to ( ) ln p θ (X) I n (θ) = E θ. θ Jeżeli X 1, X,..., X n i.i.d. z rozkładu o gęstości p θ (x), to I n (θ) = ni 1 (θ), gdzie I 1 (θ) jest informacją Fishera w oparciu o zmienną X 1. PRZYKŁAD. X = (X 1, X,..., X n ), X i Ex(θ) i są niezależne, θ > 0 ln p θ (x) θ p θ (x) = θe θx ln p θ (x) = ln θ θx = 1 θ x ln p θ (x) θ = 1 θ I n (θ) = ni 1 (θ) = ne θ ( 1 θ ) = n θ NIERÓWNOŚĆ INFORMACYJNA, dolne ograniczenie na wariancję estymatorów nieobciążonych Nie da się dowolnie zmniejszać wariancji estymatorów przy ustalonej wielkości próby Istnieje dolne ograniczenie na wariancję estymatorów nieobciążonych.
62 Agata Boratyńska Wykłady ze statystyki matematycznej 6 Twierdzenie - NIERÓWNOŚĆ INFORMACYJNA Przy pewnych warunkach regularności, jeżeli ĝ jest estymatorem nieobciążonym funkcji różniczkowalnej g(θ), to θ Θ V ar θ ĝ (g (θ)) I n (θ). Efektywnością bezwzględną estymatora ĝ(x 1, X,..., X n ) funkcji różniczkowalnej g(θ) nazywamy (g (θ)) eff θ (ĝ(x 1, X,..., X n ) = I n (θ)v ar θ (ĝ) Wielkość (g (θ)) I n(θ) PRZYKŁAD nazywamy dolnym ograniczeniem Cramera-Rao X 1, X,..., X n i.i.d P oiss(θ), θ > 0 ENW (θ) = X i V ar θ X = θ n Wyznaczymy dolne ograniczenie Cramera Rao θ θx P θ (x) = e x! ln P θ (x) = θ + x ln θ ln x! ( ) I n (θ) = ni 1 (θ) = ne ln Pθ (X) θ θ ln P θ (X) θ = 1 + x θ Dolne ograniczenie Cramera Rao ( ) X θ I n (θ) = ne θ = n 1 θ θ E θ(x θ) = n θ (g (θ)) I n (θ) = 1 I n (θ) = θ n = V ar θ X = X = ENMW (θ)
63 Agata Boratyńska Wykłady ze statystyki matematycznej 63 WŁASNOŚCI ASYMPTOTYCZNE 3. Zgodność estymatora ĝ(x 1, X,..., X n ) = ĝ n funkcji g(θ) dla każdego ε > 0 i θ Θ lim P θ ( ĝ n g(θ) > ε) = 0 n + Narzędzia do badania zgodności: Prawa Wielkich Liczb Nierówność Czebyszewa = Estymator nieobciążony, którego wariancja przy n dążącym do nieskończoności dąży do 0 jest zgodny zgodność ENW (poniżej) 4. Asymptotyczna normalność ĝ(x 1, X,..., X n ) Estymator ĝ(x 1, X,..., X n ) jest asymptotycznie normalny istnieje σ(θ) > 0 takie, że dla każdego z ) (ĝn lim P g(θ) θ n < z = Φ(z) n + σ(θ) gdzie Φ jest dystrybuantą rozkładu normalnego N(0, 1) ( ) ĝ n N g(θ), σ (θ) przy dużym n ĝ n g(θ) n N(0, 1) przy n + σ(θ) Wielkość σ (θ) nazywamy wariancją asymptotyczną. Narzędzia do badania asymptotycznej normalności: CTG Lemat Delta (poniżej) asymptotyczna normalność ENW (poniżej) n
64 Agata Boratyńska Wykłady ze statystyki matematycznej 64 PRZYKŁADY X 1, X,..., X n i.i.d z rozkładu dystrybuancie F i EX i = µ i V arx i = σ 1. Z praw wielkich liczb wynika X µ przy n +. Z CTG wynika S σ przy n + F n (t) F (t) przy n + X µ n N(0, 1) przy n + σ F n (t) F (t) n N(0, 1) przy n + F (t)(1 F (t)) 3. Niech ˆQ p = X [np]:n. Jeżeli funkcja gęstosci f θ jest ciągła i spełnia f θ (q p ) 0, to ( ˆQ p q p ) n N ( 0, ) p(1 p) fθ (q p) przy n + 4. Estymator nieobciążony nie musi być zgodny PRZYKŁAD: EX 1 = µ = X 1 estymator nieobciążony parametru µ, ale X 1 nie jest zgodny
65 Agata Boratyńska Wykłady ze statystyki matematycznej 65 Lemat DELTA Jeżeli ciąg Z n rzeczywistych zmiennych losowych spełnia (Z n θ) n N(0, σ ) dla pewnego σ i g(θ) jest różniczkowalną funkcją θ i g (θ) 0, to (g(z n ) g(θ)) n N(0, [g (θ)] σ ). PRZYKŁAD 1. X 1, X,..., X n i.i.d., EX i = µ i V arx i = σ X - estymator parametru µ Z CTG Niech Z lematu DELTA ( X µ) n N(0, σ ) przy n + g(µ) = µ ( X µ ) n N ( 0, 4σ µ ) PRZYKŁAD. X 1, X,..., X n i.i.d. Ex(θ), θ > 0, E θ X = 1 θ, V ar θx = 1 θ ENW (θ) = 1 X Z CTG Niech ( X 1 θ ) n N (0, 1 ) θ g(t) = 1 t przy n + wtedy g (t) = 1 t = g( X) = 1 X, g( 1 ( ) 1 θ ) = θ, g = θ θ Z lematu DELTA ( 1 X θ ) n N (0, 1θ θ4 )
66 Agata Boratyńska Wykłady ze statystyki matematycznej 66 ASYMPTOTYCZNA ZGODNOŚĆ I NORMALNOŚĆ ENW 1. Niech X 1, X,..., X n,... będą i.i.d z rozkładu o gęstości f θ, gdzie θ jest nieznanym parametrem. Niech gęstości f θ mają wspólny nośnik i przestrzeń Θ będzie przedziałem otwartym. Jeżeli układ równań Σ n ln L(θ, X i ) i=1 θ ma dokładnie jedno rozwiązanie, to jest ono ENW (θ) i jest to estymator zgodny.. Jeżeli dodatkowo istnieje 3 ln L(θ,x 1,...,x n), i spełnione są założenia umożliwiające zamianę θ 3 kolejności operacji różniczkowania po lub i całkowania... dx i I(θ) > 0 jest θ θ określona, to ˆθ n = ˆθ(X 1, X,..., X n ) = ENW (θ) jest asymptotycznie normalny i (ˆθ n θ) n N ( 0, ) 1 I 1 (θ) = 0 przy n (Z Lematu DELTA) Przy powyższych założeniach jeżeli g jest różniczkowalna i g (θ) 0 i ˆθ n = ENW (θ), to (g(ˆθ n ) g(θ)) n N(0, [g (θ)] I 1 (θ)).
67 Agata Boratyńska Wykłady ze statystyki matematycznej 67 EFEKTYWNOŚĆ ESTYMATORÓW X = (X 1, X,..., X n )-obserwowana zmienna losowa o rozkładzie zależnym od parametru θ Zadanie: estymacja parametru g(θ) 1. ĝ(x) estymator nieobciążony parametru g(θ) i spełnione założenia jak przy nierówności informacyjnej Efektywnością bezwzględną estymatora ĝ(x) nazywamy funkcję eff θ (ĝ(x)) = (g (θ)) I n (θ)v ar θ (ĝ(x)) = jeżeli eff θ (ĝ(x)) = 1, to ĝ(x) = ENMW (g(θ)) Niech ĝ 1 (X), ĝ (X) będą dwoma estymatorami nieobciążonymi parametru g(θ). Efektywnością względną estymatora ĝ 1 (X) względem ĝ (X) nazywamy funkcję ef θ (ĝ 1 (X), ĝ (X)) = V ar θ(ĝ ) V ar(ĝ 1 ) Jeżeli ef θ (ĝ 1 (X), ĝ (X)) > 1, to estymator ĝ 1 jest lepszy (w sensie błędu sredniokwadratowego) niż estymator ĝ. PRZYKŁAD. X 1, X,..., X n i.i.d z rozkładu EX i = θ i V arx i = σ (θ), n > 1 Estymatory parametru θ: ˆθ 1 = X 1 ˆθ = X WNIOSEK: ˆθ lepszy niż ˆθ 1 V ar θ (ˆθ 1 ) = σ (θ) V ar θ (ˆθ ) = σ (θ) n ef(ˆθ 1, ˆθ ) = V ar θ(ˆθ ) V ar θ (ˆθ 1 ) = n > 1
68 Agata Boratyńska Wykłady ze statystyki matematycznej 68. X 1, X,..., X n,...-ciąg i.i.d. o rozkładzie zależnym od parametru θ Zadanie: estymacja parametru g(θ), ĝ n estymator parametru g(θ) w oparciu o próbę X 1, X,..., X n, asymptotycznie normalny o wariancji asymptotycznej σ (θ) Estymator ĝ n jest estymatorem asymptotycznie efektywnym parametru g(θ) jeżeli jest σ (θ) = [g (θ)] I 1 1 (θ) (oczywiście musi istnieć I 1 (θ) i g funkcja różniczkowalna) Estymatory największej wiarogodności są asymptotycznie efektywne Jeśli ĝ 1 i ĝ są dwoma estymatorami asymptotycznie normalnymi funkcji g(θ) o wariancjach asymptotycznych odpowiednio równych σ 1(θ) i σ (θ), to asymptotyczną efektywnością względną nazywamy stosunek as.ef(ĝ 1, ĝ ) = σ (θ) σ 1(θ).
69 Agata Boratyńska Wykłady ze statystyki matematycznej 69 PRZYKŁAD. X 1, X,..., X n i.i.d P oiss(θ), θ > 0 Chcemy estymować funkcję g(θ) = e θ = P θ (X 1 = 0) Znamy: ENW (θ) = ENMW (θ) = X, V ar θ X = θ n, Rozważamy dwa estymatory: ĝ 1 = e X ĝ = liczba X i, takich że X i = 0 n = 1 n 1(X i = 0) n i=1 Rozkłady asymptotyczne Wiemy I 1 (θ) = 1 θ ( X θ) n N(0, θ) Niech h(t) = e t, wtedy h (t) = e t i z lematu DELTA ( e X e θ) n N ( 0, θe θ ) Niech Wtedy oraz Y i = { 1 gdy Xi = 0 0 w pp E θ Y i = e θ i V ar θ Y i = e θ (1 e θ ) ĝ = 1 n 1(X i = 0) = 1 n i=1 n n Y i i=1 Z CTG (ĝ e θ) n N ( 0, e θ (1 e θ ) ) Porównujemy wariancje asymptotyczne θ > 0 e θ (1 e θ ) > θe θ = as.ef(ĝ 1, ĝ ) > 1 Estymator ĝ 1 jest bardziej efektywny niż estymator ĝ.
70 Agata Boratyńska Wykłady ze statystyki matematycznej 70 PRZYKŁAD. Ostrożny statystyk - Średnia czy mediana X 1, X,..., X n i.i.d. z rozkładu symetrycznego, estymujemy medianę µ Dwa estymatory: średnia ˆµ 1 = X i mediana z próby ˆµ = X [n/]:n Dodatkowe założenie: próba z rozkładu normalnego = as.ef(x [n/]:n, X) = π < 1 Dodatkowe założenie: próba z rozkładu Laplace a o gęstości p µ,θ (x) = θ exp ( θ x µ ) = as.ef(x [n/]:n, X) = > 1 A co gdy próba pochodzi z rozkładu Cauchy ego?
71 Agata Boratyńska Wykłady ze statystyki matematycznej 71 ESTYMACJA PRZEDZIAŁOWA, PRZEDZIAŁY UFNOŚCI X 1, X,..., X n - próbka losowa z rozkładu z nieznanym parametrem θ Przedziałem ufności dla parametru θ na poziomie ufności 1 α nazywamy przedział [θ(x 1, X,..., X n ), θ(x 1, X,..., X n )], którego końce są statystykami (funkcjami obserwowanej zmiennej losowej) i który spełnia warunek θ P θ ( θ(x1, X,..., X n ) θ θ(x 1, X,..., X n ) ) 1 α. Przykład, symulacje Przedstawmy 0 przedziałów ufności dla 0 wysymulowancyh 5- elementowych próbek z rozkładu normalnego o wartości oczekiwanej 10 (0 oznacza, że prawdziwa wartość parametru nie należy do otrzymanego przedziału) [9.7979; ] 1 [9.7649; ] 1 [9.5838; ] 1 [9.5760; ] 1 [9.78; ] 1 [9.5948; ] 1 [9.573; ] 1 [9.9565; ] 1 [9.6501; ] 1 [9.785; ] 1 [9.4447; ] 1 [9.641; ] 1 [9.343; ] 1 [9.7749; ] 1 [9.6356; ] 1 [9.6361; ] 1 [9.4945; ] 1 [10.063; ] 0 [9.7108; ] 1 [9.973; ] 1 Przedział ufności, interpretacja α - mała liczba np. 0,1, 0,05, 0,01. Warunek P θ (θ [θ, θ]) = 1 α należy rozumieć tak: losowy przedział [θ, θ] pokrywa nieznaną liczbę θ z dużym prawdopodobieństwem. Pojęcie przedziału ufności precyzuje ideę estymacji z określoną dokładnością. Zamiast pojedynczego oszacowania nieznanego parametru, podajemy dolną i górną
72 Agata Boratyńska Wykłady ze statystyki matematycznej 7 granicę oszacowania. Nie możemy gwarantować, że parametr leży na pewno między tymi granicami, ale możemy wymagać by tak było z odpowiednio dużym prawdopodobieństwem. Przedział ufności zależy od rozkładu prawdopodobieństwa w modelu Przedział ufności, konstrukcja Szukamy zmiennych losowych zależnych od próby i funkcji parametrów, których rozkłady nie zależą od wartości nieznanych parametrów tzw. funkcji centralnych. Niech U = U(X 1, X,..., X n ) funkcja centralna, szukamy przedziału ufności postaci [a, b] t.że P (a < U < b) = 1 α Przekształcamy nierówność a < U < b otrzymując przedział dla parametru Przedziały ufności - rozważane modele Model I (rozkład normalny, wariancja znana): przedział ufności dla wartości oczekiwanej, Model II (rozkład normalny, wariancja nieznana): przedział ufności dla wartości oczekiwanej, Model II (rozkład normalny, wariancja nieznana): przedział ufności dla wariancji Model III (postać funkcyjna rozkładu nieznana, skończona wartość oczekiwana i wariancja, przedział asymptotyczny): przedział ufności dla wartości oczekiwanej Model IV (rozkład dwumianowy, przedział asymptotyczny): przedział ufności dla odsetka Model asymptotyczny: przedział ufności dla parametru oparty o ENW
73 Agata Boratyńska Wykłady ze statystyki matematycznej 73 Model I. X 1, X,..., X n i.i.d. z rozkładu N(µ, σ ), µ R nieznane, σ > 0 znane. ENW (µ) = EMM(µ) = X - estymator punktowy X N(µ, σ U = X µ σ n ) n N(0, 1), U - funkcja centralna szukamy z, tak aby P ( z = u 1 α - kwantyl rzędu 1 α ) X µ n z = 1 α σ w rozkładzie normalnym N(0, 1) Rozwiążmy nierówność (wyznaczamy µ) X µ n u 1 α σ Otrzymujemy Zatem P ( X u 1 α X u 1 α σ n µ X + u 1 α σ n µ X + u 1 α σ n σ n ) = 1 α Przedział [ X u 1 α σ n, X + u 1 α ] σ n jest przedziałem ufności dla parametru µ na poziomie ufności 1 α. Własności przedziału ufności: d - długość przedziału ufności σ d = u 1 α n d nazywamy błędem oszacowania 1 α rośnie = d rośnie
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 4 1 / 23 ZAGADNIENIE ESTYMACJI Zagadnienie
Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.
1 Agata Boratyńska WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne. Agata Boratyńska Wykłady ze statystyki 2 Literatura J. Koronacki i J. Mielniczuk Statystyka WNT 2004
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 2 1 / 20 MIARY ROZPROSZENIA, Wariancja Wariancją z próby losowej X
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 1 1 / 33 Warunki zaliczenia 1 Ćwiczenia OBOWIĄZKOWE (max. 3 nieobecności) 2 Zaliczenie
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 3 1 / 8 ZADANIE z rachunku
Agata Boratyńska. WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 2014
1 Agata Boratyńska WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Warszawa 2014 Agata Boratyńska Wykłady ze statystyki matematycznej 2 Literatura W. Niemiro Rachunek prawdopodobieństwa i statystyka matematyczna,
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład I, 22.02.2016 STATYSTYKA OPISOWA, cz. I Kwestie techniczne Kontakt: ajanicka@wne.uw.edu.pl Dyżur: strona z materiałami z przedmiotu: wne.uw.edu.pl/azylicz akson.sgh.waw.pl/~aborata
1 Podstawy rachunku prawdopodobieństwa
1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 13 i 14 1 / 15 MODEL BAYESOWSKI, przykład wstępny Statystyka
1.1 Wstęp Literatura... 1
Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Estymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
Wykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 19 października 2016r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Wykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 18 października 2017r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Estymacja parametrów rozkładu cechy
Estymacja parametrów rozkładu cechy Estymujemy parametr θ rozkładu cechy X Próba: X 1, X 2,..., X n Estymator punktowy jest funkcją próby ˆθ = ˆθX 1, X 2,..., X n przybliżającą wartość parametru θ Przedział
Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy
Wykład Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy Zbiorowość statystyczna - zbiór elementów lub wyników jakiegoś procesu powiązanych ze sobą logicznie (tzn. posiadających wspólne cechy
Statystyka matematyczna. Wykład III. Estymacja przedziałowa
Statystyka matematyczna. Wykład III. e-mail:e.kozlovski@pollub.pl Spis treści Rozkłady zmiennych losowych 1 Rozkłady zmiennych losowych Rozkład χ 2 Rozkład t-studenta Rozkład Fischera 2 Przedziały ufności
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe
O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE
Ryszard Zieliński, IMPAN Warszawa O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE XXXIX Ogólnopolska Konferencja Zastosowań Matematyki Zakopane-Kościelisko 7-14 września 2010 r Model statystyczny pomiaru: wynik pomiaru
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach
Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów
Wykład 6 Estymatory efektywne. Własności asymptotyczne estymatorów Wrocław, 30 listopada 2016r Powtórzenie z rachunku prawdopodobieństwa Zbieżność Definicja 6.1 Niech ciąg {X } n ma rozkład o dystrybuancie
METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie
METODY ESTYMACJI PUNKTOWEJ X 1,..., X n - próbka z rozkładu P θ, θ Θ, θ jest nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie P θ. Definicja. Estymatorem
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego
Rozdział 1 Statystyki Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego X = (X 1,..., X n ). Uwaga 1 Statystyka jako funkcja wektora zmiennych losowych jest zmienną losową
WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty
WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty Agata Boratyńska Agata Boratyńska Rachunek prawdopodobieństwa, wykład 4 / 9 Przekształcenia zmiennej losowej X
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE
STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE CECHY mogą być: jakościowe nieuporządkowane - skala nominalna płeć, rasa, kolor oczu, narodowość, marka samochodu,
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 2013/2014 Wykład 3 Zmienna losowa i jej rozkłady Zdarzenia losowe Pojęcie prawdopodobieństwa
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii
Plan wykładu Statystyka opisowa Dane statystyczne miary położenia miary rozproszenia miary asymetrii Statystyka matematyczna Podstawy estymacji Testowanie hipotez statystycznych Żródła Korzystałam z ksiażek:
Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war
Wykład 5 Estymatory nieobciążone z jednostajnie minimalną wariancją Wrocław, 25 października 2017r Statystyki próbkowe - Przypomnienie Niech X = (X 1, X 2,... X n ) będzie n elementowym wektorem losowym.
Metody probabilistyczne
Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 17.01.2019 1 / 30 Zagadnienia statystki Przeprowadzamy
STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010
STATYSTYKA MATEMATYCZNA WYKŁAD 14 18 stycznia 2010 Model statystyczny ROZKŁAD DWUMIANOWY ( ) {0, 1,, n}, {P θ, θ (0, 1)}, n ustalone P θ {K = k} = ( ) n θ k (1 θ) n k, k k = 0, 1,, n Geneza: Rozkład Bernoulliego
Prawdopodobieństwo i statystyka
Wykład II: Zmienne losowe i charakterystyki ich rozkładów 13 października 2014 Zmienne losowe Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Definicja zmiennej losowej i jej
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009
STATYSTYKA MATEMATYCZNA WYKŁAD 10 14 grudnia 2009 PARAMETRY POŁOŻENIA Przypomnienie: Model statystyczny pomiaru: wynik pomiaru X = µ + ε 1. ε jest zmienną losową 2. E(ε) = 0 pomiar nieobciążony, pomiar
Statystyka opisowa. Wykład I. Elementy statystyki opisowej
Statystyka opisowa. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Elementy statystyku opisowej 1 Elementy statystyku opisowej 2 3 Elementy statystyku opisowej Definicja Statystyka jest to nauka o
Rozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
Agata Boratyńska Statystyka aktuarialna... 1
Agata Boratyńska Statystyka aktuarialna... 1 ZADANIA NA ĆWICZENIA Z TEORII WIAROGODNOŚCI Zad. 1. Niech X 1, X 2,..., X n będą niezależnymi zmiennymi losowymi z rozkładu wykładniczego o wartości oczekiwanej
WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.
Tematy: WSTĘP 1. Wprowadzenie do przedmiotu. Próbkowe odpowiedniki wielkości populacyjnych. Modele statystyczne i przykładowe zadania wnioskowania statystycznego. Statystyki i ich rozkłady. 2. Estymacja
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na
Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony zbiór jednostek, które
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski
Literatura STATYSTYKA OPISOWA A. Aczel, Statystyka w Zarządzaniu, PWN, 2000 A. Obecny, Statystyka opisowa w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2002. A. Obecny, Statystyka matematyczna w Excelu
Statystyka w przykładach
w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie
WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa
WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa Agata Boratyńska Agata Boratyńska Rachunek prawdopodobieństwa, wykład 2 i 3 1 / 19 Zmienna losowa Definicja Dana jest przestrzeń probabilistyczna
Pozyskiwanie wiedzy z danych
Pozyskiwanie wiedzy z danych dr Agnieszka Goroncy Wydział Matematyki i Informatyki UMK PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO Pozyskiwanie wiedzy
Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012
Wykład 2 Wrocław, 11 października 2012 Próba losowa Definicja. Zmienne losowe X 1, X 2,..., X n nazywamy próba losową rozmiaru n z rozkładu o gęstości f (x) (o dystrybuancie F (x)) jeśli X 1, X 2,...,
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Statystyczna analiza danych
Statystyczna analiza danych Marek Ptak 21 października 2013 Marek Ptak Statystyka 21 października 2013 1 / 70 Część I Wstęp Marek Ptak Statystyka 21 października 2013 2 / 70 LITERATURA A. Łomnicki, Wprowadzenie
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014
Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu
Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),
Statystyka zbiór przetworzonych i zsyntetyzowanych danych liczbowych, nauka o ilościowych metodach badania zjawisk masowych, zmienna losowa będąca funkcją próby. Podstawowe pojęcia: populacja (zbiorowość
Statystyka i eksploracja danych
Wykład II: i charakterystyki ich rozkładów 24 lutego 2014 Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa,
Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.
Prawdopodobieństwo i statystyka 3..00 r. Zadanie Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX 4 i EY 6. Rozważamy zmienną losową Z. X + Y Wtedy (A) EZ 0,
STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;
STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych; - badanie skuteczności nowego leku; - badanie stopnia zanieczyszczenia gleb metalami
Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014
Metoda momentów i kwantyli próbkowych Wrocław, 7 listopada 2014 Metoda momentów Momenty zmiennych losowych X 1, X 2,..., X n - próba losowa. Momenty zmiennych losowych X 1, X 2,..., X n - próba losowa.
Próba własności i parametry
Próba własności i parametry Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony
Przedmiot statystyki. Graficzne przedstawienie danych.
Przedmiot statystyki. Graficzne przedstawienie danych. dr Mariusz Grządziel 2 marca 2009 Populacja i próba Populacja- zbiorowość skończona lub nieskończona, w stosunku do której mają być formułowane wnioski.
Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych
Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Niech Ω będzie przestrzenią zdarzeń elementarnych. Definicja 1 Rodzinę S zdarzeń losowych (zbiór S podzbiorów zbioru
1.1 Statystyka matematyczna Literatura Model statystyczny Preliminaria... 3
Spis treści Spis treści 1 Wstęp 1 1.1 Statystyka matematyczna...................... 1 1.2 Literatura.............................. 1 1.3 Model statystyczny......................... 2 1.4 Preliminaria.............................
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.
Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. D A R I U S Z P I W C Z Y Ń S K I 2 2 ROZKŁAD ZMIENNEJ LOSOWEJ Polega na przyporządkowaniu
Wykład 10 Testy jednorodności rozkładów
Wykład 10 Testy jednorodności rozkładów Wrocław, 16 maja 2018 Test Znaków test jednorodności rozkładów nieparametryczny odpowiednik testu t-studenta dla prób zależnych brak normalności rozkładów Test Znaków
Na podstawie dokonanych obserwacji:
PODSTAWOWE PROBLEMY STATYSTYKI MATEMATYCZNEJ Niech mamy próbkę X 1,..., X n oraz przestrzeń prób X n, i niech {X i } to niezależne zmienne losowe o tym samym rozkładzie P θ P. Na podstawie obserwacji chcemy
Wykład 7 Testowanie zgodności z rozkładem normalnym
Wykład 7 Testowanie zgodności z rozkładem normalnym Wrocław, 05 kwietnia 2017 Rozkład normalny Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie normalnym określonym przez dystrybuantę
STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa
STATYSTYKA MATEMATYCZNA rachunek prawdopodobieństwa treść Zdarzenia losowe pojęcie prawdopodobieństwa prawo wielkich liczb zmienne losowe rozkłady teoretyczne zmiennych losowych Zanim zajmiemy się wnioskowaniem
Dokładne i graniczne rozkłady statystyk z próby
Dokładne i graniczne rozkłady statystyk z próby Przypomnijmy Populacja Próba Wielkość N n Średnia Wariancja Odchylenie standardowe 4.2 Rozkład statystyki Mówimy, że rozkład statystyki (1) jest dokładny,
Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41
Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
2.Wstępna analiza danych c.d.- wykład z 5.03.2006 Populacja i próba
2.Wstępna analiza danych c.d.- wykład z 5.03.2006 Populacja i próba Populacja- zbiorowość skończona lub nieskończona, w stosunku do której mają być formułowane wnioski. Próba- skończony podzbiór populacji
Biostatystyka, # 3 /Weterynaria I/
Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl
LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.
LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja
Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła
12.03.2017 Wydział Inżynierii Produkcji I Logistyki Statystyka opisowa Wykład 3 Dr inż. Adam Deptuła METODY OPISU DANYCH ILOŚCIOWYCH SKALARNYCH Wykresy: diagramy, histogramy, łamane częstości, wykresy
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące
O ŚREDNIEJ STATYSTYCZNEJ
Od średniej w modelu gaussowskim do kwantyli w podstawowym modelu nieparametrycznym IMPAN 1.X.2009 Rozszerzona wersja wykładu: O ŚREDNIEJ STATYSTYCZNEJ Ryszard Zieliński XII Międzynarodowe Warsztaty dla
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego
6. Zmienne losowe typu ciagłego (2.04.2007) Pole trapezu krzywoliniowego Przypomnienie: figurę ograniczoną przez: wykres funkcji y = f(x), gdzie f jest funkcją ciągłą; proste x = a, x = b, a < b, oś OX
4,5. Dyskretne zmienne losowe (17.03; 31.03)
4,5. Dyskretne zmienne losowe (17.03; 31.03) Definicja 1 Zmienna losowa nazywamy dyskretna (skokowa), jeśli zbiór jej wartości x 1, x 2,..., można ustawić w ciag. Zmienna losowa X, która przyjmuje wszystkie
Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe
Typy zmiennych Graficzne reprezentacje danych Statystyki opisowe Jakościowe charakterystyka przyjmuje kilka możliwych wartości, które definiują klasy Porządkowe: odpowiedzi na pytania w ankiecie ; nigdy,
Statystyka aktuarialna i teoria ryzyka, model indywidualny i zespołowy, rozkłady złożone
Statystyka aktuarialna i teoria ryzyka, model indywidualny i zespołowy, rozkłady złożone Agata Boratyńska SGH, Warszawa Agata Boratyńska (SGH) SAiTR wykład 3 i 4 1 / 25 MODEL RYZYKA INDYWIDUALNEGO X wielkość
Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.
Wykład 4 Rozkłady i ich dystrybuanty Dwa typy zmiennych losowych Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x, x 2,...}, to mówimy, że jest to zmienna dyskretna.
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich