Próbkowe odpowiedniki wielkości populacyjnych
|
|
- Emilia Dziedzic
- 6 lat temu
- Przeglądów:
Transkrypt
1 Część I Podstawy 11
2
3 Rozdział 1 Próbkowe odpowiedniki wielkości populacyjnych 1.1 Rozkład empiryczny Statystyka matematyczna opiera się na założeniu, że dane są wynikiem pewnego doświadczenia losowego. Przypuśćmy, że dane mają postać ciągu liczb x 1, x 2,..., x n. Zakładamy, że mamy do czynienia ze zmiennymi losowymi X 1, X 2,..., X n określonymi na przestrzeni probabilistycznej (Ω, F, P) i dane są realizacjami (wartościami) tych zmiennych losowych, czyli x 1 = X 1 (ω),..., x n = X n (ω) dla pewnego ω Ω. Nie znamy rozkładu prawdopodobieństwa P na przestrzeni Ω, który rządzi zachowaniem zmiennych losowych i chcemy się dowiedzieć czegoś o tym rozkładzie na podstawie obserwacji x 1, x 2,..., x n. Rozważmy najpierw prostą sytuację, kiedy obserwacje są realizacjami niezależnych zmiennych losowych o jednakowym rozkładzie DEFINICJA. Próbką z rozkładu prawdopodobieństwa o dystrybuancie F nazywamy ciąg niezależnych zmiennych losowych X 1, X 2,..., X n o jednakowym rozkładzie, P(X i x) = F (x) dla i = 1, 2,..., n. Będziemy używali oznaczenia X 1, X 2,..., X n iid F. W powyższej definicji dystrybuanta jest tylko pewnym sposobem opisu rozkładu prawdopodobieństwa. Mówiąc na przykład o próbce z rozkładu normalnego, napiszemy X 1,... X n iid N(µ, σ 2 ). Mówi się także, że X 1, X 2,..., X n jest próbką z rozkładu fikcyjnej zmiennej losowej X F. Uwaga. W statystycznych badaniach reprezentacyjnych stosuje się różne schematy losowania z populacji skończonej. W Definicji żądamy niezależności, zatem ta definicja nie obejmuje próbki wylosowanej bez zwracania. 13
4 14 ROZDZIAŁ 1. PRÓBKOWE ODPOWIEDNIKI WIELKOŚCI POPULACYJNYCH DEFINICJA. Niech X 1, X 1,..., X n będzie próbką z rozkładu o dystrybuancie F. Funkcję ˆF (x) = 1 n 1(X i x) n nazywamy dystrybuantą empiryczną. Gdy chcemy podkreślić, że próbka ma rozmiar n, to piszemy ˆF n zamiast ˆF. Traktujemy ˆF jako empiryczny odpowiednik nieznanej dystrybuanty F Przykład (Waga noworodków). Powiedzmy, że wylosowano 114 noworodków 1 w celu poznania cech fizycznych dzieci urodzonych w Warszawie w roku Waga noworodków była taka: Dane traktujemy jako próbkę z rozkładu prawdopodobieństwa zmiennej losowej X = waga noworodka losowo wybranego z populacji. Rysunek 1.1 przedstawia dystrybuantę empiryczną ˆF odpowiadającą tej próbce. Dystrybuanta empiryczna jest funkcją pary argumentów (x, ω), czyli ˆF : R Ω [0, 1], ale wygodnie jest pomijać argument ω. Dla ustalonego ω Ω dystrybuanta empiryczna jest funkcją R [0, 1], która argumentowi x przyporządkowuje liczbę 1(X i (ω) x)/n. Dla ustalonego a R wartość dystrybuanty empirycznej jest zmienną losową, ˆF (a) : Ω [0, 1]. Ciąg indykatorów odpowiada schematowi Bernoulliego z prawdopodobieństwem sukcesu F (a) i dlatego zmienna losowa ˆF (a) ma następujący rozkład prawdopodobieństwa: ( ) P( ˆF n (a) = k/n) = F (a) k (1 F (a)) n k (k = 0, 1,..., n). k 1 W istocie, dane pochodzą z dwóch numerów Gazety Wyborczej, ( Gazeta Stołeczna, 29 sierpnia 2009 i 5 września 2009).
5 1.1. ROZKŁAD EMPIRYCZNY 15 noworodki Fn(x) x Rysunek 1.1: Dystrybuanta empiryczna wagi noworodków. Dane z Przykładu
6 16 ROZDZIAŁ 1. PRÓBKOWE ODPOWIEDNIKI WIELKOŚCI POPULACYJNYCH DEFINICJA. Rozważmy próbkę X 1, X 2,..., X n. Dla każdego ω Ω, niech X 1:n (ω) X 2:n (ω) X n:n (ω) będzie ciągiem liczb X 1 (ω), X 2 (ω),..., X n (ω) uporządkowanym w kolejności rosnącej. Określone w ten sposób zmienne losowe X 1:n, X 2:n,..., X n:n nazywamy statystykami pozycyjnymi. W szczególności, X 1:n = min(x 1,..., X n ) i X n:n = max(x 1,..., X n ); pierwsza i ostatnia statystyka pozycyjna to, odpowiednio, najmniejsza i największa obserwacja w próbce. Dystrybuanta empiryczna ˆF jest funkcją schodkową : jest stała na każdym z przedziałów pomiędzy statystykami pozycyjnymi [X i:n, X i+1:n [. Widać, że dla x < X 1:n mamy ˆF (x) = 0; dla X i:n x < X i+1:n mamy ˆF (x) = i n ; dla x X n:n mamy ˆF (x) = 1. W punktach X i:n funkcja ˆF ma nieciągłości (skacze w górę). Jeśli teoretyczna dystrybuanta F jest ciągła, to P(X 1:n < X 2:n < < X n:n ) = 1, a więc, z prawdopodobieństwem 1, mamy ˆF (X i:n ) = i/n i każdy skok dystrybuanty empirycznej ma wielkość 1/n. Jeśli teoretyczna dystrybuanta jest dyskretna, to z niezerowym prawdopodobieństwem niektóre statystyki pozycyjne będą się pokrywać i dystrybuanta empiryczna będzie miała skoki wysokości 2/n lub 3/n i tak dalej. W poniższym stwierdzeniu będziemy mieli do czynienia z nieskończoną próbką, czyli z ciągiem zmiennych losowych X 1, X 2,..., X n,..., które są niezależne i mają jednakowy rozkład prawdopodobieństwa. Możemy sobie wyobrazić, że wciąż dodajemy do próbki nowe zmienne losowe. Dystrybuanta empiryczna ˆF n jest określona tak jak w Definicji 1.1.2, to znaczy, zależy od początkowych zmiennych X 1,..., X n. Rozpatrujemy teraz ciąg dystrybuant empirycznych ˆF 1, ˆF 2,..., ˆF n, Stwierdzenie. Jeśli X 1,..., X n,... jest próbką z rozkładu o dystrybuancie F, to dla każdego x R, ˆF n (x) p.n. F (x), (n ). Dowód. Zmienne losowe 1(X 1 x),..., 1(X n x),... są niezależne i mają jednakowy rozkład prawdopodobieństwa: 1(X n x) przyjmuje wartość 1 z prawdopodobieństwem F (x) lub wartość 0 z prawdopodobieństwem 1 F (x). Oczywiście, E1(X n x) = F (x). Z Mocnego Prawa Wielkich Liczb (MPWL) dla schematu Bernoulliego wynika, że zdarzenie lim n ˆFn (x) = F (x) zachodzi z prawdopodobieństwem 1. To znaczy, że ciąg zmiennych losowych ˆF n (x) jest zbieżny prawie na pewno do liczby F (x). Istnieje mocniejsza wersja poprzedniego stwierdzenia, którą przytoczymy bez dowodu. Można pokazać, że zbieżność ˆF F zachodzi jednostajnie z prawdopodobieństwem 1.
7 1.1. ROZKŁAD EMPIRYCZNY 17 n=10 n=25 Fn(x) Fn(x) x x n=100 n=500 Fn(x) Fn(x) x x Rysunek 1.2: Zbieżność dystrybuant empirycznych do dystrybuanty.
8 18 ROZDZIAŁ 1. PRÓBKOWE ODPOWIEDNIKI WIELKOŚCI POPULACYJNYCH TWIERDZENIE (Gliwienko-Cantelli). Jeżeli X 1,..., X n,... jest próbką z rozkładu o dystrybuancie F to sup ˆF n (x) F (x) p.n. 0 (n ). <x< Jeśli mamy możliwość nieograniczonego powiększania próbki, to możemy poznać rozkład prawdopodobieństwa z dowolną dokładnością. Zamiast dowodu Twierdzenia Gliwienki-Cantelliego przytoczymy wyniki przykładowych symulacji komputerowych. Na Rysunku 1.2 widać dystrybuanty empiryczne F 10, F 25, F 100 i F 500, dla próbki z rozkładu normalnego N(0, 1) na tle teoretycznej dystrybuanty tego rozkładu (ciągła, niebieska krzywa). Skoncentrowaliśmy uwagę na dystrybuancie empirycznej, ale podobnie można zdefiniować o empiryczny rozkład prawdopodobieństwa. Rozważmy zbiór borelowski B R i próbkę X 1, X 2,..., X n z rozkładu zmiennej losowej X. Przybliżeniem nieznanej liczby P (B) = P(X B) jest prawdopodobieństwo empiryczne ˆP (B) = 1 n n 1(X i B). Określone w ten sposób odwzorowanie ˆP : B Ω R, gdzie B oznacza rodzinę zbiorów borelowskich, nazywane jest empirycznym rozkładem prawdopodobieństwa. Dla ustalonego ω Ω jest to dyskretny rozkład prawdopodobieństwa; jeśli wartości x 1 = X 1 (ω),..., x n = X n (ω) są różnymi liczbami to ˆP ({x i }) = 1/n dla i = 1, 2,..., n, czyli empiryczny rozkład prawdopodobieństwa jest rozkładem równomiernym na zbiorze {x 1,..., x n }. Z drugiej strony ˆP (B) jest, dla ustalonego zbioru B, zmienną losową (a nie liczbą). Oczywiście, ˆP (], x]) = ˆF (x) Przykład (Statystyczna kontrola jakości). Producent chce się dowiedzieć, jaki procent wytwarzanych przez niego wyrobów jest wadliwych. Sprawdza dokładnie pewną liczbę sztuk. Powiedzmy, że badaniu poddano 50 sztuk i wyniki są takie (zakodujemy wyrób prawidłowy jako liczbę 1 i wadliwy jako 0 ): Potraktujemy ten ciąg jako próbkę z pewnego rozkładu prawdopodobieństwa na zbiorze dwupunktowym {prawidłowy, wadliwy} = {1, 0}. Producenta interesuje liczba P (0) = P (wadliwy) = % sztuk wadliwych wśród wszystkich wyrobów.
9 1.2. MOMENTY I KWANTYLE Z PRÓBKI. 19 Na podstawie próbki możemy obliczyć prawdopodobieństwo empiryczne ˆP (0) = ˆP (wadliwy) = % sztuk wadliwych wśród 50 zbadanych wyrobów = 5 50 = Przykład jest trywialny. Chodzi tylko o to, żeby podkreślić różnicę między nieznaną, interesującą nas liczbą P (0) i znaną ale losową wielkością ˆP (0). 1.2 Momenty i kwantyle z próbki. Określimy teraz próbkowe odpowiedniki pewnych wielkości, związanych z rozkładem prawdopodobieństwa. Będziemy postępowali w podobnym duchu jak w definicji dystrybuanty empirycznej. Cały czas X 1,..., X n jest próbką. Średnią z próbki nazywamy zmienną losową X = 1 n X i. n Widać, że X jest wartością oczekiwaną rozkładu empirycznego. próbki S 2 = 1 n (X i n X) 2 jest niczym innym, jak wariancją rozkładu empirycznego. próbki (zwykłe i centralne) oznaczymy przez â k i ˆm k : Podobnie, wariancja z Wyższego rzędu momenty z â k = 1 n n Xi k, ˆm k = 1 n n (X i X) k. Są to odpowiedniki momentów, czyli a k = EX k, m k = E(X i EX) k. Wielkości a k i m k zależą od prawdziwego, teoretycznego rozkładu zmiennej losowej X, podczas gdy â k i ˆm k są obliczone dla rozkładu empirycznego. Oczywiście, â 1 = X i ˆm 2 = S 2, ale te dwa momenty spotykać będziemy tak często, że zasługują na specjalne oznaczenie. Zauważmy jeszcze oczywisty związek ˆm 2 = â 2 â 2 1 (Zadanie 1.4).
10 20 ROZDZIAŁ 1. PRÓBKOWE ODPOWIEDNIKI WIELKOŚCI POPULACYJNYCH Kwantyle próbkowe określamy zgodnie z tym samym schematem. Po prostu zastępujemy rozkład prawdopodobieństwa rozkładem empirycznym i obliczamy kwantyle. Przypomnijmy najpierw definicję kwantyla. Niech 0 < q < 1. Jeśli P(X < ξ q ) = F (ξ q ) q F (ξ q ) = P(X ξ q ), to liczbę ξ q nazywamy kwantylem rzędu q zmiennej losowej X. Taka liczba zawsze istnieje, ale nie musi być wyznaczona jednoznacznie. Jeśli istnieje dokładnie jedna liczba ξ q taka, że P(X ξ q ) = F (ξ q ) = q to oczywiście ξ q jest q-tym kwantylem. Podobnie jest w przypadku gdy F (ξ q ) < q < F (ξ q ). Jeśli jednak F (a) = F (b) = q, to każda z liczb z przedziału [a, b] jest kwantylem. Liczbę ˆξ q nazywamy kwantylem empirycznym rzędu q, jeśli ˆF (ˆξ q ) q ˆF (ˆξ q ). Statystyka pozycyjna X np :n jest kwantylem empirycznym rzędu p ale niekoniecznie jedynym. Najlepiej widać to na przykładzie mediany (kwantyla rzędu q = 1/2). Jeśli rozmiar próbki n jest liczbą nieparzystą, to statystyka pozycyjna o numerze (n + 1)/2 jest medianą z próbki. Jeśli rozmiar próbki jest liczbą parzystą, to każda z liczb z przedziału [X n/2:n, X n/2+1,n ] jest medianą rozkładu empirycznego. W R i innych pakietach statystycznych, dla uniknięcia niejednoznaczności, zwykle podaje się środek przedziału median: (X n/2:n + X n/2+1:n )/2. Przyjmiemy następujące oznaczenia na medianę i medianę z próbki: med(x) = ξ 1/2, med ˆ = med(x ˆ 1,..., X n ) = ˆξ 1/2. Kwantyle rzędu 1/4 i 3/4 noszą nazwę kwartyli i bywają oznaczane Q 1 i Q Przykład (Waga noworodków, kontynuacja). Dla naszej niemowlęcej próbki z Przykładu mamy X = , S = Jak już zauważyliśmy poprzednio, med ˆ = Kwartyle próbkowe, zgodnie z naszą definicją, są równe Q 1 = ˆξ 1/4 = X 29:114 = 2930 i Q 3 = ˆξ 3/4 = X 86:114 = Medianę, kwartyle, minimum i maksimum próbki przedstawia tak zwany wykres pudełkowy (ang. Box and Whiskers Plot, Rysunek 1.3). Boki prostokąta (na tym rysunku boki pionowe) odpowiadają kwartylom. Kreska wewnątrz prostokąta pokazuje medianę. Wąsy umieszcza się (w zasadzie) w miejscu minimum i maksimum z próbki. Wykres pudełkowy pozwala na graficzne porównanie kilku próbek. W tym przypadku na jednym obrazku widnieje kilka pudełek, a ich grubość może być związana z licznościami poszczególnych próbek. Na zakończenie naszych wstępnych rozważań wspomnimy o jeszcze jednym graficznym sposobie podsumowania danych. Na Rysunku 1.4 przedstawiony jest histogram danych z Przykładu Wydaje się, że szczegółowe objaśnienia są zbędne, bo budowa histogramu jest 2 Określenie kwantyla próbkowego w pakietach statystycznych nieco różni się od naszego, ale nie ma to zasadniczego znaczenia, szczególnie jeśli próbka jest duża. W naszym przykładzie R podaje następujące wartości kwartyli: Q 1 = ˆξ 1/4 = i Q 3 = ˆξ 3/4 =
11 1.2. MOMENTY I KWANTYLE Z PRÓBKI. 21 noworodki Rysunek 1.3: Wykres pudełkowy. Dane z Przykładu
12 22 ROZDZIAŁ 1. PRÓBKOWE ODPOWIEDNIKI WIELKOŚCI POPULACYJNYCH dość oczywista i dobrze znana czytelnikom prasy i telewidzom. Zwróćmy tylko uwagę na to, że skala osi pionowej zastała tak dobrana, aby pole pod histogramem było równe 1, podobnie jak pole pod wykresem gęstości prawdopodobieństwa. W istocie, histogram jest w pewnym sensie empirycznym odpowiednikiem gęstości. Histogram of noworodki Density 0e+00 2e 04 4e 04 6e noworodki Rysunek 1.4: Histogram danych z Przykładu
13 1.3. ZADANIA Zadania 1.1. Obliczyć E ˆF (x), Var ˆF (x) Pokazać, że ciąg zmiennych losowych n( ˆF n (x) F (x)) jest zbieżny do rozkładu normalnego. Zidentyfikować parametry tego rozkładu Podać granicę lim n P( ˆF n (x) F (x)) przy założeniu, że 0 < F (x) < 1. Dokładnie uzasadnić odpowiedź Wyprowadzić alternatywny wzór na wariancję próbkową: S 2 = 1 n n Xi 2 X Niech X 1,..., X n będzie próbką z rozkładu normalnego N(µ, σ 2 ). Podać rozkład średniej próbkowej X = Xi /n Obliczyć dystrybuantę i gęstość rozkładu zmiennej losowej U n:n = max(u 1,..., U n ), gdzie U 1,..., U n jest próbką z rozkładu jednostajnego U(0, 1) (Ciąg dalszy). Obliczyć EU n:n, gdzie U n:n oznacza ostatnią statystykę pozycyjną (maksimum z próbki) z rozkładu jednostajnego U(0, 1) (Ciąg dalszy). Obliczyć VarU n:n, gdzie U n:n oznacza maksimum z próbki z rozkładu jednostajnego U(0, 1) (Ciąg dalszy). Zbadać zbieżność według rozkładu ciągu zmiennych losowych n(1 U n:n ), gdzie U n:n oznacza ostatnią statystykę pozycyjną (maksimum z próbki) z rozkładu jednostajnego U(0, 1) Niech X 1,..., X n będzie próbką z rozkładu wykładniczego Ex(λ). Obliczyć rozkład prawdopodobieństwa X 1:n, pierwszej statystyki pozycyjnej (minimum z próbki). Podać dystrybuantę, gęstość, nazwę tego rozkładu Rozważmy próbkę X 1,..., X n z rozkładu o dystrybuancie F. Pokazać, że zmienna losowa X k:n (k-ta statystyka pozycyjna) ma dystrybuantę P(X k:n x) = n i=k ( ) n F (x) i (1 F (x)) n i. i Załóżmy, że dystrybuanta F jest funkcją ciągłą i ściśle rosnącą, a zatem istnieje funkcja odwrotna F 1 :]0, 1[ R. Pokazać, że jeśli U U(0, 1) to zmienna losowa X = F 1 (U) ma dystrybuantę F (Ciąg dalszy). Niech U k:n oznacza statystykę pozycyjną z rozkładu U(0, 1). Pokazać, że X k:n = F 1 (U k:n ) ma rozkład taki jak statystyka pozycyjna z rozkładu o dystrybuancie F.
14 24 ROZDZIAŁ 1. PRÓBKOWE ODPOWIEDNIKI WIELKOŚCI POPULACYJNYCH
15 Rozdział 2 Modele statystyczne 2.1 Przestrzenie statystyczne Zaczniemy od formalnej definicji, której sens postaramy się w dalszym ciągu wyjaśnić i zilustrować przykładami DEFINICJA. Przestrzeń statystyczna jest to trójka (X, F, {P θ ; θ Θ}), gdzie X jest zbiorem, wyposażonym w σ-ciało F podzbiorów, zaś {P θ ; θ Θ} jest rodziną rozkładów prawdopodobieństwa na przestrzeni (X, F). Zbiór X nazywamy przestrzenią obserwacji zaś Θ nazywamy przestrzenią parametrów. Widoczny jest związek z definicją znaną z rachunku prawdopodobieństwa. Dla każdego ustalonego θ Θ, trójka (X, F, P θ ) jest przestrzenią probabilistyczną. Najważniejszą nowością w Definicji jest to, że rozważamy rodzinę rozkładów prawdopodobieństwa, {P θ ; θ Θ}. Jak już powiedzieliśmy w poprzednim rozdziale, w statystyce matematycznej traktujemy dane jako wynik doświadczenia losowego, ale nie wiemy, jaki rozkład rządzi badanym zjawiskiem. Wobec tego rozpatrujemy rodzinę wszystkich branych pod uwagę rozkładów prawdopodobieństwa. Zakładamy, że prawdziwy rozkład należy do tej rodziny, czyli jest to rozkład P θ0 dla pewnego θ 0 Θ, tylko nie umiemy wskazać θ Uwaga (Kanoniczna przestrzeń próbkowa). Powiedzmy, że wynikiem obserwacji są zmienne losowe X 1,..., X n. Niech Ω będzie zbiorem wszystkich możliwych wyników doświadczenia losowego, a więc w naszym przypadku zbiorem ciągów ω = (x 1,..., x n ). Możemy przyjąć, że zmienne losowe X i są funkcjami określonymi na przestrzeni próbkowej Ω wzorem X i (ω) = x i. Wektor X = (X 1,..., X n ) możemy traktować jako pojedynczą, wielowymiarową obserwację i napisać X(ω) = ω. Przy tej umowie, milcząco przyjętej w Definicji 2.1.1, rozkład prawdopodobieństwa na przestrzeni Ω = X jest tym samym, co rozkład prawdopodobieństwa obserwacji: P θ (B) = P θ (X B), dla B F. Jest to, co należy podkreślić, łączny rozkład wszystkich obserwowanych zmiennych losowych. Szczególny wybór przestrzeni Ω nie ma zasadniczego znaczenia, jest po prostu wygodny. 25
16 26 ROZDZIAŁ 2. MODELE STATYSTYCZNE Uwaga (Ciągłe i dyskretne przestrzenie obserwacji). Skupimy uwagę na dwóch typach przestrzeni statystycznych, które najczęściej pojawiają się w zastosowaniach. Mówimy o modelu ciągłym, jeśli X jest borelowskim podzbiorem przestrzeni R n, wyposażonym w σ-ciało B zbiorów borelowskich i n-wymiarową miarę Lebesgue a. Model nazywamy dyskretnym, jeśli przestrzeń X jest skończona lub przeliczalna, wyposażona w σ-ciało 2 X wszystkich podzbiorów i miarę liczącą. Rozkład prawdopodobieństwa obserwacji X najczęściej opisujemy przez gęstość f θ na przestrzeni X, zależną od parametru θ Θ. W zależności od kontekstu, posługujemy się gęstością względem odpowiedniej miary. W skrócie piszemy X f θ. Jeśli zmienna X ma skończony lub przeliczalny zbiór wartości X, to f θ (x) = P θ (X = x). (jest to gęstość względem miary liczącej). Dla jednowymiarowej zmiennej losowej X o absolutnie ciągłym rozkładzie, f θ jest gęstością w zwykłym sensie, czyli względem miary Lebesgue a. Mamy wówczas dla dowolnego przedziału [a, b], P θ (a X b) = b a f θ (x)dx. Jeśli X = (X 1,..., X n ) to rozumiemy, że f θ jest łączną gęstością prawdopodobieństwa na przestrzeni X = R n. Dla dowolnego zbioru borelowskiego B R n, P θ (X B) = f θ (x)dx = f θ (x 1,..., x n )dx 1 dx n. B W szczególnym przypadku, gdy zmienne X 1,..., X n są niezależne i mają jednakowy rozkład, pozwolimy sobie na odrobinę nieścisłości, oznaczając tym samym symbolem f θ jednowymiarową gęstość pojedynczej obserwacji i n-wymiarową gęstość całej próbki: f θ (x 1,..., x n ) = f θ (x 1 ) f θ (x n ). Jeśli T : X R, to wartość średnią (oczekiwaną) zmiennej losowej T (X) obliczamy zgodnie ze wzorem T (x)f X θ(x)dx w przypadku ciągłym; E θ T (X) = x X T (x)f θ(x) w przypadku dyskretnym. Jeśli X R n, to całka X jest n-wymiarowa, dx = dx 1 dx n. Podobnie, będziemy używać symboli Var θ, Cov θ i podobnych. Jeśli rodzina rozkładów prawdopodobieństwa {P θ ; θ Θ} jest zdefiniowana przez podanie rodziny gęstości {f θ ; θ Θ} względem pewnej (wspólnej dla wszystkich rozkładów) miary, to mówimy, że przestrzeń statystyczna jest zdominowana. Nasze rozważania będą niemal wyłącznie ograniczone do takich przestrzeni. B
17 2.1. PRZESTRZENIE STATYSTYCZNE 27 Przejdziemy teraz do przykładów, które wyjaśnią sens (nieco abstrakcyjnej) Definicji Przykład (Statystyczna kontrola jakości, kontynuacja). Powróćmy do Przykładu Przestrzenią obserwacji jest X = {0, 1} n. Obserwacje X 1,..., X n są zmiennymi losowymi o łącznym rozkładzie prawdopodobieństwa P p (X 1 = x 1,..., X n = x n ) = n p x i (1 p) 1 x i = p Σx i (1 p) n Σx i, gdzie x i {0, 1} dla i = 1,..., n i x i oznacza n x i. Nieznanym parametrem jest prawdopodobieństwo sukcesu, θ = p. Przestrzenią parametrów jest Θ = [0, 1] Przykład (Badanie reprezentacyjne). Powiedzmy, że populacja składa się z r jednostek. Przedmiotem badania jest nieznana liczba m jednostek wyróżnionych. Na przykład może to być liczba euroentuzjastów w populacji wyborców albo liczba palących w populacji studentów. Interesują nas własności całej populacji, ale pełne badanie jest niemożliwe lub zbyt kosztowne. Wybieramy losowo n jednostek spośród r i obserwujemy, ile jednostek wyróżnionych znalazło się wśród wylosowanych. Załóżmy, że stosujemy schemat losowania bez zwracania 1. Najlepiej wyobrazić sobie losowe wybranie n kul z urny zawierającej r kul, w tym m czerwonych i r m białych. Liczby r i n są znane. Liczba X kul białych wśród wylosowanych jest obserwacją. Zmienną losowa X ma tak zwany hipergeometryczny rozkład prawdopodobieństwa: ( )( ) / ( ) m r m r P m (X = x) =, x n x n zależny od parametru θ = m ze zbioru Θ = {0, 1,..., r}. Przestrzenią obserwacji jest zbiór X = {0, 1,..., n}. Parametr θ jest etykietką identyfikującą rozkład prawdopodobieństwa. Nie zawsze θ jest liczbą, może wektorem lub nawet funkcją Przykład (Model nieparametryczny). Zgodnie z Definicją 1.1.1, ciąg obserwowanych zmiennych losowych X 1,..., X n stanowi próbkę z rozkładu o dystrybuancie F, jeśli P F (X 1 x 1,..., X n x n ) = F (x 1 ) F (x n ). Symbol P F przypomina, że dystrybuanta F jest nieznana i odgrywa rolę nieskończenie wymiarowego parametru. Przestrzenią parametrów jest zbiór wszystkich dystrybuant. Przestrzenią obserwacji jest X = R n 2. 1 Próbka wylosowana w ten sposób nie jest próbką w sensie Definicji Jest to jedyny w tym skrypcie przykład przestrzeni statystycznej, która nie jest zdominowana.
18 28 ROZDZIAŁ 2. MODELE STATYSTYCZNE Przykład (Wypadki). Liczba wypadków drogowych w ciągu tygodnia ma, w dobrym przybliżeniu, rozkład Poissona. Niech X 1,..., X n oznaczają liczby wypadków w kolejnych tygodniach. Jeśli nic specjalnie się nie zmienia (pogoda jest podobna i nie zaczyna się właśnie okres wakacyjny) to można przyjąć, że każda ze zmiennych X i ma jednakowy rozkład. Mamy wtedy próbkę z rozkładu Poissona, czyli θ Σx i f θ (x 1,..., x n ) = P θ (X 1 = x 1,..., X n = x n ) = e θn x 1! x n!. Przestrzenią obserwacji jest X = {0, 1, 2,...} n, a przestrzenią parametrów Θ =]0, [. Wiemy, że E θ X i = θ i Var θ X i = θ Przykład (Czas życia żarówek). Rozpatrzmy jeszcze jeden przykład z dziedziny statystycznej kontroli jakości. Producent bada partię n żarówek. Interesuje go czas życia, to jest liczba godzin do przepalenia się żarówki. Załóżmy, że czasy życia X 1,..., X n badanych żarówek stanowią próbkę z rozkładu wykładniczego Ex(θ), czyli f θ (x 1,..., x n ) = n (θe θx i ) = θ n e θσx i. Jest to typowe i dość realistyczne założenie. Mamy tutaj X = [0, [ n i Θ =]0, [. Zauważmy, że E θ X i = 1/θ i Var θ X i = 1/θ Przykład (Pomiar z błędem losowym). Powtarzamy niezależnie n razy pomiar pewnej wielkości fizycznej µ. Wyniki poszczególnych pomiarów X 1,..., X n są zmiennymi losowymi bo przyrząd pomiarowy jest niedoskonały. Najczęściej zakłada się, że każdy z pomiarów ma jednakowy rozkład normalny N(µ, σ 2 ). Mamy zatem ( ) n [ 1 f µ,σ (x 1,..., x n ) = exp 1 ] (xi µ) 2. 2πσ 2σ 2 Tutaj rolę parametru θ gra para liczb (µ, σ), gdzie < µ < i σ > 0. Przestrzenią parametrów jest Θ = R ]0, [. Oczywiście, przestrzenią obserwacji jest X = R n. Wiemy, że E µ,σ X i = µ i Var µ,σ X i = σ Statystyki i rozkłady próbkowe Rozpatrujemy, jak zwykle, przetrzeń statystyczną (X, F, {P θ ; θ Θ}). Niech (T, A) będzie przestrzenią mierzalną (znaczy to, że zbiór T jest wyposażony w σ-ciało podzbiorów A; zazwyczaj będzie to podzbiór przestrzeni R d z σ-ciałem borelowskim).
19 2.2. STATYSTYKI I ROZKŁADY PRÓBKOWE DEFINICJA. Mierzalną funkcję T : X T określoną na przestrzeni obserwacji X nazywamy statystyką o wartościach w przestrzeni T. W Definicji istotne jest to, że statystyka jest wielkością obliczoną na podstawie danych i nie zależy od nieznanego parametru θ. Będziemy w skrócie pisać T = T (X). Skupiamy uwagę na przypadkach, kiedy przestrzeń T ma wymiar znacznie mniejszy niż X : staramy się obliczyć taką statystykę T (X) która ma streścić dane X Przykład (Statystyki i inne zmienne losowe). W Przykładzie (Statystyczna kontrola jakości), S = n X i, a więc liczba prawidłowych wyrobów w próbce jest statystyką. Oczywiście, S : {0, 1} n {0, 1,..., n}. Statystyka S ma dwumianowy rozkład prawdopodobieństwa: ( ) n P p (S = s) = p s (1 p) n s. s W skrócie napiszemy S Bin(n, p). Zmienna losowa (S np)/ np(1 p) nie jest statystyką, bo zależy od nieznanego parametru p. Ma w przybliżeniu normalny rozkład prawdopodobieństwa N(0, 1), jeśli n jest duże a p(1 p) nie jest zbyt małe. W Przykładzie (Wypadki) sumaryczna liczba wypadków S = n X i jest statystyką i ma rozkład Poiss(nθ). W Przykładzie (Żarówki) średnia X = (1/n) n X i jest statystyką i ma rozkład Gamma(n, nθ). Model normalny, wprowadzony w Przykładzie zasługuje na więcej miejsca. Załóżmy, że X 1,..., X n jest próbką z rozkładu N(µ, σ 2 ). Ważną rolę w dalszych rozważaniach odgrywać będą statystyki: X = 1 n X i, n S 2 = 1 n 1 n (X i X) 2, S = S 2. Zauważmy, że S 2 różni się od wariancji z próbki S2, o której mówiliśmy w poprzednim rozdziale: mnożnik 1/n zastąpiliśmy przez 1/(n 1). Rozkład prawdopodobieństwa średniej z próbki jest w modelu normalnym niezwykle prosty: X N(µ, σ 2 /n). Zajmiemy się teraz rozkładem statystyki S 2. Rozkład chi-kwadrat z k stopniami swobody jest to, z definicji, rozkład zmiennej losowej Y = k Zi 2, gdzie Z 1,..., Z k są niezależnymi zmiennymi losowymi o rozkładzie N(0, 1). Będziemy pisali symbolicznie Y χ 2 (k).
20 30 ROZDZIAŁ 2. MODELE STATYSTYCZNE Uwaga. Rozkłady chi-kwadrat są szczególnej postaci rozkładami Gamma, mianowicie χ 2 (k) = Gamma(k/2, 1/2) (Zadanie 2.5). Jeśli Y χ 2 (k) to EY = k i VarY = 2k. Wykresy gęstości kilku rozkładów χ 2 są pokazane na Rysunku Stwierdzenie (Twierdzenie Fishera). W modelu normalnym, X i S 2 są niezależnymi zmiennymi losowymi, X N(µ, σ 2 /n); n 1 σ 2 S 2 χ 2 (n 1). Pominiemy dowód, bo w Rozdziale 9 udowodnimy twierdzenie znacznie ogólniejsze. Niezależność zmiennych losowych X i S 2 nie jest oczywista. Zauważmy też, że pojawia się rozkład chi-kwadrat z n 1 stopniami swobody, chociaż (n 1)S 2 jest sumą n kwadratów zmiennych normalnych Wniosek. E µ,σ S 2 = σ 2 i Var µ,σ S 2 = 2σ 4 /(n 1). Rozkład t Studenta z k stopniami swobody jest to, z definicji, rozkład zmiennej losowej T = Z Y/k, gdzie Z i Y są niezależnymi zmiennymi losowymi, Z N(0, 1) i Y χ 2 (k). Będziemy pisali symbolicznie T t(k). Dwa rozkłady t oraz rozkład normalny są pokazane na Rysunku Wniosek. W modelu normalnym, zmienna losowa n( X µ)/s ma rozkład t(n 1). Rozkład F Snedecora z k i m stopniami swobody jest to, z definicji, rozkład zmiennej losowej R = Y/k U/m, gdzie Y i U są niezależnymi zmiennymi losowymi, Y χ 2 (k) i U χ 2 (m). Będziemy pisali symbolicznie R F(k, m) Przykład (Model dwóch próbek). Załóżmy, że obserwujemy niezależne zmienne losowe X 1,..., X n i Y 1,..., Y m, przy tym X i N(µ X, σx 2 ) i Y j N(µ Y, σy 2 ) dla i = 1,..., n i j = 1,..., m. Statystyki X i S 2 X są określone tak jak poprzednio, dla próbki X 1,..., X n. Podobnie określamy statystyki Ȳ i SY 2, dla próbki Y 1,..., Y m. Z tego, co powiedzieliśmy wcześniej wynika, że SX 2 σ2 Y F(n 1, m 1). SY 2 σ2 X Zauważmy, że zmienna losowa SX 2 σ2 Y /(S2 Y σ2 X ) nie jest statystyką, bo zależy nie tylko od obserwacji, ale i od nieznanych paramerów σ X i σ Y. Jeśli założymy, że σx 2 = σ2 Y to statystyka SX 2 /S2 Y ma rozkład F(n 1, m 1).
21 2.2. STATYSTYKI I ROZKŁADY PRÓBKOWE 31 chi2( 1 ) chi2( 2 ) density density χ χ 2 chi2( 5 ) chi2( 10 ) density density χ χ 2 Rysunek 2.1: Rozkłady χ 2 dla różnej liczby stopni swobody.
22 32 ROZDZIAŁ 2. MODELE STATYSTYCZNE t Student density t(1) t(3) N(0,1) t Rysunek 2.2: Rozkłady t Studenta i rozkład normalny.
23 2.3. DOSTATECZNOŚĆ 33 Podobnie, jeśli σ 2 X = σ2 Y = σ2 to X Ȳ (µ X µ Y ) (k 1)S 2 X + (m 1)S 2 Y km (k + m 2) t(k + m 2). k + m 2.3 Dostateczność Rozważmy przestrzeń statystyczną (X, F, {P θ : θ Θ}) i statystykę T = T (X) o wartościach w przestrzeni (T, A) DEFINICJA. Statystykę T = T (X) nazywamy dostateczną, jeśli warunkowy rozkład prawdopodobieństwa obserwacji X przy danej wartości statystyki T = t nie zależy od parametru θ, dla każdego t T. Uwaga. W pewnym uproszczeniu, statystyka jest dostateczna, jeśli prawdopodobieństwo warunkowe (*) P θ (X B T (X) = t) nie zależy od θ, dla dowolnego zbioru B F i (prawie) każdego t. Niestety, ścisłe sformułowanie Definicji wymaga znajomości ogólnego pojęcia warunkowego rozkładu prawdopodobieństwa i teorii miary. Zwróćmy uwagę, że określenie warunkowego rozkładu poprzez gęstość tutaj się bezpośrednio nie stosuje, bo rozkład X przy danym T (X) = t jest zazwyczaj skupiony na podprzestrzeni o niższym wymiarze, patrz Zadanie Jeśli jednak X jest przestrzenią dyskretną, to możemy się posłużyć elementarną definicją prawdopodobieństwa warunkowego. W tym przypadku warunek ( ) redukuje się do tego, że (**) P θ (X = x T (X) = t) nie zależy od θ, dla dowolnych t i x (to prawdopodobieństwo jest niezerowe tylko jeśli T (x) = t). Sens Definicji wyjaśni doświadczenie myślowe. Wyobraźmy sobie, że statystyk zaobserwował X = x, obliczył i zapisał T (x) = t, po czym... zgubił dane, czyli stracił x. Może jednak wylosować sztuczne dane X z rozkładu warunkowego obserwacji przy danym T = t, ponieważ ten rozkład nie wymaga znajomości θ. Skoro sztuczne dane X mają ten sam rozkład prawdopodobieństwa co prawdziwe dane X, więc nasz statystyk nic nie stracił zapisując t i zapominając x. Stąd właśnie nazwa: statystyka dostateczna zawiera całość informacji o parametrze zawartych w obserwacji. Załóżmy teraz, że przestrzeń statystyczną (X, F, {P θ : θ Θ}) jest zdominowana (Uwaga 2.1.3), to znaczy rozkłady P θ mają gęstości f θ. Zwykle są to albo gęstości względem miary Lebesgue a, albo gęstości dyskretne f θ (x) = P θ (X = x).
24 34 ROZDZIAŁ 2. MODELE STATYSTYCZNE TWIERDZENIE (Kryterum faktoryzacji). Statystyka T = T (X) jest dostateczna wtedy i tylko wtedy gdy gęstości obserwacji można przedstawić w postaci f θ (x) = g θ (T (x))h(x). Dowód. Żeby uniknąć trudności technicznych, ograniczymy się tylko do przypadku dyskretnej przestrzeni X. Jeśli T (x) = t to P θ (X = x T (X) = t) = f θ (x) x :T (x )=t f θ(x ) i oczywiście P θ (X = x T (X) = t) = 0 jeśli T (x) t. Jeżeli spełniony jest warunek faktoryzacji to natychmiast otrzymujemy, w przypadku T (x) = t, P θ (X = x T (X) = t) = g θ (t)h(x) x :T (x )=t g θ(t)h(x ) = h(x) x :T (x )=t h(x ). Odwrotnie, jeśli P θ (X = x T (X) = t) nie zależy od θ to własność faktoryzacji zachodzi dla h(x) = P θ (X = x T (X) = t) i g θ (t) = x :T (x )=t f θ(x ) Przykład (Ile jest kul w urnie?). Kule w urnie są ponumerowane: U = {1, 2,..., r} ale r jest nieznane. Pobieramy próbkę n kul, bez zwracania. Niech S oznacza losowy zbiór numerów a max(s) największy spośród nich. Prawdopodobieństwo wylosowania zbioru s U jest równe P r (S = s) = { 1(r max(s)) ( r = n) 1 /( ) r jeśli r max(s), n 0 jeśli r < max(s). Stąd widać, że max(s) jest statystyką dostateczną. W czasie II wojny światowej alianci notowali seryjne numery zdobytych czołgów niemieckich w celu oszacowania liczby produkowanych przez nieprzyjaciela czołgów. Rozważany schemat urnowy jest uproszczonym modelem takiej sytuacji Przykład (Statystyki dostateczne w poprzednich przykładach). W Przykładzie (Schemat Bernoulliego), liczba sukcesów S = n X i jest statystyką dostateczną. W Przykładzie (model Poissona) suma obserwacji S = n X i jest statystyką dostateczną. W Przykładzie (model wykładniczy) średnia X = (1/n) n X i jest statystyką dostateczną. W Przykładzie (model normalny z nieznanymi µ i σ) ( X, S 2 ) jest dwuwymiarową statystyką dostateczną.
25 2.4. RODZINY WYKŁADNICZE Rodziny wykładnicze Tak jak poprzednio, rozważamy model statystyczny, a więc rodzinę rozkładów prawdopodobieństwa na przestrzeni obserwacji X DEFINICJA. Rodzina rozkładów prawdopodobieństwa {P θ : θ Θ} jest rodziną wykładniczą jeśli rozkłady P θ mają, względem pewnej miary na X, gęstości f θ postaci: ( k ) f θ (x) = exp T j (x)ψ j (θ) + ψ 0 (θ) h(x), (θ Θ). j=1 Podkreślmy, że w tej definicji wymagamy, żeby istniały gęstości względem jednej miary wspólnej dla wszystkich θ. W większości zastosowań spotykamy, jak zwykle, albo gęstości względem miary Lebesgue a, albo gęstości dyskretne f θ (x) = P θ (X = x). Bez straty ogólności można zakładać, że funkcje T 1 (x),..., T k (x) są liniowo niezależne. To założenie będze w dalszym ciągu obowiązywać. Zauważmy prostą konsekwencję Definicji Zbiór {x : f θ > 0}, który nazywamy nośnikiem rozkładu P θ, 3 jest taki sam dla wszystkich θ Przykład. Rodzina rozkładów jednostajnych {U(0, θ) : θ > 0} nie jest rodziną wykładniczą. Ponieważ f θ (x) = 1 1(0 x θ), θ więc nośnikiem rozkładu U(0, θ) jest przedział [0, θ], który oczywiście zależy od θ Przykład. Rodzina rozkładów wykładniczych {Ex(θ) : θ > 0} jest rodziną wykładniczą, bo gęstości możemy napisać w następującej postaci: f θ (x) = θe θx = exp( θx + log θ). Nośnikiem każdego rozkładu wykładniczego jest ten sam przedział [0, [ Przykład. Rodzina rozkładów {Poiss(θ) : θ > 0} jest rodziną wykładniczą, bo ( θ θx 1 f θ (x) = e x! = exp θ + x log θ) x!. Oczywiście, każdy rozkład Poissona ma nośnik {0, 1, 2,...} Przykład. Rodzina przesuniętych rozkładów Cauchy ego o gęstościach f θ (x) = 1 π(1 + (x θ) 2 ), θ ], [, nie jest rodziną wykładniczą, bo funkcja log f θ (x) = log π log(1 + (x θ) 2 ) nie da się przedstawić w postaci sumy iloczynów k j=1 T j(x)ψ j (θ) + ψ 0 (θ). 3 Pozwalamy tu sobie na drobne uproszczenie, bo gęstość rozkładu prawdopodobieństwa jest wyznaczona jednoznacznie tylko prawie wszędzie.
26 36 ROZDZIAŁ 2. MODELE STATYSTYCZNE Przykład. Rodzina rozkładów {Gamma(α, λ) : α > 0, λ > 0} jest rodziną wykładniczą. ( ) f α,λ (x) = λα Γ(α) xα 1 e λx = exp λx + (α 1) log x + log λα Γ(α) Oczywiście, wspólnym nośnikiem wszystkich rozkładów Gamma jest przedział ]0, [. Inne przykłady rodzin wykładniczych to między innymi rodzina rozkładów normalnych {N(µ, σ) : < µ <, λ > 0}, rozkładów {Beta(α, β) : α, β > 0}, rodzina rozkładów dwumianowych {Bin(n, θ) : 0 < θ < 1}, ujemnych dwumianowych i wiele innych. Przejdźmy do omówienia kilku ciekawych własnosci rodzin wykładniczych Stwierdzenie. Jeżeli X 1,..., X n iid f θ jest próbką z rozkładu należącego do rodziny wykładniczej, to k-wymiarowy wektor ( n ) n T 1 (X i ),..., T k (X i ) jest statystyką dostateczną. Dowód. Jeżeli f θ ma postać taką jak w Definicji 2.4.1, to łaczna gęstość wektora obserwacji jest następująca: n ( k ) f θ (x 1,..., x n ) = exp T j (x i )ψ j (θ) + ψ 0 (θ) h(x i ) ( k = exp j=1 j=1 n ) n T j (x i )ψ j (θ) + nψ 0 (θ) h(x i ). Wystarczy teraz skorzystać z kryterium faktoryzacji (Twierdzenie 2.3.2). Zwróćmy uwagę, że dla wymiar statystyki dostatecznej w powyższym stwierdzeniu jest równy k, niezależnie od rozmiaru próbki n. Dla próbki z rodziny wykładniczej możliwa jest bardzo radykalna redukcja danych bez straty informacji. Zauważmy jeszcze, że k w Definicji wydaje się być związane z wymiarem przestrzeni parametrów. W Przykładach i mieliśmy jednoparametrowe rodziny wykładnicze, w Przykładzie dwuparametrową rodzinę. Staje się to bardziej przejrzyste, jeśli posłużymy się tak zwaną naturalną parametryzacją rodzin wykładniczych. Przyjmijmy wektor ψ = (ψ 1,..., ψ k ) = (ψ 1 (θ),..., ψ k (θ)) za nowy parametr, który identyfikuje rozkłady prawdopodobieństwa rozpatrywanej rodziny. Nieco nadużywając oznaczeń możemy napisać ( k ) (2.4.8) f ψ (x) = exp T j (x)ψ j b(ψ) h(x), j=1
27 2.4. RODZINY WYKŁADNICZE 37 gdzie ( k b(ψ) = log exp T j (x)ψ j )h(x)dx. X j=1 Jeśli istnieje wzajemnie jednoznaczna odpowiedniość pomiędzy starym parametrem θ Θ i nowym parametrem ψ, to wybór jednej lub drugiej parametryzacji jest tylko kwestią wygody Przykład. Rozkłady dwumianowe Bin(θ, n) mają gęstości postaci ( ) n f θ (x) = θ x (1 θ) n x = exp ( x log θ + (n x) log(1 θ) )( ) n x x ( )( ) θ n = exp x log + n log(1 θ). 1 θ x Naturalnym parametrem jest ψ = log θ 1 θ zaś b(ψ) = n log(1 + e ψ ). Zauważmy, że θ/(1 θ) jest tak zwanym ilorazem szans : stosunkiem prawdopodobieństwa sukcesu do prawdopodobieństwa porażki. Funkcja Jeśli θ zmienia się w przedziale ]0, 1[ to ψ przebiega przedział ], [. Naturalną przestrzenią parametrów jest więc cała prosta rzeczywista Uwaga. Mówimy, że rodzina wykładnicza jest regularna, jeśli przestrzeń naturalnych parametrów {ψ(θ) : θ Θ}, traktowana jako podzbiór R k, ma niepuste wnętrze. Ważną własnością regularnych rodzin wykładniczych jest dopuszczalność różniczkowania pod znakiem całki. Jeśli U : X R jest statystyką to ψ j X U(x)f ψ (x)dx = X U(x) ψ j f ψ (x)dx, jeśli ψ jest punktem wewnętrznym naturalnej przestrzeni parametrów i całka po lewej stronie jest dobrze określona. Co więcej, podobna własność zachodzi dla pochodnych wyższych rzędów. Oczywiście, jeśli funkcje ψ j (θ) są odpowiednio gładkie, to możemy bezpiecznie różniczkować pod znakiem całki również względem θ. W następnym rozdziale takie operacje rachunkowe będą odgrywały ważną rolę.
28 38 ROZDZIAŁ 2. MODELE STATYSTYCZNE 2.5 Zadania 2.1. Rozpatrzmy proces statystycznej kontroli jakości przyjmując te same założenia co w Przykładzie z tą różnicą, że obserwujemy kolejne wyroby do momentu gdy natrafimy na k wybrakowanych, gdzie k jest ustaloną z góry liczbą. Zbudować model statystyczny Uogólnić rozważania z Przykładu (badanie reprezentacyjne), uwzględniając więcej niż jeden rodzaj jednostek wyróżnionych. Powiedzmy, że mamy w urnie m 1 kul czerwonych, m 2 zielonych i r m 1 m 2 białych, gdzie r jest znaną liczbą, a m 1 i m 2 są nieznane i są przedmiotem badania. Opisać dokładnie odpowiedni model statystyczny Obliczyć rozkład prawdopodobieństwa zmiennej losowej Z 2, jeśli Z N(0, 1) (obliczyć bezpośrednio dystrybuantę i gęstość rozkładu χ 2 (1)) Obliczyć rozkład prawdopodobieństwa zmiennej losowej Z Z2 2, jeżeli Z i N(0, 1) są niezależne dla i = 1, 2 (obliczyć bezpośrednio dystrybuantę i gęstość rozkładu χ 2 (2)) Korzystając z Zadania 2.3 oraz z własności rozkładów gamma, udowodnić Uwagę 2.2: gęstość zmiennej losowej Y χ 2 (k) ma postać f Y (y) = 1 2 k/2 Γ(k/2) yk/2 1 e y/2, (y > 0) Udowodnić zbieżność rozkładów: t(k) d N(0, 1) dla k Udowodnić wzór dotyczący rozkładu t-studenta na końcu Przykładu Niech X 1,..., X n będzie próbką z rozkładu (Weibulla) o gęstości { 3θx 2 e θx3 dla x > 0; f θ (x) = 0 dla x 0, gdzie θ > 0 jest nieznanym parametrem. Znaleźć jednowymiarową statystykę dostateczną Niech X 1,..., X n będzie próbką z rozkładu Gamma(α, λ). Znaleźć dwuwymiarową statystykę dostateczną, zakładając że θ = (α, λ) jest nieznanym parametrem Rozważamy rodzinę przesuniętych rozkładów wykładniczych o gęstości { e (x µ) dla x µ; f µ (x) = 0 dla x < µ. Niech X 1,..., X n będzie próbką losową z takiego rozkładu. dostateczną dla parametru µ. Znaleźć jednowymiarową statystykę Rozważamy rodzinę przesuniętych rozkładów wykładniczych z parametrem skali o gęstości { λe λ(x µ) dla x µ; f µ,λ (x) = 0 dla x < µ. Niech X 1,..., X n będzie próbką losową z takiego rozkładu. dostateczną dla parametru (µ, λ). Znaleźć dwuwymiarową statystykę
29 2.5. ZADANIA Rozważamy rodzinę rozkładów na przestrzeni {0, 1, 2,...}: { θ dla x = 0; f θ (x) = P θ (X = x) = (1 θ)/2 x dla x {1, 2,...}. gdzie θ ]0, 1[ jest nieznanym parametrem. Niech X 1,..., X n będzie próbką losową z wyżej podanego rozkładu. Znaleźć jednowymiarową statystykę dostateczną Niech X 1,..., X n będzie schematem Bernoulliego z prawdopodobieństwem sukcesu θ. Obliczyć warunkowy rozkład prawdopodobieństwa zmiennych losowych X 1,..., X n przy danym S = s, gdzie S = n X i jest liczbą sukcesów. Zinterpretować fakt, że statystyka S jest dostateczna Niech X 1,..., X n będzie próbką z rozkładu Poiss(θ). Obliczyć warunkowy rozkład prawdopodobieństwa zmiennych losowych X 1,..., X n przy danym S = s, gdzie S = n X i. Zinterpretować fakt, że statystyka S jest dostateczna Niech X 1,..., X n będzie próbką z rozkładu Ex(θ). Niech S = n X i. Pokazać, że rozkład warunkowy (X 1,..., X n 1 ) przy danym S = s jest jednostajny na sympleksie {(x 1,..., x n 1 ) : x i 0, n 1 x i s}. Zinterpretować fakt, że statystyka S jest dostateczna Znaleźć rozkład zmiennej losowej 1 σ 2 n (X i µ) 2 w modelu normalnym. Porównać z twierdzeniem Fishera (Stwierdzenie 2.2.3) (Ciąg dalszy). Wyprowadzić tożsamość 1 σ 2 n (X i µ) 2 = 1 n σ 2 (X i X) 2 + n σ 2 ( X µ) 2. Jaki jest rozkład prawdopodobieństwa pierwszego i drugiego składnika po prawej stronie? Rozważmy jednoparametryczną wykładniczą rodzinę rozkładów z gęstościami danymi wzorem f ψ (x) = exp ( T (x)ψ b(ψ) ) h(x). Pokazać, że E ψ T (X) = b(ψ) ψ (Ciąg dalszy). Pokazać, że Var ψ T (X) = 2 b(ψ) ψ (Ciąg dalszy). Pokazać, że E ψ exp ( rt (X) ) = exp ( b(ψ + r) b(ψ) ).
30 40 ROZDZIAŁ 2. MODELE STATYSTYCZNE
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki 22 listopada 2016 Uprzednio wprowadzone pojęcia i ich własności Definicja zmiennej losowej Zmienna losowa na przestrzeni probabilistycznej (Ω, F, P) to funkcja
Bardziej szczegółowoPrawdopodobieństwo i statystyka
Wykład II: Zmienne losowe i charakterystyki ich rozkładów 13 października 2014 Zmienne losowe Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Definicja zmiennej losowej i jej
Bardziej szczegółowoWYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa
WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa Agata Boratyńska Agata Boratyńska Rachunek prawdopodobieństwa, wykład 2 i 3 1 / 19 Zmienna losowa Definicja Dana jest przestrzeń probabilistyczna
Bardziej szczegółowoStatystyka i eksploracja danych
Wykład II: i charakterystyki ich rozkładów 24 lutego 2014 Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa,
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 4 1 / 23 ZAGADNIENIE ESTYMACJI Zagadnienie
Bardziej szczegółowoNa A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)
MODELE STATYSTYCZNE Punktem wyjścia w rozumowaniu statystycznym jest zmienna losowa (cecha) X i jej obserwacje opisujące wyniki doświadczeń bądź pomiarów. Zbiór wartości zmiennej losowej X (zbiór wartości
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba
Bardziej szczegółowoWYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty
WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty Agata Boratyńska Agata Boratyńska Rachunek prawdopodobieństwa, wykład 4 / 9 Przekształcenia zmiennej losowej X
Bardziej szczegółowoPEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA
PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA 1. Trójkę (Ω, F, P ), gdzie Ω, F jest σ-ciałem podzbiorów Ω, a P jest prawdopodobieństwem określonym na F, nazywamy przestrzenią probabilistyczną. 2. Rodzinę F
Bardziej szczegółowoWykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 19 października 2016r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Bardziej szczegółowoWykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 18 października 2017r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Bardziej szczegółowoMETODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie
METODY ESTYMACJI PUNKTOWEJ X 1,..., X n - próbka z rozkładu P θ, θ Θ, θ jest nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie P θ. Definicja. Estymatorem
Bardziej szczegółowoPrzykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych
Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Niech Ω będzie przestrzenią zdarzeń elementarnych. Definicja 1 Rodzinę S zdarzeń losowych (zbiór S podzbiorów zbioru
Bardziej szczegółowoW rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe
Bardziej szczegółowoBiostatystyka, # 3 /Weterynaria I/
Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl
Bardziej szczegółowoWykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki
Bardziej szczegółowoMatematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Bardziej szczegółowoPODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek
PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA Piotr Wiącek ROZKŁAD PRAWDOPODOBIEŃSTWA Jest to miara probabilistyczna określona na σ-ciele podzbiorów borelowskich pewnej przestrzeni metrycznej. σ-ciało podzbiorów
Bardziej szczegółowoSTATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Bardziej szczegółowoMatematyka z el. statystyki, # 3 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Akademicka 15, p.211a bud. Agro II, e-mail: zdzislaw.otachel@up.lublin.pl
Bardziej szczegółowoWSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.
Tematy: WSTĘP 1. Wprowadzenie do przedmiotu. Próbkowe odpowiedniki wielkości populacyjnych. Modele statystyczne i przykładowe zadania wnioskowania statystycznego. Statystyki i ich rozkłady. 2. Estymacja
Bardziej szczegółowoPrawa wielkich liczb, centralne twierdzenia graniczne
, centralne twierdzenia graniczne Katedra matematyki i ekonomii matematycznej 17 maja 2012, centralne twierdzenia graniczne Rodzaje zbieżności ciągów zmiennych losowych, centralne twierdzenia graniczne
Bardziej szczegółowo6.4 Podstawowe metody statystyczne
156 Wstęp do statystyki matematycznej 6.4 Podstawowe metody statystyczne Spóbujemy teraz w dopuszczalnym uproszczeniu przedstawić istotę analizy statystycznej. W szczególności udzielimy odpowiedzi na postawione
Bardziej szczegółowoJeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.
Wykład 4 Rozkłady i ich dystrybuanty Dwa typy zmiennych losowych Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x, x 2,...}, to mówimy, że jest to zmienna dyskretna.
Bardziej szczegółowoWażne rozkłady i twierdzenia c.d.
Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby
Bardziej szczegółowo1.1 Wstęp Literatura... 1
Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................
Bardziej szczegółowoStatystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012
Wykład 2 Wrocław, 11 października 2012 Próba losowa Definicja. Zmienne losowe X 1, X 2,..., X n nazywamy próba losową rozmiaru n z rozkładu o gęstości f (x) (o dystrybuancie F (x)) jeśli X 1, X 2,...,
Bardziej szczegółowoRozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
Bardziej szczegółowoStatystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Bardziej szczegółowoRozkłady prawdopodobieństwa
Tytuł Spis treści Wersje dokumentu Instytut Matematyki Politechniki Łódzkiej 10 grudnia 2011 Spis treści Tytuł Spis treści Wersje dokumentu 1 Wartość oczekiwana Wariancja i odchylenie standardowe Rozkład
Bardziej szczegółowoNa podstawie dokonanych obserwacji:
PODSTAWOWE PROBLEMY STATYSTYKI MATEMATYCZNEJ Niech mamy próbkę X 1,..., X n oraz przestrzeń prób X n, i niech {X i } to niezależne zmienne losowe o tym samym rozkładzie P θ P. Na podstawie obserwacji chcemy
Bardziej szczegółowoStatystyka. Wydział Zarządzania Uniwersytetu Łódzkiego
Statystyka Wydział Zarządzania Uniwersytetu Łódzkiego 2017 Podstawowe rozkłady zmiennych losowych Rozkłady zmiennych skokowych Rozkład zero-jedynkowy Rozpatrujemy doświadczenie, którego rezultatem może
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Bardziej szczegółowoRachunek prawdopodobieństwa i statystyka
Rachunek prawdopodobieństwa i statystyka Przestrzeń probabilistyczna Niech Ω będzie dowolnym zbiorem, zwanym przestrzenią zdarzeń elementarnych. Elementy ω tej przestrzeni nazywamy zdarzeniami elementarnymi.
Bardziej szczegółowoRozkłady prawdopodobieństwa zmiennych losowych
Rozkłady prawdopodobieństwa zmiennych losowych Rozkład dwumianowy Rozkład normalny Marta Zalewska Zmienna losowa dyskretna (skokowa) jest to zmienna, której zbór wartości jest skończony lub przeliczalny.
Bardziej szczegółowoLiteratura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.
Literatura Krysicki W., Bartos J., Dyczka W., Królikowska K, Wasilewski M., Rachunek Prawdopodobieństwa i Statystyka Matematyczna w Zadaniach, cz. I. Leitner R., Zacharski J., Zarys matematyki wyŝszej
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 3 1 / 8 ZADANIE z rachunku
Bardziej szczegółowo6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego
6. Zmienne losowe typu ciagłego (2.04.2007) Pole trapezu krzywoliniowego Przypomnienie: figurę ograniczoną przez: wykres funkcji y = f(x), gdzie f jest funkcją ciągłą; proste x = a, x = b, a < b, oś OX
Bardziej szczegółowoJednowymiarowa zmienna losowa
1 Jednowymiarowa zmienna losowa Przykład Doświadczenie losowe - rzut kostką do gry. Obserwujemy ilość wyrzuconych oczek. Teoretyczny model eksperymentu losowego - przestrzeń probabilistyczna (Ω, S, P ),
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE
Bardziej szczegółowoZmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015
Zmienne losowe, statystyki próbkowe Wrocław, 2 marca 2015 Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20
Bardziej szczegółowoTestowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Bardziej szczegółowoNiech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.
Prawdopodobieństwo i statystyka 3..00 r. Zadanie Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX 4 i EY 6. Rozważamy zmienną losową Z. X + Y Wtedy (A) EZ 0,
Bardziej szczegółowoZmienne losowe. dr Mariusz Grzadziel. rok akademicki 2016/2017 semestr letni. Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu
Zmienne losowe dr Mariusz Grzadziel Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu rok akademicki 2016/2017 semestr letni Definicja 1 Zmienna losowa nazywamy dyskretna (skokowa), jeśli zbiór
Bardziej szczegółowoWykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Bardziej szczegółowoRachunek Prawdopodobieństwa i Statystyka
Rachunek Prawdopodobieństwa i Statystyka W 2. Probabilistyczne modele danych Zmienne losowe. Rozkład prawdopodobieństwa i dystrybuanta. Wartość oczekiwana i wariancja zmiennej losowej Dr Anna ADRIAN Zmienne
Bardziej szczegółowoPrawdopodobieństwo i statystyka r.
Zadanie. Niech (X, Y) ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (μ, μ, wariancji każdej ze współrzędnych równej σ oraz kowariancji równej X Y ρσ. Staramy się obserwować niezależne realizacje
Bardziej szczegółowoZmienne losowe ciągłe i ich rozkłady
Statystyka i opracowanie danych W3 Zmienne losowe ciągłe i ich rozkłady Dr Anna ADRIAN Paw B5, pok47 adan@agh.edu.pl Plan wykładu Rozkład Poissona. Zmienna losowa ciągła Dystrybuanta i funkcja gęstości
Bardziej szczegółowoWażne rozkłady i twierdzenia
Ważne rozkłady i twierdzenia Rozkład dwumianowy i wielomianowy Częstość. Prawo wielkich liczb Rozkład hipergeometryczny Rozkład Poissona Rozkład normalny i rozkład Gaussa Centralne twierdzenie graniczne
Bardziej szczegółowoRachunek prawdopodobieństwa (Elektronika, studia niestacjonarne) Wykład 3
Rachunek prawdopodobieństwa (Elektronika, studia niestacjonarne) Wykład 3 Przygotowując wykład korzystam głównie z książki Jakubowski, Sztencel Wstęp do teorii prawdopodobieństwa. Zmienna losowa i jej
Bardziej szczegółowoRACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.
RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3. ZMIENNA LOSOWA JEDNOWYMIAROWA. Zmienną losową X nazywamy funkcję (praktycznie każdą) przyporządkowującą zdarzeniom elementarnym liczby rzeczywiste. X : Ω R (dokładniej:
Bardziej szczegółowoRachunek prawdopodobieństwa Rozdział 4. Zmienne losowe
Rachunek prawdopodobieństwa Rozdział 4. Zmienne losowe 4.1. Zmienne losowe dyskretne. Katarzyna Rybarczyk-Krzywdzińska Definicja/Rozkład Zmienne losowe dyskretne Definicja Zmienną losową, która skupiona
Bardziej szczegółowoWykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa
Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa Marek Kubiak Instytut Informatyki Politechnika Poznańska Plan wykładu Podstawowe pojęcia rachunku prawdopodobieństwa Rozkład
Bardziej szczegółowoWeryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Bardziej szczegółowoZmienne losowe. dr Mariusz Grządziel Wykład 12; 20 maja 2014
Zmienne losowe dr Mariusz Grządziel Wykład 2; 20 maja 204 Definicja. Zmienna losowa nazywamy dyskretna (skokowa), jeśli zbiór jej wartości x, x 2,..., można ustawić w ciag. Zmienna losowa X, która przyjmuje
Bardziej szczegółowoRozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej
Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Zbiór możliwych wyników eksperymentu będziemy nazywać przestrzenią zdarzeń elementarnych i oznaczać Ω, natomiast
Bardziej szczegółowoStatystyka. Magdalena Jakubek. kwiecień 2017
Statystyka Magdalena Jakubek kwiecień 2017 1 Nauka nie stara się wyjaśniać, a nawet niemal nie stara się interpretować, zajmuje się ona głównie budową modeli. Model rozumiany jest jako matematyczny twór,
Bardziej szczegółowoRozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,
Wykład 4. Rozkłady i ich dystrybuanty 6 marca 2007 Jak opisać cały rozkład jedną funkcją? Aby znać rozkład zmiennej X, musimy umieć obliczyć P (a < X < b) dla dowolnych a < b. W tym celu wystarczy znać
Bardziej szczegółowoRachunek prawdopodobieństwa Rozdział 4. Zmienne losowe
Rachunek prawdopodobieństwa Rozdział 4. Zmienne losowe 4.0. Rozkłady zmiennych losowych, dystrybuanta. Katarzyna Rybarczyk-Krzywdzińska Wprowadzenie Rozważmy eksperymenty 1 gra Bolka w ruletkę w kasynie;
Bardziej szczegółowoPrzestrzeń probabilistyczna
Przestrzeń probabilistyczna (Ω, Σ, P) Ω pewien niepusty zbiór Σ rodzina podzbiorów tego zbioru P funkcja określona na Σ, zwana prawdopodobieństwem. Przestrzeń probabilistyczna (Ω, Σ, P) Ω pewien niepusty
Bardziej szczegółowo1 Elementy kombinatoryki i teorii prawdopodobieństwa
1 Elementy kombinatoryki i teorii prawdopodobieństwa 1.1 Elementy kombinatoryki W rozwiązywaniu pewnych problemów związanych z obliczaniem prawdopodobieństwa o skończonej liczbie zdażeń elementarnych bardzo
Bardziej szczegółowoHipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.
Hipotezy proste Zadanie 1. Niech X ma funkcję gęstości f a (x) = (1 + a)x a, dla 0 < x < 1, Testujemy H 0 : a = 1 przeciwko H 1 : a = 2. Dysponujemy pojedynczą obserwacją X. Wyznaczyć obszar krytyczny
Bardziej szczegółowoWykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.
Rachunek prawdopodobieństwa MAT1332 Wydział Matematyki, Matematyka Stosowana Wykładowca: dr hab. Agnieszka Jurlewicz Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów. Warunkowa
Bardziej szczegółowoDefinicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego
Rozdział 1 Statystyki Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego X = (X 1,..., X n ). Uwaga 1 Statystyka jako funkcja wektora zmiennych losowych jest zmienną losową
Bardziej szczegółowoWażne rozkłady prawdopodobieństwa
Część V Dodatki 59 Dodatek A Ważne rozkłady prawdopodobieństwa Rozkład DWUMIANOWY X Bin(n, p) Funkcja prawdopodobieństwa: f(k) = P(X = k) = ( ) n p k ( p) n k, k (k = 0,,..., n). Momenty: EX = np, VarX
Bardziej szczegółowoRozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład
Rozdział 1 Wektory losowe 1.1 Wektor losowy i jego rozkład Definicja 1 Wektor X = (X 1,..., X n ), którego każda współrzędna jest zmienną losową, nazywamy n-wymiarowym wektorem losowym (krótko wektorem
Bardziej szczegółowoCentralne twierdzenie graniczne
Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski Wykład 4 Ważne uzupełnienie Dwuwymiarowy rozkład normalny N (µ X, µ Y, σ X, σ Y, ρ): f XY (x, y) = 1 2πσ X σ Y 1 ρ 2 { [ (x ) 1
Bardziej szczegółowoF t+ := s>t. F s = F t.
M. Beśka, Całka Stochastyczna, wykład 1 1 1 Wiadomości wstępne 1.1 Przestrzeń probabilistyczna z filtracją Niech (Ω, F, P ) będzie ustaloną przestrzenią probabilistyczną i niech F = {F t } t 0 będzie rodziną
Bardziej szczegółowoZmienne losowe ciągłe i ich rozkłady
Rachunek Prawdopodobieństwa i Statystyka - W3 Zmienne losowe ciągłe i ich rozkłady Dr Anna ADRIAN Paw B5, pok47 adan@agh.edu.pl Plan wykładu Zmienna losowa ciągła Dystrybuanta i unkcja gęstości rozkładu
Bardziej szczegółowo2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7
Spis treści Spis treści 1 Przedziały ufności 1 1.1 Przykład wstępny.......................... 1 1.2 Określenie i konstrukcja...................... 3 1.3 Model dwupunktowy........................ 5 1.4
Bardziej szczegółowoTemat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka
Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga 1 Zagadnienia 1. Przypomnienie wybranych pojęć rachunku prawdopodobieństwa. Zmienna losowa. Rozkład
Bardziej szczegółowoZmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014
Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014 Zmienne losowe i ich rozkłady Doświadczenie losowe: Rzut monetą Rzut kostką Wybór losowy n kart z talii 52 Gry losowe
Bardziej szczegółowoĆwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu.
Ćwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu. A Teoria Definicja A.1. Niech (Ω, F, P) będzie przestrzenią probabilistyczną. Zmienną losową określoną na przestrzeni Ω nazywamy dowolną
Bardziej szczegółowoGdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
Bardziej szczegółowoWykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.
Rachunek prawdopodobieństwa MAP1181 Wydział PPT, MS, rok akad. 213/14, sem. zimowy Wykładowca: dr hab. Agnieszka Jurlewicz Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.
Bardziej szczegółowoIII. ZMIENNE LOSOWE JEDNOWYMIAROWE
III. ZMIENNE LOSOWE JEDNOWYMIAROWE.. Zmienna losowa i pojęcie rozkładu prawdopodobieństwa W dotychczas rozpatrywanych przykładach każdemu zdarzeniu była przyporządkowana odpowiednia wartość liczbowa. Ta
Bardziej szczegółowoWYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki
WYKŁAD 6 Witold Bednorz, Paweł Wolff 1 Instytut Matematyki Uniwersytet Warszawski Rachunek Prawdopodobieństwa, WNE, 2010-2011 Własności Wariancji Przypomnijmy, że VarX = E(X EX) 2 = EX 2 (EX) 2. Własności
Bardziej szczegółowoWykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
Bardziej szczegółowoRozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.
Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. D A R I U S Z P I W C Z Y Ń S K I 2 2 ROZKŁAD ZMIENNEJ LOSOWEJ Polega na przyporządkowaniu
Bardziej szczegółowoPrawdopodobieństwo i statystyka
Wykład VIII: Przestrzenie statystyczne. Estymatory 1 grudnia 2014 Wprowadzenie Przykład: pomiar z błędem Współczynnik korelacji r(x, Z) = 0, 986 Wprowadzenie Przykład: pomiar z błędem Współczynnik korelacji
Bardziej szczegółowoElementy Rachunek prawdopodobieństwa
Elementy rachunku prawdopodobieństwa Rachunek prawdopodobieństwa zajmuje się analizą praw rządzących zdarzeniami losowymi Pojęciami pierwotnymi są: zdarzenie elementarne ω oraz zbiór zdarzeń elementarnych
Bardziej szczegółowoElementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
Bardziej szczegółowoZwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X
Własności EX, D 2 X i DX przy przekształceniach liniowych Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X Przemnożenie wartości zmiennej losowej przez wartość stałą: Y=a*X
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa
STATYSTYKA MATEMATYCZNA rachunek prawdopodobieństwa treść Zdarzenia losowe pojęcie prawdopodobieństwa prawo wielkich liczb zmienne losowe rozkłady teoretyczne zmiennych losowych Zanim zajmiemy się wnioskowaniem
Bardziej szczegółowoWybrane rozkłady zmiennych losowych. Statystyka
Wybrane rozkłady zmiennych losowych Statystyka Rozkład dwupunktowy Zmienna losowa przyjmuje tylko dwie wartości: wartość 1 z prawdopodobieństwem p i wartość 0 z prawdopodobieństwem 1- p x i p i 0 1-p 1
Bardziej szczegółowoTestowanie hipotez statystycznych.
Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011 Temat. Weryfikacja hipotez statystycznych dotyczących proporcji. Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio
Bardziej szczegółowoRachunek prawdopodobieństwa Rozdział 4. Zmienne losowe
Rachunek prawdopodobieństwa Rozdział 4. Zmienne losowe 4.0. Rozkłady zmiennych losowych, dystrybuanta. Katarzyna Rybarczyk-Krzywdzińska semestr zimowy 2016/2017 Wprowadzenie Przykład 1 Bolek, Lolek i Tola
Bardziej szczegółowoEstymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014
Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu
Bardziej szczegółowoStatystyka i eksploracja danych
Projekt pn. Wzmocnienie potencjału dydaktycznego UMK w Toruniu w dziedzinach matematyczno-przyrodniczych realizowany w ramach Poddziałania 4.1.1 Programu Operacyjnego Kapitał Ludzki Statystyka i eksploracja
Bardziej szczegółowo5 Przegląd najważniejszych rozkładów
5 Przegląd najważniejszych rozkładów 5. Rozkład Bernoulliego W niezmieniających się warunkach wykonujemy n razy pewne doświadczenie. W wyniku każdego doświadczenia może nastąpić zdarzenie A lub A. Zakładamy,
Bardziej szczegółowoStatystyka w przykładach
w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie
Bardziej szczegółowo1 Podstawy rachunku prawdopodobieństwa
1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej
Bardziej szczegółowoLaboratorium nr 7. Zmienne losowe typu skokowego.
Laboratorium nr 7. Zmienne losowe typu skokowego.. Zmienna losowa X ma rozkład dany tabelką: - 0 3 0, 0,3 0, 0,3 0, Naszkicować dystrybuantę zmiennej X. Obliczyć EX oraz VarX.. Zmienna losowa ma rozkład
Bardziej szczegółowoEstymacja parametrów rozkładu cechy
Estymacja parametrów rozkładu cechy Estymujemy parametr θ rozkładu cechy X Próba: X 1, X 2,..., X n Estymator punktowy jest funkcją próby ˆθ = ˆθX 1, X 2,..., X n przybliżającą wartość parametru θ Przedział
Bardziej szczegółowoWykład 3 Jednowymiarowe zmienne losowe
Wykład 3 Jednowymiarowe zmienne losowe Niech (Ω, F, P ) będzie ustaloną przestrzenią probabilistyczną Definicja 1 Jednowymiarowa zmienna losowa (o wartościach rzeczywistych), określoną na przestrzeni probabilistycznej
Bardziej szczegółowo166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Bardziej szczegółowo1 Relacje i odwzorowania
Relacje i odwzorowania Relacje Jacek Kłopotowski Zadania z analizy matematycznej I Wykazać, że jeśli relacja ρ X X jest przeciwzwrotna i przechodnia, to jest przeciwsymetryczna Zbadać czy relacja ρ X X
Bardziej szczegółowoElementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Bardziej szczegółowoGenerowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport
Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport Michał Krzemiński Streszczenie Projekt dotyczy metod generowania oraz badania własności statystycznych ciągów liczb pseudolosowych.
Bardziej szczegółowoKomputerowa analiza danych doświadczalnych
Komputerowa analiza danych doświadczalnych Wykład 4.03.06 dr inż. Łukasz Graczykowski lgraczyk@if.pw.edu.pl Semestr letni 05/06 Zmienne losowe, jednowymiarowe rozkłady zmiennych losowych Pomiar jako zdarzenie
Bardziej szczegółowo