DOKŁADNA METODA BOOTSTRAPOWA I JEJ ZASTOSOWANIE DO ESTYMACJI WARIANCJI 1. WPROWADZENIE JOANNA KISIELIŃSKA
|
|
- Witold Skiba
- 8 lat temu
- Przeglądów:
Transkrypt
1 PRZEGLĄD STATYSTYCZNY R. LVIII ZESZYT JOANNA KISIELIŃSKA DOKŁADNA METODA BOOTSTRAPOWA I JEJ ZASTOSOWANIE DO ESTYMACJI WARIANCJI 1. WPROWADZENIE Daa jest zmiea losowa X o iezaym rozkładzie F. Iteresuje as parametr rozkładu, który ozaczymy jako θ. Jeśli parametru ie moża wyzaczyć bezpośredio, koiecze jest pobraie próby losowej oraz dobraie odpowiediego estymatora parametru θ. Estymator jest statystyką określoą a przestrzei prób. Próbę losową ozaczymy jako X =(X 1, X 2,..., X ), jej realizację jako x =(x 1, x 2,..., x ), zaś estymator parametru θ jako ˆθ = t (X). Efro [4] zapropoował metodę, którą azwał bootstrap polegającą a losowaiu z uzyskaej próby (próby pierwotej) x, kolejych prób wtórych (prób bootstrapowych) o liczebości. Losowaie odbywa się ze zwracaiem przy założeiu jedakowych prawdopodobieństw rówych 1/ wylosowaia, każdej z wartości x i, dla,...,. Geeroway jest w te sposób rozkład ˆF, zway rozkładem bootstrapowym z próby. Próba bootstrapowa ozaczaa jest jako X = ( X 1, X 2,, X ), a dowola jej realizacja jako x = ( x 1, x 2,, x ). Statystyka ˆθ dla próby bootstrapowej ozaczaa jest jako ˆθ = t (X ). Istotą metody jest aproksymacja rozkładu statystyki ˆθ, rozkładem statystyki bootstrapowej ˆθ. Efro [4] zapropoował trzy metody wyzaczaia rozkładu ˆθ : 1. przeprowadzeie właściwych rozważań teoretyczych, 2. zastosowaie aproksymacji Mote Carlo, 3. aproksymację rozkładu ˆθ poprzez rozwiięcie fukcji t w szereg Taylora. Jeśli wybrae zostaie rozwiązaie 2 koiecze jest określeie liczby losowaych prób bootstrapowych N. Efro [5] opierając się a bootstrapowej wariacji stwierdza, że wystarczy iewielka liczba losowań, aby otrzymać wystarczającą dokładość. Z taką oceą ie zgadzają się Booth i Sarkar [1], którzy zastosowali aproksymację rozkładu względej wariacji bootstrapowej rozkładem ormalym. Pozwoliło to a oszacowaie N dla określoego poziomu błędu a założoym poziomie ufości. Okazało się, że uzyskaie błędu poiżej 10% przy poziomie ufości 0,95 wymaga przyjęcia N około 800. Domański i Pruska [3] (str. 261) stwierdzają, że przyjmuje się N Prowadząc rozważaia ad metodą bootstrapową zadać moża sobie pytaie, czy losowaie próby bootstrapowej X, z wcześiej już uzyskaej próby pierwotej X jest koiecze? Losowaie próby jest iezbęde, jeśli zbadaie całej populacji ie jest
2 Dokłada metoda bootstrapowa i jej zastosowaie do estymacji wariacji 61 możliwe lub jest zbyt kosztowe. Posługiwaie się próbą zamiast populacją ma swoje istote implikacje będące w obszarze zaiteresowań statystyki matematyczej. Zwróćmy uwagę, że podstawową własością próby jest jej skończoy rozmiar. Określoy dla iej rozkład bootstrapowy ˆF jest prostym rozkładem dyskretym. Rozkład dowoliej statystyki określoej dla dyskretych zmieych losowych o skończoej liczbie realizacji, ie musi być szacoway, poieważ może być po prostu wyzaczoy. Kwestią otwartą pozostaje jedyie, jak dużego akładu obliczeń wymaga takie podejście, o czym mowa będzie dalej. Rozkład bootstrapowy jest w istocie rozkładem empiryczym określoym dystrybuatą 1) : F (t) = # {1 i :X i t} dla t R 1 (1) gdzie X 1, X 2,..., X jest ciągiem ciągłych i iezależych zmieych losowych o jedakowych rozkładach określoych dystrybuatą F. Z twierdzeia Gliwieki-Catelliego (podstawowego twierdzeia statystyki matematyczej) wyika, że: D = sup F (x) F (x) (2) <x<+ dąży do 0 z prawdopodobieństwem 1. Twierdzeie to upoważia do wioskowaia statystyczego formułowaia stwierdzeń dotyczących populacji a podstawie próby. 2. DOKŁADNA METODA BOOTSTRAPOWA Załóżmy, że z populacji opisaej zmieą losową X wylosowao elemetową próbę pierwotą x =(x 1, x 2,..., x ). Poieważ dla iektórych i j może zachodzić x i = x j, zredukujmy 2) rozmiar wylosowaej próby do k różych wartości. Prawdopodobieństwa p i wylosowaia z próby realizacji x i, gdzie, 2,..., k ie muszą być wówczas jedakowe (jak to ma miejsce dla próby bootstrapowej). W próbie x, każda wartość x i jest realizacją zmieej losowej X o rozkładzie F. Zgodie z twierdzeiem Gliwieki-Catelliego, rozkład F może być przybliżoy rozkładem empiryczym F. Wprowadźmy pojecie dyskretej zmieej losowej próby, którą ozaczyć moża jako X D. Zbiorem realizacji tej zmieej jest pierwota próba losowa {x 1, x 2,..., x k }. Poszczególe wartości przyjmowae są z prawdopodobieństwami p D i = P ( X D = x i ) = p i 3), dla i= 1,2,...,k. Rozkład te jest rówoważy rozkładowi empiryczemu 1) Zapis zgodie z Zieliński [9] str. 11, gdzie # ozacza liczebość. 2) Redukcja ta ie jest koiecza, lecz wskazaa, poieważ pozwala a zmiejszeie wymiaru problemu. 3) Prawdopodobieństwa te byłyby jedakowe i rówe 1/ gdyby ie przeprowadzoo redukcji wymiaru próby do k różych wartości.
3 62 Joaa Kisielińska i ozaczoy zostaie jako F D. W takim przypadku elemetową wtórą próbę losową moża zapisać jako X D = ( X1 D, XD 2,, ) XD, a dowolą jej realizację jako x D = ( x1 D, xd 2,, ) xd. Zmiee X D i, dla i= 1,2,..., mają rozkłady F D. Statystykę ˆθ dla próby bootstrapowej ozaczyć moża wówczas jako ˆθ D = t ( X D). Rozkład statystyki ˆθ przybliżać będziemy rozkładem statystyki ˆθ D. Zauważmy, że problemy związae z ewetualym obciążeiem, zgodością i efektywością estymatora dotyczą estymatora ˆθ. W dokładej metodzie bootstrapowej wartość estymatora ˆθ D jest obliczaa, a ie szacowaa a podstawie próby. Metoda ie wprowadza więc dodatkowego obciążeia. Dla pojedyczej b-tej realizacji wtórej próby x Db = ( ) x Db,, xdb ależy obliczyć wartość ˆθ D (b) = t ( x Db) = t ( x1 Db, ) xdb 2,, xdb oraz prawdopodobieństwo jej wylosowaia. Ze względu a redukcję wymiaru elemetowej próby do k różych wartości, prawdopodobieństwa wylosowaia poszczególych prób bootstrapowych ie są już jedakowe. Prawdopodobieństwo wylosowaia b-tej próby jest rówe p Db = P ( ˆθ D = ˆθ D (b) ) = p Db i, gdzie p Db i = P ( X D = x Db i 1, xdb 2 ). Liczba możliwych realizacji wtórej próby jest rówa B = k. Poprawie apisay algorytm powiie zapewić B spełieie waruku: p Db = 1. b=1 Mając wyzaczoe wartości ˆθ D (b) oraz prawdopodobieństwa p Db, dla b=1,2,...,b moża określić rozkład estymatora ˆθ D. Estymator te, będąc fukcją dyskretych zmieych losowych o jedakowym rozkładzie F D, jest rówież zmieą losową dyskretą. Rozkład estymatora pozwala budować przedziały ufości, czy testować hipotezy statystycze. Jeżeli zay jest rozkład estymatora moża wyzaczyć jego wartość oczekiwaą i odchyleie stadardowe. Wartość oczekiwaa jest bootstrapowym oszacowaiem parametru θ, zaś odchyleie stadardowe błędem tego szacuku. Wartość oczekiwaa i odchyleie stadardowe obliczyć ależy tak jak dla zmieej dyskretej. Ozaczając oceę parametru jako ˆθ D ( ), a błąd jako s Ḓ θ D 4) otrzymujemy: ˆθ D ( ) = B B ( ˆθ D (b) p Db, s Ḓ = θ ˆθ D (b) ˆθ D ( ) ) 2 p Db (3) D b=1 Chcąc zastosować metodę dokładego bootstrapu warto zastaowić się, jak ma się liczba wszystkich możliwych prób wtórych B wobec zalecaej liczby prób wtórych w klasyczej metodzie bootstrapowej. Np. dla k=10 i =20 otrzymujemy B =10 20, 4) Formuła (3) obowiązuje gdy brae są pod uwagę wszystkie próby bootstrapowe. Jeśli rozważay jest jedyie ich podzbiór ależałoby dokoać korekty o czyik 1. b=1
4 Dokłada metoda bootstrapowa i jej zastosowaie do estymacji wariacji 63 co jest liczbą bardzo dużą, zaczie większą iż przykładowe N=1000. Jak pokazae zostaie dalej tak dużą liczbę powtórzeń moża aktualie wygeerować. Pioierska praca Efroa pochodzi z roku W tamtym okresie wykoaie tej liczby obliczeń w sesowym czasie było iemożliwe. Poieważ ie moża było zbadać całej populacji określoej próbą pierwotą, koiecze było pobieraie z próby traktowaej jako populację kolejych prób prób wtórych. W metodzie bootstrapowej ciąg uzyskaych wartości estymatora porządkoway jest w kolejości od ajmiejszego do ajwiększego, co pozwala p. wyzaczyć graice przedziałów ufości metodą percetyli (Efro, Tibshirai [6]). W dokładej metodzie bootstrapowej teoretyczie moża rówież tak postąpić. Liczba możliwych realizacji statystyki ˆθ D jest wprawdzie bardzo duża, ale po pierwsze, część realizacji z pewością będzie się powtarzać, a po drugie i tak wskazae jest pogrupowaie rezultatów w histogramie. Utworzeie histogramu będzie dla dużych problemów iezbęde 5), ale wiązać się będzie z utratą pewej iformacji. Podkreślić ależy, że mimo tego dokładą metodą bootstrapową moża uzyskać bardzo dokłade oszacowaie graic przedziałów ufości, poieważ szerokość przedziałów w histogramie ie musi być jedakowa. W zakresach wymagających podaia dokładych prawdopodobieństw (czy dystrybuaty), szerokość przedziału może być bardzo, iemal dowolie mała. Najprostszym sposobem wygeerowaia wszystkich wtórych prób dla rozkładu dyskretego będzie rekurecyje pobieraie kolejych elemetów z próby. Jeśli wystąpiły powtórzeia, zbiór z którego pobierae są wartości redukuje się do wymiaru k. Tak skostruoway algorytm zaliczyć moża do kategorii brute force. Algorytmy tego typu są uzawae za ieefektywe. Liczbę geerowaych realizacji prób bootstrapowych moża zredukować, poieważ w próbie wtórej iektóre wartości będą się powtarzać losowaie odbywa się z powtórzeiami. Problem taki dla przypadku gdy prawdopodobieństwo wylosowaia każdego elemetu próby jest jedakowe i elemety są jedakowe, przedstawioy jest w książce Fellera [7] w rozdziale II.5 str. 38 6). Dalsze rozważaia prowadzoe będą dla przypadku, gdy prawdopodobieństwa te ie są jedakowe, a losowae elemety mogą być róże. Każdą elemetową wtórą b-tą próbę bootstrapową losowaą ze zbioru k elemetowego moża zapisać jako: x Db = (a 1b x 1, a 2b x 2,, a kb x k ) (4) gdzie każde a ib 0, dla i= 1, 2,..., k jest liczbą wystąpień w próbie b-tej i-tego elemetu próby pierwotej. Liczby te muszą spełiać waruek: k a ib = (5) 5) Przykładowo liczba realizacji wymaga poad 80 eksbibajtów komórek pamięci. 6) Jak zauważa Booth [2] w prezetacji elektroiczej: Mote Carlo ad the boothstrap.
5 64 Joaa Kisielińska przy czym część z ich może być rówa 0. Jeżeli dla wybraego i zachodzi a ib =0, ozacza to, że elemet x i ie wystąpił w b-tej próbie wtórej. Prawdopodobieństwo wylosowaia pojedyczej próby określoej (4) jest rówe: p Db = k ( ) p Db aib i (6) Pozostaje jeszcze określeie ile prób moża wygeerować dla daego ciągu liczb a ib 0, dla,2,...,k, spełiających waruek (5). Trzeba uwzględić wszystkie m b elemetowe kombiacje, gdzie m b = # {a ib 0:i = 1, 2,..., k} ze zbioru k elemetowego. Kombiacje ależy astępie permutować, ale jedyie a pozycjach, dla których współczyiki a ib są uikale. 3. ROZKŁAD GRANICZNY ESTYMATORA WARIANCJI Z PRÓBY BOOTSTRAPOWEJ Dokłada metoda bootstrapowa wykorzystaa zostaie do szacowaia wariacji pewej zmieej losowej o iezaym rozkładzie. Weryfikację poprawości metody moża przeprowadzić porówując rozkład estymatora wariacji z rozkładem graiczym, który stosować moża gdy próba jest duża ( 30). Pobierając elemetową próbę losową określamy dyskretą zmieą losową próby X D o zbiorze realizacji {x 1,x 2,..., x k } i rozkładzie prawdopodobieństwa określoym k wartościami p i =P(X D = x i ), dla i= 1,2,..., k, przy czym p i = 1. Wartość oczekiwaa μ D, odchyleie stadardowe σ D oraz czwarty momet cetraly μ D 4 zmieej X D są rówe odpowiedio: μ D = k x i p i, σ D = k ( k xi μ D)2 p i, μ D 4 = ( xi μ D) 4 pi (7) Wiadomo, że rozkład wariacji z próby S 2 = 1 ( Xi X ) 2 pobraej z populacji o rozkładzie ormalym N(μ,σ) jest rozkładem asymptotyczie ormalym N 1 σ 2, 2 σ4. Rozkład graiczy wariacji z próby S 2 pobraej z populacji o dowolym rozkładzie z parametrami μ i σ będzie też rozkładem ormalym (wariacja jest uśredioym
6 Dokłada metoda bootstrapowa i jej zastosowaie do estymacji wariacji 65 kwadratem odchyleń od wartości przeciętych). Wartość oczekiwaa rozkładu graiczego oraz jego wariacja są określoe wzorem 7) : ES 2 = 1 σ 2, D 2 S 2 = μ 4 σ 4 2 (μ 4 2 σ 4) + μ 4 3 σ 4 (8) 2 3 gdzie: μ 4 jest mometem cetralym rzędu czwartego rozpatrywaego rozkładu. Rozkłady, o których mowa powyżej są rozkładami graiczymi dla estymatora S 2, a ie estymatora Ŝ 2 1 ( = Xi X ) 2. Poieważ Ŝ 2 = 1 1 S2, ależy dokoać korekty parametrów rozkładów graiczych. Wartość oczekiwaą estymatora S 2 ależy pomożyć 8) ( przez 1, a wariację przez ) 2. 1 Rozkłady graicze ieobciążoego estymatora wariacji ozaczoe zostaą jako GV1 (rozkład graiczy ie wymagający ormalości rozkładu zmieej losowej w populacji) i GV2 (wymagający ormalości rozkładu) są więc astępujące: ( GV1 : N ) σ D 2, 1 μ D 4 ( σ D) 4 2 (μ D 4 2 (σ D) ) 4 + μd 4 3 ( σ D ) ( GV2:N ) σ D 2, 1 2 (σ D) 4 (9) 4. WYNIKI Zakładamy, że daa jest zmiea losowa X o iezaym rozkładzie, którego wariację chcemy oszacować. Pobieramy elemetową próbę losową i zakładamy postać estymatora wariacji Ŝ 2 = 1 ( Xi X ) 2. Przykładowy rozkład empiryczy 1 próby przedstawioy jest w tabeli 1. Niech rozkład te reprezetuje zmiea losowa X D. Wartość oczekiwaa i wariacja zmieej X D są odpowiedio rówe μ D = 5,174 oraz ( σ D) 2 = 3, Rozkład estymatora wariacji zmieej losowej X przybliżamy rozkładem statystyki bootstrapowej. Pobraie próby losowej moża iterpretować jako dyskretyzację ciągłej zmieej X. Stosując metodę bootstrapową rozkład estymatora pewego parametru rozkładu zmieej X, przybliżamy rozkładem estymatora dyskretej zmieej X D reprezetującej próbę. Różica miedzy klasyczą metodą, a dokładą 7) Smirow, Dui-Barkowski [8] str ) Jeżeli jest bardzo duże iloraz jest praktyczie rówy jede. Dla próby 30 elemetowej 1 (a dla tej liczebości próby moża już stosować rozkłady graicze) jest rówy 1,0345, zaś jego kwadrat 1,0702 otylewięc ależałoby skorygować wariację.
7 66 Joaa Kisielińska polega jedyie a liczbie wziętych pod uwagę prób wtórych. W metodzie klasyczej losoway jest pewie podzbiór możliwych prób wtórych, w metodzie dokładej zaś brae są pod uwagę wszystkie próby wtóre. W klasyczej metodzie bootstrapowej zamiast populacji prób wtórych badamy więc jedyie pewie jej podzbiór. W dokładej metodzie bootstrapowej bierzemy pod uwagę całą populację prób wtórych. Mając do dyspozycji całą populację rozkład, bądź jego parametry ie muszą być szacowae, poieważ mogą być obliczae problem a tym etapie jest zagadieiem z zakresu statystyki opisowej, a ie matematyczej. Rozkład zmieej losowej X D reprezetującej próbę pierwotą Tabela 1 x i p i 1 0, , , , , , , , , ,010 Źródło: Opracowaie włase W tabeli 2 przedstawioo stablicoway rozkład estymatora wariacji zmieej losowej X D (staowiący przybliżeie rozkładu estymatora wariacji zmieej ciągłej X), wyzaczoy metodą dokładego bootstrapu i ozaczoy jako DBV, oraz dwa ormale rozkłady graicze dla wariacji GV1 i GV2 określoe wzorem (9). Rozkłady podao w dwóch wariatach. W pierwszym założoo =20, w drugim =30. Podkreślić ależy, że w przypadku stosowaia metod bootstrapowych wartość wyika bezpośredio z liczebości próby. Założeie dwóch wartości dla traktować ależy jedyie jako eksperymet symulacyjy mający a celu zbadaie ewetualych podobieństw i różic między faktyczym rozkładem estymatora a rozkładami graiczymi. Pewego kometarza wymaga jeszcze sposób doboru szerokości przedziału tablicowaia. W ogólym przypadku może być oa dowolie mała. Dla rozkładów graiczych (ciągłych), dla każdego dowolie małego przedziału istieje większe od 0
8 Dokłada metoda bootstrapowa i jej zastosowaie do estymacji wariacji 67 Tabela 2 Rozkład estymatora wariacji zmieej losowej X D uzyskay dokładą metodą bootstrapową oraz rozkłady graicze =20 =30 DBV GV1 GV2 DBV GV1 GV2 Średia 3, , , , , ,98972 Odchyleie st. 0, , , , , ,06566 Przedziały DBV GV1 GV2 DBV GV1 GV2 <0,00; 0,25) 2,77E-08 2,31E-05 0, ,73E-12 1,91E-07 0, <0,25; 0,50) 9,47E-07 4,87E-05 0, ,52E-09 8,87E-07 0, <0,50; 0,75) 5,73E-06 1,36E-04 0, ,14E-08 4,36E-06 0, <0,75; 1,00) 2,91E-05 0, , ,66E-07 1,92E-05 0, <1,00; 1,25) 9,40E-05 0, , ,84E-06 7,50E-05 0, <1,25; 1,50) 0, , , ,03E-05 0, , <1,50; 1,75) 0, , , , , , <1,75; 2,00) 0, , , , , , <2,00; 2,25) 0, , , , , , <2,25; 2,50) 0, , , , , , <2,50; 2,75) 0, , , , , , <2,75; 3,00) 0, , , , , , <3,00; 3,25) 0, , , , , , <3,25; 3,50) 0, , , , , , <3,50; 3,75) 0, , , , , , <3,75; 4,00) 0, , , , , , <4,00; 4,25) 0, , , , , , <4,25; 4,50) 0, , , , , , <4,50; 4,75) 0, , , , , , <4,75; 5,00) 0, , , , , , <5,00; 5,25) 0, , , , , , <5,25; 5,50) 0, , , , , , <5,50; 5,75) 0, , , , , , <5,75; 6,00) 0, , , , , , <6,00; 6,25) 0, , , , , , <6,25; 6,50) 0, , , , , , <6,50; 6,75) 0, , , , , , <6,75; 7,00) 0, , , , ,74E-05 0, <7,00; 7,25) 0, , , , ,7E-05 0, <7,25; 7,50) 0, ,26E-04 0, ,56E-05 3,85E-06 0, <7,50; + ) 0, ,46E-05 0, ,83E-05 7,74E-07 0, Źródło: Badaia włase
9 68 Joaa Kisielińska prawdopodobieństwo, że zmiea losowa przyjmuje wartości z tego przedziału. Dla rozkładu dyskretego, a takim jest bootstrapowy (zarówo klasyczy jak i dokłady) rozkład estymatora wariacji zmieej X D, tak ie jest. Im miejsza szerokość, tym większej liczbie przedziałów będzie odpowiadało prawdopodobieństwo rówe 0. W tabeli 2 podao rówież wartości oczekiwae estymatorów wariacji zmieej X D oraz ich odchyleia stadardowe. Są to wartości dokłade obliczoe. Podae w tabeli rozkłady są tablicowae dla przedziałów. Obliczeie a ich podstawie parametrów rozkładów prowadzić ależy jak dla daych pogrupowaych, wobec czego wyiki różić się mogą od wartości dokładych. Wartości oczekiwae obydwu rozkładów graiczych GV1 i GV2 są z założeia rówe wariacji próby. W przypadku rozkładu DBV rówież otrzymao wartość oczekiwaą rówą wariacji próby, co potwierdza poprawość użytego algorytmu. Dokłada metoda bootstrapowa ie wprowadza dodatkowego obciążeia estymatora (w przeciwieństwie do metody bootstrapowej z losowaiem prób, gdzie obciążeie jest możliwe). Na uwagę zasługuje fakt, że odchyleie stadardowe rozkładu DBV jest rówe z dokładością do piątego miejsca po przeciku odchyleiu stadardowemu rozkładu GV1. Potwierdza to poprawość algorytmu realizującego dokłady bootstrap. W przypadku rozkładu graiczego GV2 odchyleie jest zawyżoe. Zawyżeie to wyika z iespełieia waruku ormalości. Różica jest wyraźa i wskazuje a koieczość obliczaia wariacji estymatora ze wzoru (8). Na wykresie 1 przedstawioo rozkłady estymatorów wariacji zmieej X D dla =20 oraz =30. Wyika z ich, że rozkład GV2 (rozkład graiczy wymagający założeia ormalości) ie staowi właściwego przybliżeia rozkładu DBV dla rozpatrywaej zmieej losowej. Ozacza to, że w przypadku estymatorów wariacji iespełieie waruku ormalości ie może być igorowae. Nie moża wówczas stosować rozkładu graiczego, wymagającego założeia, że próba pierwota ma rozkład ormaly. Rozkład GV1 atomiast jest przybliżeiem dobrym. Zauważmy poadto, że rozkład DBV jest miimalie asymetryczy, podczas gdy rozkład graiczy jest oczywiście symetryczy. Zgodość rozkładów GV1 i DBV potwierdził test zgodości Pearsoa, zarówo dla =30 jak dla =20. W tabeli 3 przedstawioo przedziały ufości dla wariacji wyzaczoe przy użyciu dokładej metody bootstrapowej DBV, rozkładu graiczego ie wymagającego założeia ormalości próby GV1 oraz wymagającego założeia ormalości GV2. Porówując rozstępy poszczególych przedziałów stwierdzamy, że ajprecyzyjiejszego oszacowaia dokoao przy pomocy dokładej metody bootstrapowej (i jest to oszacowaie dokłade), astępie rozkładu graiczego GV1 (z wyjątkiem =20 i1-α = 0,99, dla których przedział ufości rozkładu GV1 był węższy od DBV). Najszersze przedziały ufości ma rozkład GV2.
10 Dokłada metoda bootstrapowa i jej zastosowaie do estymacji wariacji 69 Wykres 1. Rozkłady estymatorów wariacji DBV, GV1 i GV2 Źródło: Badaia włase Przesuięcie w lewo przedziałów dla rozkładu GV1 wobec DBV wyika z asymetrii drugiego z ich. Przedstawioe obliczeia wskazują, że rozkład GV1 jest dobrym przybliżeiem rozkładu DBV. W celu dokładiejszej prezetacji metody przedstawioe zostaą wyiki estymacji dla małej próby obejmującej wartości {1, 2, 3, 4, 5} gdzie = k=5 przy założeiu jedakowych prawdopodobieństw wylosowaia każdego elemetu, rówych 0,2. Rozkład te reprezetuje dyskreta zmiea losowa X D o wartości oczekiwaej i wariacji
11 70 Joaa Kisielińska Tabela 3 Przedziały ufości dla wariacji wyzaczoe dokładą metodą bootstrapową oraz przy użyciu rozkładów graiczych Poziom ufości 1-α = 0,95 1-α = 0,99 =20 =30 DBV GV1 GV2 DBV GV1 GV2 graice 2,3685 2,1907 1,3868 2,6715 2,5462 1,9011 5,9565 5,7888 6,5927 5,0845 5,4332 6,0784 rozstęp 3,5880 3,5981 5,2059 2,4130 2,8870 4,1773 graice 1,9575 1,6254 0,5689 2,3265 2,0926 1,2448 6,6945 6,3541 7,4106 6,1185 5,8868 6,7347 rozstęp 4,7370 4,7287 6,8417 3,7920 3,7942 5,4899 Źródło: Badaia włase odpowiedio rówych μ D = 3, oraz ( σ D) 2 = 2. Wartość oczekiwaa ieobciążoego estymatora wariacji jest rówa 2, a jego wariacja 0,96 (zgodie ze wzorem (8) po korekcie odpowiedio o czyiki 5/4 i (5/4) 2 ). Z 5 elemetowej próby pierwotej moża wylosować 5 5 =3125 prób wtórych, przy czym prawdopodobieństwo wylosowaie każdej z ich jest w zadaych warukach jedakowe i wyosi 1/3125. Estymator wariacji dla przyjętej próby pierwotej przybiera jedyie 26 różych wartości. W tabeli 4 oraz a wykresie 2 przedstawioy został rozkład ieobciążoego estymatora wariacji wyzaczoego dokładą metodą bootstrapową. Wartość oczekiwaa i wariacja tego rozkładu są dokładie rówe 2 oraz 0,96, czego ależało oczekiwać. Warto dodać, że dla tak małej próby łatwo wykoać iezbęde kalkulacje z poziomu arkusza kalkulacyjego programu Excel, bez koieczości używaia specjalego oprogramowaia. Wykres 2. Rozkłady estymatora wariacji dla próby obejmującej wartości {1, 2, 3, 4, 5} Źródło: Badaia włase
12 Dokłada metoda bootstrapowa i jej zastosowaie do estymacji wariacji 71 Tabela 4 Rozkład estymatora wariacji uzyskay dokładą metodą bootstrapową dla 5-cio elemetowej próby obejmującej wartości {1, 2, 3, 4, 5} Wartości Prawdopodobieństwa Wartości Prawdopodobieństwa 0,0 0,0016 2,2 0,0384 0,2 0,0128 2,3 0,0896 0,3 0,0256 2,5 0,0384 0,5 0,0192 2,7 0,0704 0,7 0,0576 2,8 0,0576 0,8 0,0480 3,0 0,0128 1,0 0,0288 3,2 0,0544 1,2 0,0448 3,3 0,0384 1,3 0,0768 3,5 0,0192 1,5 0,0384 3,8 0,0128 1,7 0,1024 4,0 0,0096 1,8 0,0448 4,2 0,0192 2,0 0,0320 4,8 0,0064 Źródło: Badaia włase 5. PODSUMOWANIE W artykule omówioo dokładą metodę bootstrapową, którą moża wykorzystać do szacowaia estymatorów parametrów zmieych losowych o iezaym rozkładzie. Metoda pozwala wyzaczyć oszacowaie dowolego parametru, błąd tego oszacowaia, rozkład estymatora, czy przedziały ufości. Tradycyjie zadaie takie realizowae jest przy pomocy metody bootstrapowej, która polega a losowaiu prób wtórych z pierwotej próby losowej. Losowaie próby stosowae jest w statystyce, jeśli ie może być zbadaa cała populacja, lub badaie całej populacji jest zbyt kłopotliwe. Próba pierwota jest po pierwsze skończoa, a po drugie zay jest jej rozkład jest to rozkład empiryczy. Zamiast wtórie próbkować próbę pierwotą moża wygeerować automatyczie całą przestrzeń prób wtórych i wyzaczyć dla iej wartości statystyki będącej estymatorem poszukiwaego parametru. W artykule przedstawioo propozycję algorytmu realizującego to zadaie. Poprawość metody sprawdzoo a przykładzie wariacji. Pokazao, że wartość oczekiwaa estymatora obliczoego dokładą metodą bootstapową jest rówa dokładie wariacji próby. Metoda ie wprowadza więc obciążeia wyikającego z wtórego próbkowaia jak ma to miejsce w klasyczym bootstrapie. Wiosek te jest jedyie potwierdzeiem
13 72 Joaa Kisielińska oczywistego faktu, że badając całą populacje uzyskujemy wyiki dokładiejsze iż jeśli bierzemy pod uwagę próbę losową. Rozkład ieobciążoego estymatora wariacji wyzaczoy dokładą metodą bootstrapową porówao z rozkładem graiczym dla wariacji, ie wymagającym założeia ormalości próby pierwotej. Podobieństwo obydwu rozkładów wskazuje, a możliwość przybliżeia rozkładu dokładego rozkładem graiczym. Badaia pokazały, że w przypadku estymatora obciążoego ie moża pomiąć kwestii ormalości próby pierwotej. Rozkład graiczy estymatora wariacji, jeśli próba ie ma rozkładu ormalego, ie może być przybliżoy rozkładem N σ2, 1 2 σ 4 N σ2,. Rozkładem graiczym jest rozkład μ4 σ 4 2 (μ 4 2 σ 4) 1 + μ 4 3 σ Przeprowadzoe eksperymety symulacyje polegające a estymacji parametrów dla różych rozmiarów próby pierwotej pokazały, że w przypadku prób małych ( 15 i k = ) czas iezbędy do wygeerowaia całej przestrzei prób wtórych jest krótki (poiżej 10 sek. a komputerze średiej klasy). Ozacza to, że ie ma wówczas potrzeby przeprowadzać wtórego losowaia próby. Dla prób większych, czas te jest zdecydowaie dłuższy i wymaga kilku godzi obliczeń (dla =20 i k = obliczeia trwały 5 godz. 30 mi.) Wzrost wymiarowości problemu powoduje bardzo sile wydłużeie czasu obliczeń. Z drugiej stroy pamiętać ależy, że metoda bootstrapowa stosowaa jest w przypadku małych prób dla prób dużych moża wykorzystać graicze rozkłady estymatorów. Biorąc jedak pod uwagę postęp w techice komputerowej, dokłady bootstrap będzie mógł być w przyszłości stosoway rówież dla prób większych. Szkoła Główa Gospodarstwa Wiejskiego LITERATURA [1] Boot J.G., Sarkar S. [1998]: Mote Carlo Approximatio of Bootstrap Variaces. The America Statisticia. Nr. 52, Assue [2] Boot J.G.: Mote Carlo ad the boothstrap. Prezetacja elektroicza: jbooth/documets/talks/bootse.pdf ( ). [3] Domański C., Pruska K. [2000]: Nieklasycze metody statystycze. Polskie Wydawictwo Ekoomicze, Warszawa. [4] Efro B. [1979]: Bootstrap methods: aother look at the jackkife. The Aals of Statistics. Vol. 7, No. 1, [5] Efro B. [1987]: Better Bootstrap Cofidece Itervals (with discussio). Joural of the America Statistical Associatio. Vol. 82, No. 397, [6] Efro B., Tibshirai R.J. [1993]: A itroductio to the Bootstrap. Chapma & Hall. Lodo.
14 Dokłada metoda bootstrapowa i jej zastosowaie do estymacji wariacji 73 [7] Feller W. [1950]: A itroductio to probability theory ad its applicatio. Joh Wiley & Sos. New York, Lodo, Sydey. [8] Smirow N.W., Dui-Barkowski I.W. [1973]: Kurs rachuku prawdopodobieństwa i statystyki matematyczej dla zastosowań techiczych. Państwowe Wydawictwo Naukowe, Warszawa. [9] Zieliński R. [2004]: Siedem wykładów wprowadzających do statystyki matematyczej. Publikacja elektroicza: rziel/7all.pdf ( ) DOKŁADNA METODA BOOTSTRAPOWA I JEJ ZASTOSOWANIE DO ESTYMACJI WARIANCJI Streszczeie W artykule przedstawioo dokładą metodę bootstrapową, którą moża wykorzystać do szacowaia estymatorów parametrów zmieych losowych o iezaym rozkładzie. Metoda pozwala wyzaczyć oszacowaie dowolego parametru, błąd tego oszacowaia, rozkład estymatora, czy przedziały ufości. Tradycyjie zadaie takie realizowae jest przy pomocy metody bootstrapowej, która polega a wtórym próbkowaiu aalizowaej, pierwotej próby losowej. Losowaie próby stosowae jest w statystyce, jeśli ie może być zbadaa cała populacja, lub badaie całej populacji jest zbyt kłopotliwe. Próba pierwota jest po pierwsze skończoa, a po drugie zay jest jej rozkład jest to rozkład empiryczy. Zamiast wtórie próbkować próbę pierwotą moża wygeerować automatyczie całą przestrzeń prób wtórych i wyzaczyć dla iej wartości statystyki będącej estymatorem poszukiwaego parametru. W artykule przedstawioo propozycję algorytmu realizującego metodę dokładego bootstrapu, którego poprawość sprawdzoo a przykładzie ieobciążoego estymatora wariacji. Pokazao, że wartość oczekiwaa estymatora obliczoego dokładą metodą bootstapową jest rówa dokładie wariacji próby. Metoda ie wprowadza więc obciążeia wyikającego z wtórego próbkowaia jak ma to może mieć miejsce w klasyczym bootstrapie. Rozkład estymatora wyzaczoy dokładą metodą bootstrapową porówao z rozkładem graiczym estymatora wariacji, ie wymagającym założeia ormalości próby pierwotej. Badaia pokazały, że w przypadku wariacji ie moża pomiąć kwestii ormalości próby pierwotej. EXACT BOOTSTRAP METHOD AND IT S APPLICATION IN ESTIMATION OF VARIANCE Summary The article presets the exact bootstrap method, which ca be used to estimate the parameters of the estimators of radom variables with ukow distributio. The method allows to determie a estimate of ay parameter, the error of estimatio, the distributio of the estimator ad cofidece itervals. Traditioally this task is carried out usig the bootstrap method, which cosists of resamplig of the origial sample. Radom samplig is ecessary if examiig the etire populatio data is impossible or too costly. Note that the fudametal sample property is of fiite size ad we kow its distributio it is the empirical distributio. Rather tha drivig a resample, we ca geerate automatically the etire resample space ad calculate the values of a statistic which is lookig for a parameter estimator. This article describes a method for performig exact algorithm for bootstrappig, which correctess was verified o a example of the ubiased estimator of variace. It is show that the expected value of the
15 74 Joaa Kisielińska estimator calculated with exact bootstrap is exactly equal the variace of the sample. The method does ot itroduce bias of the resamplig, as it may be for the classic bootstrap. The distributio of the estimator determied by the exact bootstrap compared with the limit distributio for estimator of variace, which does ot require assumptios of ormality of the origial sample. Research has show that if we estimate variace we caot igore the issue of ormality of the origial sample.
X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.
Zagadieia estymacji Puktem wyjścia badaia statystyczego jest wylosowaie z całej populacji pewej skończoej liczby elemetów i zbadaie ich ze względu a zmieą losową cechę X Uzyskae w te sposób wartości x,
Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja
Charakterystyki liczbowe zmieych losowych: wartość oczekiwaa i wariacja dr Mariusz Grządziel Wykłady 3 i 4;,8 marca 24 Wartość oczekiwaa zmieej losowej dyskretej Defiicja. Dla zmieej losowej dyskretej
3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elemety kombiatoryki 2. Zmiee losowe i ich rozkłady 3. Populacje i próby daych, estymacja parametrów 4. Testowaie hipotez 5. Testy parametrycze 6. Testy
Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.
Z adaie Niech,,, będą iezależymi zmieymi losowymi o idetyczym rozkładzie ormalym z wartością oczekiwaą 0 i wariacją. Wyzaczyć wariację zmieej losowej. Wskazówka: pokazać, że ma rozkład Γ, ODP: Zadaie Niech,,,
Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407
Statystyka i Opracowaie Daych W7. Estymacja i estymatory Dr Aa ADRIAN Paw B5, pok407 ada@agh.edu.pl Estymacja parametrycza Podstawowym arzędziem szacowaia iezaego parametru jest estymator obliczoy a podstawie
ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA
ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA Mamy populację geeralą i iteresujemy się pewą cechą X jedostek statystyczych, a dokładiej pewą charakterystyką liczbową θ tej cechy (p. średią wartością
Lista 6. Estymacja punktowa
Estymacja puktowa Lista 6 Model metoda mometów, rozkład ciągły. Zadaie. Metodą mometów zaleźć estymator iezaego parametru a w populacji jedostajej a odciku [a, a +. Czy jest to estymator ieobciążoy i zgody?
16 Przedziały ufności
16 Przedziały ufości zapis wyiku pomiaru: sugeruje, że rozkład błędów jest symetryczy; θ ± u(θ) iterpretacja statystycza przedziału [θ u(θ), θ + u(θ)] zależy od rozkładu błędów: P (Θ [θ u(θ), θ + u(θ)])
Estymacja przedziałowa
Metody probabilistycze i statystyka Estymacja przedziałowa Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej Metody probabilistycze
Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)
IV. Estymacja parametrów Estymacja: Puktowa (ocea, błędy szacuku Przedziałowa (przedział ufości Załóżmy, że rozkład zmieej losowej X w populacji geeralej jest opisay dystrybuatą F(x;α, gdzie α jest iezaym
Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2
Wykład 5 Przedziały ufości Zwykle ie zamy parametrów populacji, p. Chcemy określić a ile dokładie y estymuje Kostruujemy przedział o środku y, i taki, że mamy 95% pewości, że zawiera o Nazywamy go 95%
Wykład 11 ( ). Przedziały ufności dla średniej
Wykład 11 (14.05.07). Przedziały ufości dla średiej Przykład Cea metra kwadratowego (w tys. zł) z dla 14 losowo wybraych mieszkań w mieście A: 3,75; 3,89; 5,09; 3,77; 3,53; 2,82; 3,16; 2,79; 4,34; 3,61;
Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)
Elemety statystyki opisowej Izolda Gorgol wyciąg z prezetacji (wykład I) Populacja statystycza, badaie statystycze Statystyka matematycza zajmuje się opisywaiem i aalizą zjawisk masowych za pomocą metod
Statystyka matematyczna. Wykład II. Estymacja punktowa
Statystyka matematycza. Wykład II. e-mail:e.kozlovski@pollub.pl Spis treści 1 dyskretych Rozkłady zmieeych losowych ciągłych 2 3 4 Rozkład zmieej losowej dyskretej dyskretych Rozkłady zmieeych losowych
Prawdopodobieństwo i statystyka
Wykład VI: Metoda Mote Carlo 17 listopada 2014 Zastosowaie: przybliżoe całkowaie Prosta metoda Mote Carlo Przybliżoe obliczaie całki ozaczoej Rozważmy całkowalą fukcję f : [0, 1] R. Chcemy zaleźć przybliżoą
STATYSTKA I ANALIZA DANYCH LAB II
STATYSTKA I ANALIZA DANYCH LAB II 1. Pla laboratorium II rozkłady prawdopodobieństwa Rozkłady prawdopodobieństwa dwupuktowy, dwumiaowy, jedostajy, ormaly. Związki pomiędzy rozkładami prawdopodobieństw.
Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w
Zad Dae są astępujące macierze: A =, B, C, D, E 0. 0 = = = = 0 Wykoaj astępujące działaia: a) AB, BA, C+E, DE b) tr(a), tr(ed), tr(b) c) det(a), det(c), det(e) d) A -, C Jeśli działaia są iewykoale, to
Ćwiczenie 2 ESTYMACJA STATYSTYCZNA
Ćwiczeie ETYMACJA TATYTYCZNA Jest to metoda wioskowaia statystyczego. Umożliwia oszacowaie wartości iteresującego as parametru a podstawie badaia próbki. Estymacja puktowa polega a określeiu fukcji zwaej
Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7
Metody probabilistycze i statystyka Estymacja Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej Metody probabilistycze
Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona
Ćwiczeie r 4 Porówaie doświadczalego rozkładu liczby zliczeń w zadaym przedziale czasu z rozkładem Poissoa Studeta obowiązuje zajomość: Podstawowych zagadień z rachuku prawdopodobieństwa, Zajomość rozkładów
θx θ 1, dla 0 < x < 1, 0, poza tym,
Zadaie 1. Niech X 1,..., X 8 będzie próbą z rozkładu ormalego z wartością oczekiwaą θ i wariacją 1. Niezay parametr θ jest z kolei zmieą losową o rozkładzie ormalym z wartością oczekiwaą 0 i wariacją 1.
Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych
Wokół testu Studeta Wprowadzeie Rozkłady prawdopodobieństwa występujące w testowaiu hipotez dotyczących rozkładów ormalych Rozkład ormaly N(µ, σ, µ R, σ > 0 gęstość: f(x σ (x µ π e σ Niech a R \ {0}, b
Prawdopodobieństwo i statystyka r.
Zadaie. Wykoujemy rzuty symetryczą kością do gry do chwili uzyskaia drugiej szóstki. Niech Y ozacza zmieą losową rówą liczbie rzutów w których uzyskaliśmy ie wyiki iż szóstka a zmieą losową rówą liczbie
ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE
RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 8. ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE 1 Zbieżość ciągu zmieych losowych z prawdopodobieństwem 1 (prawie apewo) Ciąg zmieych losowych (X ) jest
STATYSTYKA I ANALIZA DANYCH
TATYTYKA I ANALIZA DANYCH Zad. Z pewej partii włókie weły wylosowao dwie próbki włókie, a w każdej z ich zmierzoo średicę włókie różymi metodami. Otrzymao astępujące wyiki: I próbka: 50; średia średica
WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady
WYKŁAD Zdarzeia losowe i prawdopodobieństwo Zmiea losowa i jej rozkłady Metody statystycze metody opisu metody wioskowaia statystyczego sytetyczy liczbowy opis właściwości zbioru daych ocea charakterystyk
STATYSTYKA MATEMATYCZNA
TATYTYKA MATEMATYCZNA ROZKŁADY PODTAWOWYCH TATYTYK zmiea losowa odpowiedik badaej cechy, (,,..., ) próba losowa (zmiea losowa wymiarowa, i iezależe zmiee losowe o takim samym rozkładzie jak (taką próbę
z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X
Matematyka ubezpieczeń majątkowych.0.0 r. Zadaie. Mamy day ciąg liczb q, q,..., q z przedziału 0,. Rozważmy trzy zmiee losowe: o X X X... X, gdzie X i ma rozkład dwumiaowy o parametrach,q i, i wszystkie
Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).
Cetrale miary położeia Średia; Moda (domiata) Mediaa Kwatyle (kwartyle, decyle, cetyle) Moda (Mo, D) wartość cechy występującej ajczęściej (ajlicziej). Mediaa (Me, M) dzieli uporządkoway szereg liczbowy
Matematyka ubezpieczeń majątkowych r.
Matematyka ubezpieczeń majątkowych 6..003 r. Zadaie. W kolejych okresach czasu t =,, 3, 4, 5 ubezpieczoy, charakteryzujący się parametrem ryzyka Λ, geeruje szkód. Dla daego Λ = λ zmiee N, N,..., N 5 są
1 Twierdzenia o granicznym przejściu pod znakiem całki
1 Twierdzeia o graiczym przejściu pod zakiem całki Ozaczeia: R + = [0, ) R + = [0, ] (X, M, µ), gdzie M jest σ-ciałem podzbiorów X oraz µ: M R + - zbiór mierzaly, to zaczy M Twierdzeie 1.1. Jeżeli dae
STATYSTYKA OPISOWA WYKŁAD 1 i 2
STATYSTYKA OPISOWA WYKŁAD i 2 Literatura: Marek Cieciura, Jausz Zacharski, Metody probabilistycze w ujęciu praktyczym, L. Kowalski, Statystyka, 2005 2 Statystyka to dyscyplia aukowa, której zadaiem jest
Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja
Podstawowe ozaczeia i wzory stosowae a wykładzie i laboratorium Część I: estymacja 1 Ozaczeia Zmiee losowe (cechy) ozaczamy a wykładzie dużymi literami z końca alfabetu. Próby proste odpowiadającymi im
STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2
STATYSTYKA Rafał Kucharski Uiwersytet Ekoomiczy w Katowicach 2015/16 ROND, Fiase i Rachukowość, rok 2 Rachuek prawdopodobieństwa Rzucamy 10 razy moetą, dla której prawdopodobieństwo wyrzuceia orła w pojedyczym
Komputerowa analiza danych doświadczalnych
Komputerowa aaliza daych doświadczalych Wykład 7 8.04.06 dr iż. Łukasz Graczykowski lgraczyk@if.pw.edu.pl Semestr leti 05/06 Cetrale twierdzeie graicze - przypomieie Sploty Pobieraie próby, estymatory
Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste
Statystyka opisowa Miary statystycze: 1. miary położeia a) średia z próby x = 1 x = 1 x = 1 x i - szereg wyliczający x i i - szereg rozdzielczy puktowy x i i - szereg rozdzielczy przedziałowy, gdzie x
PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).
TATYTYKA MATEMATYCZNA WYKŁAD 3 RZEDZIAŁY UFNOŚCI Niech θ - iezay parametr rozkład cechy. Niech będzie liczbą z przedział 0,. Jeśli istieją statystyki, U i U ; U U ; których rozkład zależy od θ oraz U θ
0.1 ROZKŁADY WYBRANYCH STATYSTYK
0.1. ROZKŁADY WYBRANYCH STATYSTYK 1 0.1 ROZKŁADY WYBRANYCH STATYSTYK Zadaia 0.1.1. Niech X 1,..., X będą iezależymi zmieymi losowymi o tym samym rozkładzie. Obliczyć ES 2 oraz D 2 ( 1 i=1 X 2 i ). 0.1.2.
STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś
1 STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr iż Krzysztof Bryś Pojȩcia wstȩpe populacja - ca ly zbiór badaych przedmiotów lub wartości. próba - skończoy podzbiór populacji podlegaj acy badaiu.
1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o
1. Wioskowaie statystycze. W statystyce idetyfikujemy: Cecha-Zmiea losowa Rozkład cechy-rozkład populacji Poadto miaem statystyki określa się także fukcje zmieych losowych o tym samym rozkładzie. Rozkłady
Statystyka matematyczna dla leśników
Statystyka matematycza dla leśików Wydział Leśy Kieruek leśictwo Studia Stacjoare I Stopia Rok akademicki 0/0 Wykład 5 Testy statystycze Ogóle zasady testowaia hipotez statystyczych, rodzaje hipotez, rodzaje
Elementy modelowania matematycznego
Elemety modelowaia matematyczego Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Modelowaie daych (ilościowe): Metody statystycze: estymacja parametrów modelu,
Prawdopodobieństwo i statystyka r.
Zadaie 1 Rzucamy 4 kości do gry (uczciwe). Prawdopodobieństwo zdarzeia iż ajmiejsza uzyskaa a pojedyczej kości liczba oczek wyiesie trzy (trzy oczka mogą wystąpić a więcej iż jedej kości) rówe jest: (A)
TESTY LOSOWOŚCI. Badanie losowości próby - test serii.
TESTY LOSOWOŚCI Badaie losowości próby - test serii. W wielu zagadieiach wioskowaia statystyczego istotym założeiem jest losowość próby. Prostym testem do weryfikacji tej własości jest test serii. 1 Dla
będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,
Zadaie iech X, X,, X 6 będą iezależymi zmieymi losowymi z rozkładu jedostajego a przedziale ( 0, ), a Y, Y,, Y6 iezależymi zmieymi losowymi z rozkładu jedostajego a przedziale ( 0, ), gdzie, są iezaymi
Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym
Lista 5 Zadaia a zastosowaie ierówosci Markowa i Czebyszewa. Zadaie 1. Niech zmiea losowa X ma rozkład jedostajy a odciku [0, 1]. Korzystając z ierówości Markowa oszacować od góry prawdopodobieństwo, że
DOKŁADNA METODA BOOTSTRAPOWA NA PRZYKŁADZIE ESTYMACJI ŚREDNIEJ
METOY ILOŚCIOWE W BAANIACH EKONOMICZNYCH Tom XII/2, 20, str. 9 20 OKŁANA METOA BOOTSTRAPOWA NA PRZYKŁAZIE ESTYMACJI ŚRENIEJ Joanna Kisielińska Katedra Ekonomiki Rolnictwa i Międzynarodowych Stosunków Gospodarczych
3. Regresja liniowa Założenia dotyczące modelu regresji liniowej
3. Regresja liiowa 3.. Założeia dotyczące modelu regresji liiowej Aby moża było wykorzystać model regresji liiowej, muszą być spełioe astępujące założeia:. Relacja pomiędzy zmieą objaśiaą a zmieymi objaśiającymi
KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1
KURS STATYSTYKA Lekcja 3 Parametrycze testy istotości ZADANIE DOMOWE www.etrapez.pl Stroa Część : TEST Zazacz poprawą odpowiedź (tylko jeda jest prawdziwa). Pytaie Statystykę moża rozumieć jako: a) próbkę
ZADANIA NA ĆWICZENIA 3 I 4
Agata Boratyńska Statystyka aktuariala... 1 ZADANIA NA ĆWICZENIA 3 I 4 1. Wygeeruj szkody dla polis z kolejych lat wg rozkładu P (N = 1) = 0, 1 P (N = 0) = 0, 9, gdzie N jest liczbą szkód z jedej polisy.
ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y
Zadaie. Łącza wartość szkód z pewego ubezpieczeia W = Y + Y +... + YN ma rozkład złożoy Poissoa z oczekiwaą liczbą szkód rówą λ i rozkładem wartości pojedyczej szkody takim, że ( Y { 0,,,3,... }) =. Niech:
Ciągi liczbowe wykład 3
Ciągi liczbowe wykład 3 dr Mariusz Grządziel semestr zimowy, r akad 204/205 Defiicja ciągu liczbowego) Ciagiem liczbowym azywamy fukcję odwzorowuja- ca zbiór liczb aturalych w zbiór liczb rzeczywistych
ANALIZA DANYCH DYSKRETNYCH
ZJAZD ESTYMACJA Jest to metoda wioskowaia statystyczego. Umożliwia oa oszacowaie wartości iteresującego as parametru a podstawie badaia próbki. Estymacja puktowa polega a określeiu fukcji zwaej estymatorem,
Analiza wyników symulacji i rzeczywistego pomiaru zmian napięcia ładowanego kondensatora
Aaliza wyików symulacji i rzeczywistego pomiaru zmia apięcia ładowaego kodesatora Adrzej Skowroński Symulacja umożliwia am przeprowadzeie wirtualego eksperymetu. Nie kostruując jeszcze fizyczego urządzeia
n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc
5.3. Zagadieia estymacji 87 Rozważmy teraz dokładiej zagadieie szacowaia wartości oczekiwaej m zmieej losowej X o rozkładzie ormalym N(m, F), w którym odchyleie stadardowe F jest zae. Niech X, X,..., X
O liczbach naturalnych, których suma równa się iloczynowi
O liczbach aturalych, których suma rówa się iloczyowi Lew Kurladczyk i Adrzej Nowicki Toruń UMK, 10 listopada 1998 r. Liczby aturale 1, 2, 3 posiadają szczególą własość. Ich suma rówa się iloczyowi: Podobą
PODSTAWY BIOSTATYSTYKI ĆWICZENIA
PODSTAWY BIOSTATYSTYKI ĆWICZENIA FILIP RACIBORSKI FILIP.RACIBORSKI@WUM.EDU.PL ZAKŁAD PROFILAKTYKI ZAGROŻEŃ ŚRODOWISKOWYCH I ALERGOLOGII WUM ZADANIE 1 Z populacji wyborców pobrao próbkę 1000 osób i okazało
ZSTA LMO Zadania na ćwiczenia
ZSTA LMO Zadaia a ćwiczeia Efektywość estymatorów ieobciążoych Zadaie 1. Zakładamy, że badaa cecha X populacji ma rozkład Poissoa πλ, gdzie λ > 0 jest parametrem. Poadto, iech X = X 1, X,..., X będzie
PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH
PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH POMIAR FIZYCZNY Pomiar bezpośredi to doświadczeie, w którym przy pomocy odpowiedich przyrządów mierzymy (tj. porówujemy
Komputerowa analiza danych doświadczalnych
Komputerowa aaliza daych doświadczalych Wykład 7 7.04.07 dr iż. Łukasz Graczykowski lgraczyk@if.pw.edu.pl Semestr leti 06/07 Cetrale twierdzeie graicze - przypomieie Sploty Pobieraie próby, estymatory
Twierdzenia graniczne:
Twierdzeia graicze: Tw. ierówośd Markowa Jeżeli P(X > 0) = 1 oraz EX 0: P X k 1 k EX. Tw. ierówośd Czebyszewa Jeżeli EX = m i 0 < σ = D X 0: P( X m tσ) 1 t. 1. Z partii towaru o wadliwości
SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY
SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY Weryfikacja hipotez statystyczych WNIOSKOWANIE STATYSTYCZNE Wioskowaie statystycze, to proces uogóliaia wyików uzyskaych a podstawie próby a całą
2.1. Studium przypadku 1
Uogóliaie wyików Filip Chybalski.. Studium przypadku Opis problemu Przedsiębiorstwo ŚRUBEX zajmuje się produkcją wyrobów metalowych i w jego szerokim asortymecie domiują różego rodzaju śrubki i wkręty.
są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X
Prawdoodobieństwo i statystyka 5..008 r. Zadaie. Załóżmy że 3 są iezależymi zmieymi losowymi o jedakowym rozkładzie Poissoa z wartością oczekiwaą λ rówą 0. Obliczyć v = var( 3 + + + 3 = 9). (A) v = 0 (B)
POLITECHNIKA OPOLSKA
POLITCHIKA OPOLSKA ISTYTUT AUTOMATYKI I IFOMATYKI LABOATOIUM MTOLOII LKTOICZJ 7. KOMPSATOY U P U. KOMPSATOY APIĘCIA STAŁO.. Wstęp... Zasada pomiaru metodą kompesacyją. Metoda kompesacyja pomiaru apięcia
oznaczają łączne wartości szkód odpowiednio dla k-tego kontraktu w t-tym roku. O składnikach naszych zmiennych zakładamy, że:
Zadaie. Niech zmiee losowe: X t,k = μ + α k + β t + ε t,k, k =,2,, K oraz t =,2,, T, ozaczają łącze wartości szkód odpowiedio dla k-tego kotraktu w t-tym roku. O składikach aszych zmieych zakładamy, że:
Rozkłady statystyk z próby Twierdzenia graniczne
Rozkłady statystyk z róby Twierdzeia graicze PRÓBA LOSOWA Próbą losową rostą azyway ciąg -zieych losowych iezależych i osiadających jedakowe rozkłady takie jak rozkład zieej losowej w oulacji geeralej
Estymacja przedziałowa - przedziały ufności
Estymacja przedziałowa - przedziały ufości Próbę -elemetową charakteryzujemy jej parametrami (p. x, s, s ). Służą oe do ocey wartości iezaych parametrów populacji (m, σ, σ). Nazywamy je estymatorami puktowymi
1 Dwuwymiarowa zmienna losowa
1 Dwuwymiarowa zmiea loowa 1.1 Dwuwymiarowa zmiea loowa kokowa X = x i, Y = y k = p ik przy czym i, k N oraz p ik = 1; i k p i = X = x i = p ik dla i N; p k = Y = y k = p ik dla k N; k i F 1 x = p i dla
Zdarzenia losowe, definicja prawdopodobieństwa, zmienne losowe
Metody probabilistycze i statystyka Wykład 1 Zdarzeia losowe, defiicja prawdopodobieństwa, zmiee losowe Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki
Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12
Wykład Korelacja i regresja Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej Wykład 8. Badaie statystycze ze względu
Obserwacje odstające mają duży wpływ na średnią średnia nie jest odporna.
Wykład 8. Przedziały ufości dla średiej Średia a mediaa Mediaa dzieli powierzchię histogramu a połowy. Jest odpora ie mają a ią wpływu obserwacje odstające. Obserwacje odstające mają duży wpływ a średią
Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.
MIARY POŁOŻENIA I ROZPROSZENIA WYNIKÓW SERII POMIAROWYCH Miary położeia (tedecji cetralej) to tzw. miary przecięte charakteryzujące średi lub typowy poziom wartości cechy. Średia arytmetycza: X i 1 X i,
Wykład 13: Zbieżność według rozkładu. Centralne twierdzenie graniczne.
Rachuek prawopoobieństwa MA064 Wyział Elektroiki, rok aka 2008/09, sem leti Wykłaowca: r hab A Jurlewicz Wykła 3: Zbieżość weług rozkłau Cetrale twierzeie graicze Zbieżości ciągu zmieych losowych weług
MODELE MATEMATYCZNE W UBEZPIECZENIACH. 1. Renty
MODELE MATEMATYCZNE W UBEZPIECZENIACH WYKŁAD 2: RENTY. PRZEPŁYWY PIENIĘŻNE. TRWANIE ŻYCIA 1. Rety Retą azywamy pewie ciąg płatości. Na razie będziemy je rozpatrywać bez żadego związku z czasem życiem człowieka.
2. INNE ROZKŁADY DYSKRETNE
Ie rozkłady dyskrete 9. INNE ROZKŁADY DYSKRETNE.. Rozkład dwumiaowy - kotyuacja Przypomijmy sobie pojęcie rozkładu dwumiaowego prawdopodobieństwa k sukcesów w próbach Beroulli ego: P k k k k = p q m =
1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.
Przedziały ufości W tym rozdziale będziemy zajmować się przede wszystkim zadaiami związaymi z przedziałami ufości Będą as rówież iteresować statystki pozycyje oraz estymatory ajwiększej wiarygodości (Eg
Parametryczne Testy Istotności
Parametrycze Testy Istotości Wzory Parametrycze testy istotości schemat postępowaia pukt po pukcie Formułujemy hipotezę główą H odośie jakiegoś parametru w populacji geeralej Hipoteza H ma ajczęściej postać
2 n < 2n + 2 n. 2 n = 2. 2 n 2 +3n+2 > 2 0 = 1 = 2. n+2 n 1 n+1 = 2. n+1
Tekst a iebiesko jest kometarzem lub treścią zadaia. Zadaie 1. Zbadaj mootoiczość i ograiczoość ciągów. a = + 3 + 1 Ciąg jest mootoiczie rosący i ieograiczoy poieważ różica kolejych wyrazów jest dodatia.
Zmienna losowa N ma rozkład ujemny dwumianowy z parametrami (, q) = 7,
Matematyka ubezpieczeń majątkowych.0.008 r. Zadaie. r, Zmiea losowa N ma rozkład ujemy dwumiaowy z parametrami (, q), tz.: Pr( N k) (.5 + k) (.5) k! Γ Γ * Niech k ozacza taką liczbę aturalą, że: * k if{
MINIMALIZACJA PUSTYCH PRZEBIEGÓW PRZEZ ŚRODKI TRANSPORTU
Przedmiot: Iformatyka w logistyce Forma: Laboratorium Temat: Zadaie 2. Automatyzacja obsługi usług logistyczych z wykorzystaiem zaawasowaych fukcji oprogramowaia Excel. Miimalizacja pustych przebiegów
Estymacja przedziałowa:
Estymacja przedziałowa: Zamiast szukad ajlepszego estymatora, tak jak w estymacji puktowej będziemy poszukiwad przedziału, do którego będzie ależał szukay parametr z odpowiedio dużym prawdopodobieostwem.
Numeryczny opis zjawiska zaniku
FOTON 8, iosa 05 7 Numeryczy opis zjawiska zaiku Jerzy Giter ydział Fizyki U Postawieie problemu wielu zagadieiach z różych działów fizyki spotykamy się z astępującym problemem: zmiay w czasie t pewej
Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie
Metrologia: miary dokładości dr iż. Paweł Zalewski Akademia Morska w Szczeciie Miary dokładości: Najczęściej rozkład pomiarów w serii wokół wartości średiej X jest rozkładem Gaussa: Prawdopodobieństwem,
Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia
Pla wykładu Aaliza daych Wykład : Statystyka opisowa. Małgorzata Krętowska Wydział Iformatyki Politechika Białostocka. Statystyka opisowa.. Estymacja puktowa. Własości estymatorów.. Rozkłady statystyk
Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15
Testowaie hipotez ZałoŜeia będące przedmiotem weryfikacji azywamy hipotezami statystyczymi. KaŜde przypuszczeie ma swoją alteratywę. Jeśli postawimy hipotezę, Ŝe średica pia jedoroczych drzew owej odmiay
Statystyka i rachunek prawdopodobieństwa
Statystyka i rachuek prawdopodobieństwa Filip A. Wudarski 22 maja 2013 1 Wstęp Defiicja 1. Statystyka matematycza opisuje i aalizuje zjawiska masowe przy użyciu metod rachuku prawdopodobieństwa. Defiicja
Zasada indukcji matematycznej. Dowody indukcyjne.
Zasada idukcji matematyczej Dowody idukcyje Z zasadą idukcji matematyczej i dowodami idukcyjymi sytuacja jest ajczęściej taka, że podaje się w szkole treść zasady idukcji matematyczej, a astępie omawia,
5. Zasada indukcji matematycznej. Dowody indukcyjne.
Notatki do lekcji, klasa matematycza Mariusz Kawecki, II LO w Chełmie 5. Zasada idukcji matematyczej. Dowody idukcyje. W rozdziale sformułowaliśmy dla liczb aturalych zasadę miimum. Bezpośredią kosekwecją
Statystyczny opis danych - parametry
Statystyczy opis daych - parametry Ozaczeia żółty owe pojęcie czerwoy, podkreśleie uwaga * materiał adobowiązkowy Aa Rajfura, Matematyka i statystyka matematycza a kieruku Rolictwo SGGW Zagadieia. Idea
Statystyka opisowa. () Statystyka opisowa 24 maja / 8
Część I Statystyka opisowa () Statystyka opisowa 24 maja 2010 1 / 8 Niech x 1, x 2,..., x będą wyikami pomiarów, p. temperatury, ciśieia, poziomu rzeki, wielkości ploów itp. Przykład 1: wyiki pomiarów
STATYSTYKA OPISOWA PODSTAWOWE WZORY
MIARY POŁOŻENIA Średia Dla daych idywidualych: STATYSTYKA OPISOWA PODSTAWOWE WZORY Q i = x lmi + i mi 1 4 j h m i mi x = 1 x i x = 1 i ẋ i gdzie ẋ i środek i-tego przedziału i liczość i- tego przedziału
Estymacja współczynnika dopasowania w klasycznym modelu ryzyka
Ogólopolska Koferecja Naukowa Zagadieia Aktuariale Teoria i praktyka Warszawa, 9- czerwca 008 Estymacja współczyika dopasowaia w klasyczym modelu ryzyka Aa Nikodem Uiwersytet Ekoomiczy we Wrocławiu Klasyczy
(X i X) 2. n 1. X m S
Wykład 8. Przedziały ufości i testowaie hipotez A gdy ie zamy wariacji σ 2? Załóżmy, że X ma rozkład ormaly, ale ie zamy wartości ai m ai σ 2. Jak wtedy szacować wartość średią m? Przypomijmy, że Wtedy
Rozkład normalny (Gaussa)
Rozład ormaly (Gaussa) Wyprowadzeie rozładu Gaussa w modelu Laplace a błędów pomiarowych. Rozważmy pomiar wielości m, tóry jest zaburzay przez losowych efetów o wielości e ażdy, zarówo zaiżających ja i
Estymatory nieobciążone o minimalnej wariancji
Estymatory ieobciążoe o miimalej wariacji Model statystyczy (X, {P θ, θ Θ}); g : Θ R 1 Zadaie: oszacować iezaą wartość g(θ) Wybrać takie δ(x 1, X 2,, X ) by ( θ Θ) ieobciążoość E θ δ(x 1, X 2,, X ) = g(θ)
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
I. Ciągi liczbowe. , gdzie a n oznacza n-ty wyraz ciągu (a n ) n N. spełniający warunek. a n+1 a n = r, spełniający warunek a n+1 a n
I. Ciągi liczbowe Defiicja 1. Fukcję określoą a zbiorze liczb aturalych o wartościach rzeczywistych azywamy ciągiem liczbowym. Ciągi będziemy ozaczać symbolem a ), gdzie a ozacza -ty wyraz ciągu a ). Defiicja.
Matematyka ubezpieczeń majątkowych 9.10.2006 r. Zadanie 1. Rozważamy proces nadwyżki ubezpieczyciela z czasem dyskretnym postaci: n
Maemayka ubezpieczeń mająkowych 9.0.006 r. Zadaie. Rozważamy proces adwyżki ubezpieczyciela z czasem dyskreym posaci: U = u + c S = 0... S = W + W +... + W W W W gdzie zmiee... są iezależe i mają e sam