4.2 Rozgrzewka, czyli Centralne Twierdzenie Graniczne



Podobne dokumenty
Deska Galtona. Adam Osękowski. Instytut Matematyki, Wydział Matematyki, Informatyki i Mechaniki Uniwersytet Warszawski

Spacery losowe generowanie realizacji procesu losowego

Metody probabilistyczne

Rachunek prawdopodobieństwa dla informatyków

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Ćwiczenia: Ukryte procesy Markowa lista 1 kierunek: matematyka, specjalność: analiza danych i modelowanie, studia II

5 Błąd średniokwadratowy i obciążenie

Wykład 9: Markov Chain Monte Carlo

W4 Eksperyment niezawodnościowy

Rozkłady zmiennych losowych

Statystyka w przykładach

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Niezawodność i diagnostyka projekt. Jacek Jarnicki

pobrano z serwisu Fizyka Dla Każdego - - zadania z fizyki, wzory fizyczne, fizyka matura

Prawdopodobieństwo i statystyka

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 2 ZADANIA - ZESTAW 2

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova

Sterowanie wielkością zamówienia w Excelu - cz. 3

Rachunek prawdopodobieństwa w grach losowych.

Spis treści 3 SPIS TREŚCI

Prawdopodobieństwo geometryczne

01. dla x 0; 1 2 wynosi:

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Matematyka ubezpieczeń majątkowych r.

Zadanie 1. Zmienne losowe X 1, X 2 są niezależne i mają taki sam rozkład z atomami:

Analiza niepewności pomiarów

Niezawodność i diagnostyka projekt

Procesy Markowa zawdzięczają swoją nazwę ich twórcy Andriejowi Markowowi, który po raz pierwszy opisał problem w 1906 roku.

Ilustracja metody MONTE CARLO. obliczania całek podwójnych

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

Lista 5. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

dr Adam Sojda Wykład Politechnika Śląska Badania Operacyjne Teoria kolejek

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Ruletka czy można oszukać kasyno?

Metody Statystyczne. Metody Statystyczne.

BIOINFORMATYKA. Copyright 2011, Joanna Szyda

Rozkłady statystyk z próby

a)dane są wartości zmiennej losowej: 2, 4, 2, 1, 1, 3, 2, 1. Obliczyć wartość średnią i wariancję.

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Budowa atomu. Izotopy

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

6.4 Podstawowe metody statystyczne

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Gry hazardowe, gry ewolucyjne, ekspresja genów, tak czy owak łańcuchy Markowa

Analiza Algorytmów 2018/2019 (zadania na laboratorium)

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

Z Wikipedii, wolnej encyklopedii.

Ważne rozkłady i twierdzenia

Wnioskowanie statystyczne. Statystyka w 5

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa

FIZYKA IV etap edukacyjny zakres podstawowy

Matematyka ubezpieczeń majątkowych r.

Pracownia Astronomiczna. Zapisywanie wyników pomiarów i niepewności Cyfry znaczące i zaokrąglanie Przenoszenie błędu

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

Metody probabilistyczne

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Matematyk Ci powie, co łączy Eugeniusza Oniegina i gry hazardowe

Prawdopodobieństwo i statystyka r.

Matematyka ubezpieczeń majątkowych r.

DWUKROTNA SYMULACJA MONTE CARLO JAKO METODA ANALIZY RYZYKA NA PRZYKŁADZIE WYCENY OPCJI PRZEŁĄCZANIA FUNKCJI UŻYTKOWEJ NIERUCHOMOŚCI

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Rachunek prawdopodobieństwa Rozdział 2. Aksjomatyczne ujęcie prawdopodobieństwa

rok 2006/07 Jacek Jarnicki,, Kazimierz Kapłon, Henryk Maciejewski

1 Wykład 4. Proste Prawa wielkich liczb, CTG i metody Monte Carlo

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Analiza danych. TEMATYKA PRZEDMIOTU

Zastosowanie Excela w matematyce

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Podejmowanie decyzji w warunkach ryzyka. Tomasz Brzęczek Wydział Inżynierii Zarządzania PP

MODELOWANIE ZMIENNOŚCI CEN AKCJI MODEL ADDYTYWNY MODEL MULTIPLIKATYWNY

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Przykłady 6.1 : charakterystyki liczbowe rozkładów dyskretnych

Ważne rozkłady i twierdzenia c.d.

EGZAMIN MAGISTERSKI, Biomatematyka

Zakładamy, że są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej i wariancji.

Matematyka finansowa r. Komisja Egzaminacyjna dla Aktuariuszy. L Egzamin dla Aktuariuszy z 5 października 2009 r.

Ogólnopolska Konferencja Aktuarialna Zagadnienia aktuarialne teoria i praktyka Warszawa, IE SGH 2009

autor: Włodzimierz Wolczyński rozwiązywał (a)... ARKUSIK 40 FIZYKA JĄDROWA

Wojewódzki Konkurs Przedmiotowy z Chemii dla uczniów gimnazjów województwa śląskiego w roku szkolnym 2014/2015


SKĄD WYWODZI SIĘ NAZWA PROGRAMU?

Wykład 11: Martyngały: definicja, twierdzenia o zbieżności

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

MODELOWANIE RZECZYWISTOŚCI

Rozkłady statystyk z próby. Statystyka

Statystyka matematyczna

Regresja linearyzowalna

Fizyka 3. Konsultacje: p. 329, Mechatronika

Zmienna losowa (wygrana w pojedynczej grze): (1, 0.5), ( 1, 0.5)

Elementy modelowania matematycznego

Rozpady promieniotwórcze

Transkrypt:

4.1 Wprowadzenie do modelowania Uwaga!!! Rzut monetą nie jest eksperymentem losowym. Znając warunki początkowe oraz wiedząc wszystko o otoczeniu, wyposażeni w znajomość zasad dynamiki jesteśmy w stanie dokładnie określić na którą stronę upadnie moneta. Problem polega na tym, że nie jesteśmy w stanie poznać dokładnie warunków początkowych (dokładność pomiaru jest ograniczona), równanie ruchu uwzględniające wszystkie czynniki było by skomplikowane, nie mamy wystarczająco dużo czasu by wyznaczyć dokładny wynik. W tej sytuacji możemy modelować przebieg działania pewnego procesu w sposób probabilistyczny. Podobna sytuacja występuje przy opracowaniu prognozie pogody, określaniu struktury przestrzennej białek, opisie ruchu pojazdów na drogach itp. Modelowanie stochastyczne to szeroka gałąź nauki, obejmująca problematykę budowy modelu, badania właściwości modelu, weryfikacje adekwatności modelu itp. Poniżej przedstawimy trzy popularne modele, oraz zajmiemy się badaniem ich właściwości. 4.2 Rozgrzewka, czyli Centralne Twierdzenie Graniczne Przy odpowiednich założeniach (jakich?) średnia z n zmiennych losowych zbiega do rozkładu granicznego. Co to właściwie oznacza? Dla przykładu zobaczmy jak zachowuje się średnia ze 100 zmiennych losowych o rozkładzie wykładniczym λ(1). > n 10000 > m 100 > > obs matrix ( rexp ( n m, 1 ), n,m) > s r e d n i e apply ( obs, FUN=mean, 1) > hist ( s r e d n i e, 1 0 0 ) Wynik tych symulacji przedstawiony jest na rysunku poniżej. Widzimy, że rozkład średnich jest całkiem podobny do rozkładu normalnego (właśnie o tym mówi CTG). Oczywiście pojawiają się naturalne pytania: jakie jest tempo zbieżności? czy średnia z innych rozkładów też zachowa się równie dobrze (proponuje zobaczyć średnią z 12 zmiennych losowych o rozkłądzie jednostajnym), dla jakich rozkłądów to nie działa (proponuje sprawdzić rozkłady dyskretne, rozkład cauchego i rozkład log normalny), jakie są konsekwencje CTG (o tym będziemy dużo mówić). 1

Zainteresowany czytelnik znajdzie na te pytania odpowiedź modyfikując powyżej umieszczony program w języku R. Rysunek 4.1: Przeskalowana gęstość rozkładu normlanego N (1, 0.1 2 ) i histogram obserwowanych średnich. 2

4.3 Model kasyna Przypuśćmy, że mamy możliwość gry w grę o następujących zasadach gracz stawia kwotę x, z prawdopodobieństwem p przegrywa i traci kwotę x, z prawdopodobieństwem 1 p wygrywa i zyskuje kwotę x. Przypuśćmy, że pewien Bardzo Pilnie Potrzebny Element Komputera kosztuje 700$ a Ty masz tylko 100$ i jedynym wyjściem aby ten element kupić jest gra w wyżej wymienioną grę. Oszacuj prawdopodobieństwo wygrania 700$ dla każdej z poniższych strategii, dla parametrów p = 0.5, p = 0.45 i p = 0.55. Strategia cierpliwa w każdym kroku stawiasz kwotę 100$. gotowka 100 p 0. 4 5 krok 1 while ( gotowka [ krok ]>0 & gotowka [ krok ] <700) { stawka 100 krok krok+1 gotowka [ krok ] gotowka [ krok 1] stawka + 2 stawka ( runif (1) >p ) plot ( gotowka, type= l, lwd=3) Strategia narwana w każdym kroku stawiasz kwotę ile możesz, czyli min(700$-y, y), gdzie y to kwota pieniędzy, które posiadasz. gotowka 100 p 0. 4 5 krok 1 while ( gotowka [ krok ]>0 & gotowka [ krok ] <700) { stawka min( gotowka [ krok ], 700 gotowka [ krok ] ) krok krok+1 gotowka [ krok ] gotowka [ krok 1] stawka + 2 stawka ( runif (1) >p ) plot ( gotowka, type= l, lwd=3) 4.3.1 Zadania Spróbuj rozwiązać ten problem analitycznie (Model Markowa), a następnie napisz program rozwiązujący ten problem symulacyjnie (uwaga! rozwiazanie tego problemy analitycznie pozwala na otrzymanie plusa po uprzednim przedstawieniu rozwiazania prowadzącemu). Wyznacz zależność pomiędzy prawdopodobieństwem wygrania w jednej grze p a prawdopodobieństwem zdobycia kwoty 700$. 3

Wyznacz symulacyjnie rozkład czasu trwania gry. Zbadaj jak prawdopodobieństwo wygrania zmienia się w zależności od kwoty, którą chcemy wygrać. Jaka jest oczekiwana wartość portfela po 5 grach? Która strategia jest lepsza, od czego to zależy? 4

4.4 Model Bomby Atomowej Poniżej opiszemy uproszczony opis zagadnienia, nad którym pracował Stanisław Ulam w Los Alamos. Prowadzone przez Niego badania doprowadziły do powstania bomby wodorowej (to źle) oraz rozwoju metod Monte Carlo (to dobrze). Zakładam, że każy wie jak działa bomba atomowa (jeżeli nie, to polecam artykuł http://science.howstuffworks.com/nuclear-bomb.htm). W skrócie, atomy niektórych pierwiastków w wyniku zderzenia z pojedynczym neutronem ulegają rozpadowi, temu rozpadowi towarzyszy wydzielenie się energii, oraz rozpad atomu na atomy innych pierwiatkow i wolne neutrony. Wolne neutrony o ile jest ich wystarczająco dużo są w stanie doprowadzić do reakcji łańcuchowej rozszzcepiając jądra kolejnych pierwiastków. Za tą historyjką kryje się bardziej skomplikowana fizyka, ale na potrzeby tego modelu całą tą fizykę jeszcze bardziej uprościmy. Przypuśćmy, że rozpędzony neutron trafia w jądro atomu Uranu z prawdopodobieństwem p. Neutron, który nie trafi nie jest już dla nas interesujący. Jeżeli neutron trafi, to w wyniku rozpadu zostanie uwolniona trójka nowych neutronów. Każdy neutron z tej trójki, jak również stary neutron z prawdopodobieństwem p trafi w kolejne jądro. Jeżeli dojdzie do bardzo dużej liczby rozszczepień (dużo to np. 10 8 ) w krótkim czasie to w efekcie obserwuje się wydzielenie dużej ilości energii (nazwywane zwyczajowo wybuchem). Przypuśćmy, że eksperyment rozpoczeliśmy z użyciem n wolnych neutronów. Poniższy fragment kody opisuje rozwój wydarzeń dla pojedynczego eksperymentu l. neutronow 10 p 0. 2 6 krok 1 while ( l. neutronow [ krok ]>0 & l. neutronow [ krok ] <10ˆ8) { krok krok+1 l. neutronow [ krok ] 4 rbinom ( 1, l. neutronow [ krok 1],p) plot ( l. neutronow, type= l, lwd=3) 4.4.1 Zadania Wyznacz prawdopodobieństwo, że dojdzie do reakcji łańcuchowej, to znaczy, że liczba gotowych do działania neutronów przekroczy 10 8, dla n = 10 i p = 0.26. Wykonaj wykres przedstawiający zależność prawdopodobieństwa wybuchu od parametru n. Wykonaj wykres przedstawiający zależność prawdopodobieństwa wybuchu od parametru p. 5

4.5 Model obciążenia serwera Mamy serwer (w przeciwieństwie do poprzednich modeli, ten mam nadzieje nie wymaga wprowadzenia). Do serwera są wysyłane zadania do realizacji. Wykonanie zadania zabiera określoną ilość czasu. Interesuje nas jak poradzi sobie serwer z realizacją zleconych zadań. Model ten znany jest w wielu modyfikacjach, rozważmy jedną z prostszych. Do serwera wysyłane są zadania w sposób losowy z jednostajną częstością. Czas pomiędzy kolejnymi wysłaniami opisać można rozkładem wykładniczym z częstością λ (pytanie: jakim rozkładem można opisać liczbę zadań wysłanych w ciągu jednej godziny?). Realizacja zadania i tego zabiera x i χ 2 1 czasu. Serwer działa w następujący sposób: jeżeli otrzymuje nowe zadanie do realizacji, to informacja o tym zadaniu dodawana jest na koniec kolejki zadań, jeżeli serwer nie realizuje żadnego zadania a lista zadań do wykonania nie jest pusta, to rozpoczyna natychmiast realizacja kolejnego zadania z kolejki. Zadanie do wykonania, to ocena rozkładu czasu bezczynności serwera, w zależności od parametru λ. Poniżej umieszczamy kod opisujący dane wejściowe dla serwera w e j s c i e function (T, lambda ) { l i c z b a. zadan rpois ( 1, T lambda ) czasy. wyslania. zadan sort ( runif ( l i c z b a. zadan, 0, T) ) czasy. trwania. zadan rchisq ( l i c z b a. zadan, 1 ) l i s t ( l i c z b a. zadan = l i c z b a. zadan, czasy. wyslania. zadan = czasy. wyslania. zadan, czasy. trwania. zadan = czasy. trwania. zadan ) Opiszmy teraz działanie serwera w okresie czasu T serwer function ( dane. i n ) { aktualny. c z a s 0 c z a s. r o z p o c z e c i a NULL c z a s. z akonczenia NULL c z a s. b e z c z y n n o s c i NULL for ( i i n 1 : dane. i n $ l i c z b a. zadan ) { aktualny. c z a s max( aktualny. czas, dane. i n $ czasy. wyslania. zadan [ i ] ) c z a s. r o z p o c z e c i a [ i ] aktualny. c z a s c z a s. z akonczenia [ i ] aktualny. c z a s + dane. i n $ czasy. trwania. zadan [ i ] aktualny. c z a s c z a s. z akonczenia [ i ] c z a s. b e z c z y n n o s c i c z a s. r o z p o c z e c i a [ 1] c z a s. zakonczenia [ dane. i n $ l i c z b a. zadan ] l i s t ( l i c z b a. zadan = dane. i n $ l i c z b a. zadan, c z a s. r o z p o c z e c i a = c z a s. r o z p o c z e c i a, c z a s. z akonczenia = c z a s. zakonczenia, c z a s. b e z c z y n n o s c i = c z a s. b e z c z y n n o s c i ) Zobaczmy histogram czasów bezczynności 6

T 3000 lambda 0. 5 dane. i n w e j s c i e (T, lambda ) dane. out serwer ( dane. i n ) c z a s. do. r o z g r z a n i a 100 zadania. r o z g r z e w a j a c e which( dane. out$ c z a s. r o z p o c z e c i a <= c z a s. do. r o z g r z a n i a ) hist ( dane. out$ c z a s. b e z c z y n n o s c i [ zadania. r o z g r z e w a j a c e ], xlab= c z a s b e z c z y n n o s c i, main= Czas b e z c z y n n o s c i po,, r o z g r z a n i u serwera, 100) Jak widzimy rozkład czasu bezczynności ma atom w zerze. Masa tego atomu może być oceniona następująco >mean( dane. out$ c z a s. b e z c z y n n o s c i [ zadania. r o z g r z e w a j a c e ]==0) [ 1 ] 0. 4 8 0 5 Przyjmijmy, że jeżeli w 90% przypadków czas bezczynności wynosi 0, to serwer jest przeciążony. 4.5.1 Zadania: oceń prawdopodobieństwo przeciążenia, dla lambda = 0.92, oceń prawdopodobieństwo, że serwer będzie bezczynny przez ponad 5 jednostek czasu (dla różnych lambda), oceń, jaka frakcja zadań musi czekać ponad 1 jednostkę czasu na rozpoczęcie działania. 7