Generatory liczb pseudolosowych

Podobne dokumenty
Generatory liczb pseudolosowych

Generatory liczb pseudolosowych

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka

Algorytmy zrandomizowane

Generacja liczb pseudolosowych

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Metody Rozmyte i Algorytmy Ewolucyjne

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

STATYSTYKA

Prawdopodobieństwo i statystyka r.

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Algorytmy i struktury danych. Wykład 4

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Układy stochastyczne

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Komputerowa Analiza Danych Doświadczalnych

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Całkowanie metodą Monte Carlo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Testowanie hipotez statystycznych.

Dr inż. Robert Wójcik, p. 313, C-3, tel Katedra Informatyki Technicznej (K-9) Wydział Elektroniki (W-4) Politechnika Wrocławska

Testowanie hipotez statystycznych.

Ważne rozkłady i twierdzenia c.d.

Rozkłady statystyk z próby

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Komputerowa Analiza Danych Doświadczalnych

Własności statystyczne regresji liniowej. Wykład 4

Metody numeryczne. Wykład nr 12. Dr Piotr Fronczak

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Metody numeryczne I Równania nieliniowe

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Ważne rozkłady i twierdzenia

Szybka transformacja Fouriera (FFT Fast Fourier Transform)

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Spis treści 3 SPIS TREŚCI

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Redukcja wariancji w metodach Monte-Carlo

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna i ekonometria

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Prawdopodobieństwo i statystyka

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Całkowanie numeryczne przy użyciu kwadratur

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Podstawy symulacji komputerowej

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Z poprzedniego wykładu

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

6.4 Podstawowe metody statystyczne

Spacery losowe generowanie realizacji procesu losowego

Statystyka i eksploracja danych

Wybrane rozkłady zmiennych losowych. Statystyka

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

166 Wstęp do statystyki matematycznej

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 15, Kryptografia: algorytmy asymetryczne (RSA)

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Wykład 3 Hipotezy statystyczne

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Elementy statystyki wielowymiarowej

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wybrane rozkłady zmiennych losowych. Statystyka

ZAGADNIENIA PROGRAMOWE I WYMAGANIA EDUKACYJNE DO TESTU PRZYROSTU KOMPETENCJI Z MATEMATYKI DLA UCZNIA KLASY II

Modelowanie komputerowe

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Prawdopodobieństwo i statystyka

Rozkłady dwóch zmiennych losowych

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Monte Carlo, bootstrap, jacknife

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 14, Kryptografia: algorytmy asymetryczne (RSA)

Transkrypt:

Generatory liczb pseudolosowych Plan wykładu:. Generatory o rozkładzie równomiernym a) liniowe b) kombinowane generator uniwersalny c) nieliniowe 2. Generatory o dowolnym rozkładzie prawdopodobieństwa a) metoda odwracania dystrybuanty b) metoda eliminacji c) superpozycja rozkładów d) rozkład dyskretny 3. Generatory o rozkładach wielowymiarowych a) rozkład równomierny na sferze i kuli w RM b) dwuwymiarowy rozkład normalny 4. Testowanie generatorów a) testy zgodności z rozkładem: c2, OPSO b) testy zgodności z rozkładem statystyk: pozycyjne, test sum

Generatory o rozkładzie równomiernym generatory liczb losowych fizyczne programowe (komputerowe) Najprostsze generatory liczb losowych to generatory fizyczne wykorzystujące: ) szumy układów elektronicznych 2) promieniotwórczość Zalety: dostajemy ciągi liczb losowych (niezależne, nieskorelowane) Wady: wymagana ciągła kalibracja (testowanie parametrów), kłopoty techniczne z obsługą, brak powtarzalności serii Własności generatorów komputerowych a) b) c) d) łatwość obsługi możliwość generowania dowolnego rozkładu dowolna liczba wymiarów powtarzalność ciągów generowanych liczb 2

Jak pracują komputerowe generatory liczby? ) Tworzony jest ciąg liczb nieujemnych (naturalnych) o rozkładzie równomiernym według wybranego algorytmu. Liczby ograniczone są od góry przez reprezentację, np. dla k=32 bitowej reprezentacji liczby całkowitej bez znaku, kres górny Ta okres aperiodyczności ciągu T0 okres ciągu 2) Aby uzyskać liczby rzeczywiste dokonujemy przekształcenia 3) Dokonujemy kolejnej transformacji ciągu aby uzyskać ciąg o zadanym rozkładzie prawdopodobieństwa (normalny, wielomianowy, etc.) 3

Generatory liniowe Generatory liniowe tworzą ciąg liczb według schematu: gdzie: a, a2,...,ak, c, m parametry generatora (ustalone liczby) Operację nazywamy dzieleniem modulo a jej wynikiem jest reszta z dzielenia liczb całkowitych a i n. Lub inaczej: r jest kongruentne do a modulo n jeśli n jest dzielnikiem a-r. Generatory wykorzystujące operację dzielenia modulo to generatory kongruentne lub kongruencyjne. Przykład 9 8 7 6 mod mod mod mod 6 6 6 6 = =0 =5 =4 5 mod 6 =3 4 mod 6 =2 3 mod 6 = 2 mod 6 =0 4

Aby wygenerować ciąg liczb pseudolosowych należy zdefiniować jego parametry. Liczby nazywamy ziarnem generatora (seed). Dla bardziej rozbudowanych generatorów liczby te otrzymujemy z innego generatora lub np. używając zegara systemowego (X 0). Najprostszy generator liniowy ma dwie odmiany a) generator multiplikatywny gdy b) generator mieszany gdy Maksymalny okres generatora liniowego to (m-) Generator multiplikatywny 5

Ostatnie równanie można zapisać w postaci skąd wynika, że wybór X0 determinuje wszystkie liczby w generowanym ciągu (a i m są ustalone) uzyskany ciąg liczb jest deterministyczny Przykład. Generator multiplikatywny Xi a= 2 3 4 5 6 7 8 9 0 i=0 2 3 4 5 6 7 8 9 0 2 4 9 5 3 3 5 9 4 3 8 5 9 4 7 2 6 3 4 5 4 3 9 9 3 4 5 5 0 0 0 0 6 9 5 4 3 7 7 8 6 2 8 3 4 9 5 9 6 2 8 7 0 6

Okres generatora multiplikatywnego Maksymalny okres generatora multiplikatywnego uzyskujemy dla Gdy m jest liczbą pierwszą a p jest czynnikiem pierwszym liczby (m-). Przykład Wykorzystujemy liczby Mersenne'a (które dość często są liczbami pierwszymi) Okres generatora Liczby występują dokładnie raz w pojedynczym okresie generatora. Odległość pomiędzy najbliższymi sąsiadami 7

Rozkład przestrzenny ciągu Wadą generatorów multiplikatywnych jest nierównomierne pokrycie d-wymiarowej kostki (I d). Generowane liczby lokalizują się na hiperpłaszczyznach, których położenie uzależnione jest od parametrów generatora. Przykład. a) X0=, a=2 b) X0=, a=8 8

Parametry statystyczne generatora o rozkładzie równomiernym w (0,)-> U(0,) Jeśli generowany ciąg liczb jest niezależny to wartość oczekiwana (średnia <- estymator) powinna wynosić natomiast wariancja jest równa Ponadto współczynniki autokorelacji elementów ciągu powinny wynosić 0. Jeśli parametry statystyczne generatora (ciągu generowanych przez niego liczb) odbiegają od powyższych wartości to jest on nieprzydatny (lub warunkowo przydatny). 9

Funkcja autokorelacji opisuje zależność elementów ciągu od wyrazów poprzednich. Definicja oraz wzór dla ciągu skończonego (r=s-t) Inaczej: opisuje związek pomiędzy elementami dwóch szeregów danego i przesuniętego o r. Dla rozkładu jednorodnego R~0 oznacza brak korelacji pomiędzy elementami ciągu, czyli rozkład liczb pseudolosowych jest stochastyczny. Efektywnie funkcję autokorelacji można badać przy użyciu FFT splot dwóch wektorów. 0

Przykłady generatorów liniowych Ich okresy są maksymalne tj. równe (m-) Generatory na rejestrach przesuwnych Definiujemy ciąg bitów bi otrzymywanych rekurencyjnie gdzie: są stałymi binarnymi, a stałe bi tworzą ciąg inicjujący.

Inny sposób zapisu relacji rekurencyjnej wykorzystuje operator xor który można zdefiniować a b a xor b 0 0 0 0 0 0 jeśli założymy to relację rekurencyjną można zapisać przy użyciu xor Jakie są własności takiego ciągu bitów? Ciąg jest okresowy o okresie nieprzekraczającym 2 k a dokładniej (2k-) ze względu na wyrzucenie układu bitów złożonych z samych zer. Praktyczną realizacją tego pomysłu jest algorytm wykorzystujący tylko dwa elementy ciągu: 2

Przykład. Generator Tauswortha Wykorzystujemy ciąg bitów do obliczenia liczby pseudolosowej z przedziału (0,] gdzie: s jest ustaloną całkowitą liczbą nieujemną a) jeśli s<l to do utworzenia U i oraz Ui+ wykorzystywane są elementy tego samego podciągu b) jeśli s=l to Ui oraz Ui+ są tworzone z rozłącznych fragmentów ciągu globalnego Ciąg bitów łatwo generuje się przy użyciu rejestrów przesuwnych oraz bramek logicznych (xor) łatwa implementacja w języku C. Modyfikacja tego typu generatora to generator Mersenne Twister (998) okres generatora to o rozkładzie 3

Generator Fibonacciego Punktem wyjścia do konstrukcji generatora są liczby Fibonacciego a dokładniej ciąg reszt tego ciągu Powyższy ciąg reszt ma rozkład równomierny ale nie spełnia testów niezależności (autokorelacja). Jego modyfikacja typ operacji: nie posiada już tej wady. Generator charakteryzuje się dużym okresem ale jest wolniejszy np. względem generatorów multiplikatywnych co obecnie nie jest już dużą wadą. Okres generatora zależy od operacji. Dla dostaniemy 4 bitowy

Kombinacje generatorów (zwiększamy okres i/lub polepszamy własności statystyczne) Zakładamy że dysponujemy zmiennymi losowymi X i Y określonymi na zbiorze S={,2,...,n} z rozkładami prawdopodobieństwa Z tych liczb możemy utworzyć wektory Za normę wektora przyjmiemy p-normę Miarą odległości danego rozkładu od rozkładu równomiernego w nwymiarowej kostce jednostkowej będzie wówczas wyrażenie 5

Dla określonego działania na zbiorze S tj. rozkład nowej zmiennej losowej będzie bliższy rozkładowi równomiernemu niż rozkłady zmiennych X i Y Nowy ciąg ma lepsze własności statystyczne a także większy okres. Jeżeli ciąg ma okres T, a ciąg ma okres T2 oraz T i T2 są liczbami pierwszymi to wtedy nowy ciąg liczb ma okres równy TT2. 6

Generator uniwersalny Daje jednakowe wyniki na dowolnym komputerze. Jego działanie oparte jest na wykorzystaniu kombinacji kilku generatorów Pierwszy z nich jest generatorem Fibonacciego działanie jest zdefiniowane następująco lub Inicjalizację generatora tj.wyznaczenie ciągu przeprowadzamy przy pomocy ciągu bitów (24-bitowa mantysa, 6 bitowe liczby całkowite) tj. Ciąg bitów generujemy przy użyciu dwóch generatorów 7

Generatory muszą być zainicjowane, korzystamy tu z dwóch ciągów Okres generatora kombinowanego (Vn): 220. Drugi generator (cn) o rozkładzie równomiernym w (0,) jest zdefiniowany następująco działanie definiujemy w postaci Okres tego generatora to 224-3. Okres generatora uniwersalnego (Un): 244 8

Generatory nieliniowe Zaletą generatorów nieliniowych jest to, że ciągi generowanych przez nie liczb nie układają się na hiperpłaszczyznach tak jak w przypadku generatorów liniowych. Wykorzystuje się w nich odwrotność modulo : Przykład: Do znalezienia x- wykorzystuje się algorytm podziału Euklidesa (poszukiwania największego wspólnego podzielnika dwóch liczb gcd(a,b)) gcd greatest common divisor Algorytm: Jeśli 9

Generowanie x- algorytmem Aignera: ) generujemy ciąg liczb: i wyznaczamy ciag wspołczynników qi 2) generujemy ciąg liczb start: 3) jeśli x=0 to x =0 - znaleziona odwrotność 20

Generator nielinowy Eichenauera-Lehna gdzie: m jest liczbą pierwszą. Uzyskujemy w ten sposób ciąg liczb o rozkładzie równomiernym. Generator nieliniowy Eichenauera-Hermanna W generatorze tym kolejne elementy ciągu są niezależne od poprzednich cecha szczególnie przydatna w obliczeniach równoległych. Dla generator osiąga okres T=m. Aby generator osiągał maksymalny okres równy m musi być spełniony jeszcze warunek: jest najmniejszą liczbą całkowitą dla której zachodzi 2

Generatory o dowolnym rozkładzie prawdopodobieństwa Metoda odwracania dystrybuanty Dystrybuanta określonego rozkładu prawdopodobieństwa jest funkcją niemalejącą i prawostronnie ciągłą Dystrybuanta jednoznacznie definiuje rozkład prawdopodobieństwa. Związek pomiędzy dystrybuantą a gęstością prawdopodobieństwa f(x): Jeśli uda nam się znaleźć F- to: zmienna losowa x ma rozkład o dystrybuancie F 22

U jest zmienną losową o rozkładzie równomiernym w przedziale (0,). Nową zmienną losową będzie Generujemy więc ciąg liczb pseudolosowych który przekształcamy w ciąg Wówczas liczby Xi mają rozkład prawdopodobeństwa o dystrybuancie F. Odwracanie dystrybuanty można wykorzystać także w przypadku rozkładów dyskretnych. Np. ciąg zmiennych o rozkładzie można wygenerować przy użyciu ciągu korzystając ze wzoru 23

Przykład - rozkład jednomianowy Funkcja gęstości prawdopodobieństwa to a pozostałe parametry rozkładu przyjmijmy w postaci Określamy funkcję opisującą dystrybuantę i uzależniamy x od U 24

Przykład - rozkład eksponencjalny Przykład - rozkład normalny N(0,) gęstość prawdopodobieństwa Dystrybuanta [ erf(x) funkcja błędu ] 0, 8 0, 6 0, 4 0, 2 0-0 - 5 0 y 5 0 u=0, s= u=0, s=2 u=0, s=3 25

Szukanie funkcji odwrotnej erf(x) jest kosztowne. Częściej stosuje się metodę Boxa-Mullera. Metoda Boxa-Mullera Definiujemy fgp w 2D jako funkcję gaussowską Docelowo chcemy policzyć prawdopodobieństwo (czyli że wylosowana liczba znajdzie się w obszarze dxdy) Wprowadzamy nowe zmienne (radialne) Prawdopodobieństwo określmy przy użyciu nowych zmienych - dokonaliśmy separacji zmiennych (r,θ) w wykładniku funkcji exp 26

Wprowadzamy jeszcze raz nową zmienną (ułatwi nam to całkowanie) Dostaliśmy rozkład wykładniczy, który wiemy jak wygenerować następnie podstawiamy: Kąt θ ma rozkład jednorodny, więc używamy generatora o rozkładzie jednorodnym Dla pary (U,U2) dostajemy (x,y) dla rozkładu N(0,) Jeśli chcemy zmienić parametry rozkładu normalnego, to dokonujemy transformacji 27

Metoda eliminacji (von Neumann) Chcemy wygenerować ciąg zmiennych losowych o gęstości prawdopodobieństwa f w przedziale [a,b]. Wartość f jest w przedziale [a,b] ograniczona od góry przez stałą d. Sposób otrzymania ciągu zmiennych losowych o rozkładzie f(x) jest następujący: ) Losujemy dwie zmienne o rozkładzie równomiernym 2) jeżeli 3) gdy powyższy warunek nie jest spełniony wówczas odrzucamy parę U, U2 4) wykonujemy czynności -3 aż do uzyskania odpowiednio licznego ciągu Wygenerowana zmienna losowa X ma rozkład prawdopodobieństwa f. 28

Generowanie ciągu liczb pseudolosowych o zadanym rozkładzie algorytmem Metropolisa Modyfikujemy metodę eliminacji. W standardowej postaci jest ona mało wydajna bo nierzadko odrzucamy większość wyników. Dzięki algorytmowi Metropolisa nie odrzucamy żadnego. Akceptację nowego położenia (nowej liczby w ciągu) dokonujemy zgodnie z formułą czyli: ) Jeśli f(xi) > f(xi-) to nowe położenie akceptujemy zawsze. 2) W przeciwnym wypadku akceptacja następuje z prawdopodobieństwem f(xi)/f(xi-). Jeśli nie akceptujemy nowego punktu to zatwierdzamy stary (każdy krok generuje nowy element ciągu). Uwaga: w naszym przykładzie aby zachodził warunek pij=pji (wymagana symetria) 29

Superpozycja rozkładów Naszym zadaniem jest uzyskanie ciągu liczb pseudolosowych o gęstości f(x), którą możemy wyrazić w postaci gdzie: gt(x) oraz h(t ) są również gęstościami prawdopodobieństwa funkcje znane. Rozkład prawdopodobieństwa f(x) nazywamy rozkładem złożonym. Algorytm generowania liczb o rozkładzie f(x) jest następujący: ) generujemy zmienną T o rozkładzie h 2) dla wartości t zmiennej losowej T generujemy zmienną losową X dla rozkładu gęstości gt(x) W praktyce całkę często zastępuje się sumą (np.. rozkład wielomianowy przykład dalej) pi określa dyskretną funkcję gęstości prawdopodobieństwa z warunkiem normalizacji jak dla dystrybuanty 30

Przedział [a,b] w którym generujemy ciąg zmiennych z rozkładem f(x) dzielimy na sumę K rozłącznych podprzedziałów. W każdym z nich (Ai) wyznaczamy oraz gdzie: Ai jest funkcją przynależności do podzbioru Ai (przyjmuje wartości: 0 lub ). Algorytm generacji ciągu zmiennej X jest wówczas następujący: ) Losujemy zmienną losową (rozkład może nie być równomierny) 2) Dla wygenerowanej wartości i zmiennej I generujemy X z rozkładem gęstości Dla dostatecznie wąskich przedziałów można h(t) przybliżyć wielomianem niskiego stopnia. 3

Przykład rozkład wielomianowy normalizacja (dystrybuanta) Algorytm generowania zmiennej losowej:. Generujemy indeks z rozkładem prawodopodobieństwa 2. W przedziale n generujemy zmienną X o rozkładzie jednomianowym Docelowo ciąg zmiennych X będzie mieć zadany rozkład wielomianowy. 32

Przykład rozkład Beta Eulera Rozkład Gamma Eulera ma postać Jeśli dwie zmienne g i g2 mają rozkłady -p i q to parametry, ich wartości są ustalone To zmienna X 33 ma rozkład f(x;p,q)

Rozkład dyskretny a) metoda odwracania dystrybuanty W rozkładzie dyskretnym mamy określone prawdopodobieństwo wylosowania danej liczby (rozkład może nie być równomierny) wraz z warunkiem Algorytm generowania ciągu zmiennych o rozkładzie dyskretnym: ) X=0, S=p0 2) losujemy zmienną U o rozkładzie równomiernym z przedziału [0,] 3) sprawdzamy warunek Przykład na następny slajdzie a) iteracyjnie obliczamy (zwiększamy S) dopóki warunek jest spełniony b) W przeciwym wypadku akceptujemy X 4) Kroki -3 wykonujemy aż do uzyskania odpowiednio licznego ciągu X,X2,X3,... 34

k=0 0 k= U=0.73 k=2 k=3 k=4 p0+p+p2+p3+p4 = p0+p+p2+p3 = 0.8 p0+p+p2 = 0.6 p0+p = 0.4 p0 = 0.2 Przykład..0 35

b) Metoda równomiernego rozbicia przedziału Modyfikacja poprzedniej metody: zamiast wielokrotnego sumowania dokonumjemy dwóch porównań Zakładamy, że zmienna losowa X przyjmuje określone wartości z pewnym prawdopodobieństwem Przedział (0,) dzielimy na K+ podprzedziałów o jednakowej długości Zmienna U wpada do przedziału Konstruujemy dwa ciągi 36

Algorytm ) Generujemy zmienną U o rozkładzie równomiernym w (0,) 2) Obliczamy 3) iteracyjnie obliczamy dopóki jest spełniony warunek 4) jeśli to akceptujemy X 5) Kroki -4 powtarzamy aż do uzyskania odpowiednio licznego ciągu X,X2,... Powyższy algorytm zapewnia to, że warunek będzie sprawdzany conajwyżej dwukrotnie. 37

Generatory o rozkładach wielowymiarowych Zadanie można sformułować następująco: należy wygenerować ciąg wielowymiarowych zmiennych (wektorów) losowych których rozkład prawdopodobieństwa ma gęstość Do generacji takiego ciągu można stosować metodę eliminacji czy superpozycji rozkładów. Przy użyciu metody elminacji w najprostszej postaci pojawiają się problemy. Przykład. Określić prawdopodobieństwo akceptacji wielowymiarowej zmiennej losowej o rozkładzie równomiernym na kuli jednostkowej (K k(0,)). Algorytm. Losujemy m zmiennych niezależnych o rozkładzie równomiernym w (-,) i konstruujemy zmienną wielowymiarową Zmienną akceptujemy jeśli w przeciwnym wypadku, odrzucamy ją bo leży poza kulą. 38

Prawdopodobieństwo akceptacji zmiennej jest równe ilorazowi objętości kuli i opisanej na niej kostki [-,] k Średnia liczba wylosowanych punktów Nm potrzebnych do realizacji jednej zmiennej wynosi m pk Nk 2 7.854 x 0-.27 5.645 x 0-6.08 0 2.490 x 0-3 4.05 x 02 20 2.46 x 0-8 4.063 x 07 50.537 x 0-28 6.507 x 027 Modyfikacją usprawniającą powyższy algorytm jest podział kostki na rozłączne podobszary i przeprowadzenia losowania w każdym z nich z osobna. 39

Przykład. Znajdźmy rozkład gęstości w kole 2D (d=2) o promieniu R= wzór na powierzchnię element powierzchnii we wsp. radialnych C stała liczbowa Potraktujmy funkcję podcałkową jako fgp i znajdźmy stałą normalizacyjną Fgp rozkładu lub ogólnie dla d wymiarów Policzmy objętość metodą MC (następny wykład) Uwaga: to funkcja podcałkowa próbkowana z fgp f(r) 40

Rozkład równomierny na sferze Jeżeli k-wymiarowa zmienna losowa ma rozkład równomierny na sferze to spełniony jest warunek Definicja: k-wymiarowa zmienna X ma rozkład sferycznie konturowany jeżeli jej gęstość prawdopodobieństwa zależy tylko od Dysponując zmienną o rozkładzie sferycznie konturowanym wygenerujemy zmienną o rozkładzie równomiernym na sferze oraz wewnątrz kuli. 4

Wniosek: mając do dyspozycji odpowiedni rozkład sferycznie konturowany można go użyć do generowania zmiennej losowej o rozkładzie równomiernym na powierzchnii kuli. Przykład. m-wymiarowy rozkład normalny opisuje gęstość Algorytm generowania rozkładu równomiernego na sferze w m wymiarach: ) generujemy m-wymiarową zmienną losową X o rozkładzie normalnym 2) obliczamy Rozkład nowej zmiennej X będzie równomierny na sferze Sm. 42

Rozkład równomierny na sferze Sk i Sk+ Jeżeli zmienna k określa wymiar przestrzeni ma rozkład równomierny na k-wymiarowej sferze Sk (z rozkładu sferycznie konturowanego), R jest zmienną o rozkładzie a s jest losowym znakiem to (k+)-wymiarowa zmienna losowa ma rozkład równomierny na (k+) wymiarowej sferze. 43

Rozkład równomierny w kuli Kk Długość wektora wodzącego R zmiennej X jest także zmienną losową i ma ona rozkład Wystarczy więc wygenerować punkt leżący na sferze Sk a następnie obliczyć Zmiena X leży wewnątrz kuli jednostkowej Kk i ma w tym obszarze rozkład równomierny. Po co rozkład w kuli Kk(0,)? Pewne obiekty wielowymiarowe możemy przedstawić w postaci prostych transformacji liniowych współrzędnych. Taką transformację reprezentuje macierz Przykład hiperelipsoidę w Rk otrzymamy transformując Kk(0,). 44

Testowanie generatorów liczb pseudolosowych Ponieważ wszystkie generatory o dowolnym rozkładzie bazują na wykorzystaniu ciągów liczb losowych o rozkładzie równomiernym więc istotne jest badanie tylko generatorów liczb o takim właśnie rozkładzie. Testowanie generatora jest procesem złożonym: ) dla ustalonej liczby n, generujemy n kolejnych liczb startując od losowo wybranej liczby początkowej 2) obliczamy wartość statystyki testowej (T) (np. test χ2) 3) obliczamy F(T) czyli dystrybuantę statystyki T, gdy weryfikowana hipoteza jest prawdziwa kroki -3 powtarzamy N-krotnie obliczając statystyki: T,T2,...,TN. Jeśli weryfikowana hipoteza jest prawdziwa to jest ciągiem zmiennych niezależnych o rozkładzie równomiernym. Testowanie generatora kończy się sprawdzeniem tej hipotezy. 45

Testy zgodności z zadanym rozkładem Test chi-kwadrat (rozkład ciągły lub dyskretny) Jest najczęściej stosowanym testem. Badamy w nim hipotezę że generowana zmienna losowa X ma rozkład prawdopodobieństwa o dystrybuancie F. Jeżeli to możemy dokonać następującego podziału zbioru wartości zmiennej X Generujemy ciąg n liczb Sprawdzamy ile z nich spełnia warunek ich liczbę oznaczamy ni. 46

Statystyką testu jest Dla dużego n statystyka ta ma rozkład c2 o (k-) stopniach swobody. Możemy tak dobrać szerokości przedziałów aby otrzymać zależność wówczas statystyka przyjmuje prostszą postać 47

Przykład. Test generatora o trójkątnym rozkładzie fgp. mamy 2 parametry więc 2 stopnie swobody mniej: (k--2) hi st ogramf or t rangl e pdf 0. 22 expect ed obser ved 0. 2 0. 8 0. 6 Test -procedura: 2. Grupujmey liczby w k przedziałach 3. Liczymy wartość statystyki testowej χ2 4. Dla zadanego poziomu a sprawdzamy czy χ2 < wartości granicznej pi, fi. Generujemy serię N liczb z rozkładu 0. 4 0. 2 0. 0. 08 0. 06 0. 04 0. 02 0 2 3 4 5 6 7 x 48

Test możemy rozszerzyć test zgodności z rozkładem ciągłym Kołmogorova-Smirnova Generujemy M próbek o rozkładzie trójkątnym (N liczb w każdej próbce) Dla każdej próbki obliczamy wartość statystyki testowej c2 i sortujemy je. Dla każdej wartości obliczamy empiryczną wartość dystrybuanty i jej dokładną wartość lub grupujemy je tak aby częstości występowania wzrastały o np.: p=0.05 hi st ogramf or t rangl e pdf hi st ogramf or t rangl e pdf 0. 8 0. 7 0. 6 0. 5 0. 4 obser ved- CDF exact - CDF 0. 3 t ri angl e pdf sampl es: N= 500 0. 2 chi2 bi ns: k=0 0. chi sampl es: 0 2 3 2 0. 8 0. 6 obser ved- CDF exact - CDF 0. 4 t ri angl e pdf sampl es: N= 500 2 c hi bi ns: k=0 0. 2 c hi2 sampl es: M= 0 5 0 5 20 25 30 35 40 45 50 55 chi Cumul at i ve densi t y f unct i on Cumul at i ve densi t y f unct i on 0. 9 0 M= 03 vert i cal bi ns f or p=0. 05 0 5 0 5 20 25 30 35 40 45 50 2 c hi Obliczamy wartości statystyk 49 Ich wartości porównujemy z wartościami granicznymi dla założonego poziomu ufności, odrzucając lub nie hipotezę że wygenerowany ciąg liczb ma zadany (np. trójkątny) rozkład.

Test OPSO (overlapping-pairs-sparse-occupancy) Generujemy ciąg liczb Jeśli z każdej weźmiemy k bitów to możemy utworzyć ciąg liczb całkowitych z zakresu {0,,...,2r-}. Następnie tworzymy ciąg kolejnych nakładających się par Jeśli przez Y oznaczymy liczbę takich par które nie pojawiły się w ciągu (Ii,Ii+), to ta zmienna ma rozkład normalny N(m,s) oczywiście dla odpowiednio dużego n. Przykładowe parametry testu OPSO b n m s 0 22 222 4909 542998 290.26 638.75 2 23 567639 580.80 2 50

Testy zgodności rozkładów statystyk Jeżeli wygenerowany ciąg zmiennych losowych Jest ciągiem zmiennych niezależnych to możemy z elementów tego ciągu utworzyć wektory które też będą zmiennymi losowymi ale o rozkładzie równomiernym w kostce jednostkowej (0,)m. Możemy zatem zdefiniować pewną funkcję określoną w kostce jednostkowej. W ten sposób tworzymy ciąg nowych zmiennych losowych o jednakowym rozkładzie i dystrybuancie Testowanie generatora polega na sprawdzeniu hipotezy że ciąg Y,Y2,... jest próbką z populacji o dystrybuancie G. 5

Testy oparte na statystykach pozycyjnych Dla wektorów losowych w kostce (0,)m definiujemy funkcje co generuje nowe zmienne Nowe zmienne mają następujące rozkłady Testowanie generatora polega na sprawdzeniu hipotezy o zgodności rozkładów zmiennych U,V,R z powyższym. Testy przeprowadza się dla niewielkich wartości m=2,3,...,0. 52

Test sum Definiujemy funkcję Wygenerowana zmienna losowa Y ma rozkład o gęstości Dla m=2 Dla m=3 Testowanie generatora polega na weryfikacji hipotezy, że zmienna losowa Y ma rozkład zgodny z gm(y). Zazwyczaj m nie przekracza 5. 53