Generowanie liczb o zadanym rozkładzie. ln(1 F (y) λ

Podobne dokumenty
Metody probabilistyczne

Podstawy symulacji komputerowej

Prawdopodobieństwo i statystyka

Sieci Mobilne i Bezprzewodowe laboratorium 2 Modelowanie zdarzeń dyskretnych

Dr inż. Robert Wójcik, p. 313, C-3, tel Katedra Informatyki Technicznej (K-9) Wydział Elektroniki (W-4) Politechnika Wrocławska

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Centralne twierdzenie graniczne

Prawdopodobieństwo i statystyka

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Metody Rozmyte i Algorytmy Ewolucyjne

Testowanie hipotez statystycznych.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Prawdopodobieństwo i statystyka

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Prawdopodobieństwo i statystyka

Statystyka w przykładach

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wykład 11: Martyngały: definicja, twierdzenia o zbieżności

2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7

Ataki na RSA. Andrzej Chmielowiec. Centrum Modelowania Matematycznego Sigma. Ataki na RSA p. 1

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

PAKIETY STATYSTYCZNE

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

Metody probabilistyczne

Matematyka dyskretna - wykład - część Podstawowe algorytmy kombinatoryczne

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Analiza Algorytmów. Informatyka, WPPT, Politechnika Wroclawska. 1 Zadania teoretyczne (ćwiczenia) Zadanie 1. Zadanie 2. Zadanie 3

Rozkłady statystyk z próby

1 Gaussowskie zmienne losowe

Wybrane zagadnienia teorii liczb

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

Prawdopodobieństwo i statystyka r.

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Prawdopodobieństwo i statystyka r.

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Indukcja. Materiały pomocnicze do wykładu. wykładowca: dr Magdalena Kacprzak

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Statystyka Matematyczna Anna Janicka

Prawa wielkich liczb, centralne twierdzenia graniczne

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 14, Kryptografia: algorytmy asymetryczne (RSA)

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Technologie Informacyjne

EGZAMIN MAGISTERSKI, Matematyka w ekonomii i ubezpieczeniach. x i 0,

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

Zestaw 2. Definicje i oznaczenia. inne grupy V 4 grupa czwórkowa Kleina D n grupa dihedralna S n grupa symetryczna A n grupa alternująca.

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 15, Kryptografia: algorytmy asymetryczne (RSA)

Przestrzeń probabilistyczna

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

Strategie ewolucyjne. Gnypowicz Damian Staniszczak Łukasz Woźniak Marek

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Ćwiczenie 3 Generator liczb losowych o rozkładzie Rayleigha.

Metody probabilistyczne

Lista 5. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Kongruencje twierdzenie Wilsona

Przykładowe zadania z teorii liczb

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Weryfikacja hipotez statystycznych

Metody klasyfikacji danych - część 1 p.1/24

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się.

Laboratorium nr 7. Zmienne losowe typu skokowego.

Spacery losowe generowanie realizacji procesu losowego

Wykład 2 Zmienne losowe i ich rozkłady

2. Wykaż, że moment pierwszego skoku w procesie Poissona. S 1 := inf{t : N t > 0} jest zmienną losową o rozkładzie wykładniczym z parametrem λ.

1 Wykład 3 Generatory liczb losowych o dowolnych rozkładach.

Matematyka ubezpieczeń majątkowych r.

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 5.

Biostatystyka, # 3 /Weterynaria I/

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Testowanie hipotez statystycznych.

Sterowanie wielkością zamówienia w Excelu - cz. 3

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Spis treści 3 SPIS TREŚCI

Wykład 10 Testy jednorodności rozkładów

Stacjonarność Integracja. Integracja. Integracja

Treść wykładu. Pierścienie wielomianów. Dzielenie wielomianów i algorytm Euklidesa Pierścienie ilorazowe wielomianów

Rekurencje. Jeśli algorytm zawiera wywołanie samego siebie, jego czas działania moŝe być określony rekurencją. Przykład: sortowanie przez scalanie:

Sortowanie topologiczne skierowanych grafów acyklicznych

Jeśli czas działania algorytmu zależy nie tylko od rozmiaru danych wejściowych i przyjmuje różne wartości dla różnych danych o tym samym rozmiarze,

Prawdopodobieństwo i statystyka

Metody probabilistyczne

Transkrypt:

Wprowadzenie Generowanie liczb o zadanym rozkładzie Generowanie liczb o zadanym rozkładzie wejście X U(0, 1) wyjście Y z zadanego rozkładu F (y) = 1 e λy y = ln(1 F (y) λ = ln(1 0,1563 0, 5 0,34 Wprowadzenie Analiza algorytmu Analiza algorytmu wejście Xi U(0, 2 n 1) Xi niezależne wyjście (Y1, Y2,..., Yl) Yj U(0, k 1) 2 n 1 < k 2 n 1 Ile potrzebujemy liczb na wejściu, żeby wygenerować l liczb na wyjściu? Żeby wygenerować jedną liczbę potrzebujemy N liczb z wejścia, gdzie N ma rozkład geometryczny (pobieramy X y do pierwszego sukcesu) z p = k 2 n. Żeby wygenerować l takich liczb, musimy zsumować l zmiennych o takim rozkładzie: W = N 1 + N 2 +... + N l. Te zmienne są niezależne, ponieważ X y są niezależne. EN i = p 1 = 2n k, D 2 N i = 1 p 2 p 1 = 2n (2 n k) k 2 Z niezależności EN = l 2n k i D 2 N = l 2n (2 n k) k 2. Nierówność Czebyszewa: P(N EN ε) P(lstlisting N EN ε) D2 N Niech ε = lϱ i k = 2 n 1 (najgorszy możliwy przypadek): ε 2 P(N EN ε) = P(N l( 2n k n l2 2 n 1 + ϱ)) = P(N l(2 + ϱ)) 2 2(n 1) l 2 ϱ 2 = 2 lϱ 2 Niech ϱ = 8 i wtedy P(N 10l) 1 32l

Multiply-with-carry Twierdzenie (o rozkładzie) Niech k {2, 3,..., ab} będzie najmniejszą liczbą taką, że b k mod (ab 1) = 1 Jeżeli k = ab 2, to MWC ma okres k (maksymalny możliwy) i axn + Cn U(1, ab 2). k jest rzędem b w grupie Z m. (C n, X n ) ma pełen okres wtw k = ab 2. Niestety, nie wynikają z tego żadne porządne własności X n. Przykładowo, dla a = 12, b = 29 rząd jest 173 Multiply-with-carry Twierdzenie (o rozkładzie) Niech k {2, 3,..., ab} będzie najmniejszą liczbą taką, że b k mod (ab 1) = 1 Jeżeli k = ab 2, to MWC ma okres k (maksymalny możliwy) i axn + Cn U(1, ab 2). Jaki rozkład ma zmienna Xn, jeżeli parametry zapewniają pełen okres? Skoro ax n + C n U(1, ab 2), to X n+1 = (ax n + C n ) mod b nie może mieć rozkładu jednostajnego, ponieważ zbiór możliwych wartości dla ax n + C n, tzn. {1, 2,..., ab 1}, ma ab 2 elementy, a więc liczbę niepodzielną bez reszty przez b. W zbiorze brakuje elementu o reszcie 0 (elementu 0) i elementu o reszcie b 1, tzn. ab 1. Inaczej: każda możliwa reszta występuje w zbiorze a krotnie, natomiast 0 i b 1 występują w nim a 1 krotnie. Dla dużego a z praktycznego punktu widzenia rozbieżność jest pomijalnie mała. Empiryczna obserwacja na bazie parametrów (6, 10), (6, 78) i (10, 162): rozkład jest delikatnie nierównomierny, wartości od 1 do b 2 pojawiają się z prawdopodobieństwem a ab 2, natomiast 0 i b 1 z prawdopodobieństwem a 1 ab 2.

yˆ=y<<17; m to liczba bitów na jakiej operujemy Atak na Atak na Trywialny! Wystarczy sprawdzić wszystkie możliwości dla zadanej pary x 1, x 2. Jest ich dostatecznie mało.

Xn+1 = (69069Xn + 12345) mod 2 32 Yn+1 =Yn(I + L 13 )(I + R 17 )(I + L 5 ) 698769069Zn + Cn Cn+1 = 2 32 Zn+1 = (698769069Zn + Cn) mod 2 32 (Xn+1 + Yn+1 + Zn+1) mod 2 32 Hipoteza (G. Marsaglia) Okres generatora KISS jest dłuższy niż 2 124 Wydaje mi się, że rozumowanie jest następujące: jeżeli generatory są niezależne, to możemy pomnożyć ich okresy. LCG i mają po 2 32, MWC ma (w wariancie optymistycznym, nie sprawdzałem czy tak jest w rzeczywistości) 698769069 2 32 1 2 2 260, zatem cały generator ma okres 2 32 2 32 2 60 = 2 124. 1 2 bierze się z problemów z b = 232. Xn+1 = (69069Xn + 12345) mod 2 32 Yn+1 =Yn(I + L 13 )(I + R 17 )(I + L 5 ) 698769069Zn + Cn Cn+1 = 2 32 Zn+1 = (698769069Zn + Cn) mod 2 32 (Xn+1 + Yn+1 + Zn+1) mod 2 32 Hipoteza (G. Marsaglia) Okres generatora KISS jest dłuższy niż 2 124 Twierdzenie Generator KISS ma rozkład równomierny. Dowód mojego autorstwa. Rozpatrzmy dwie niezależne zmienne losowe X, Y takie, że X, Y U(0, 2 32 1). Niech W = X + Y, rozpatrujemy dwa przypadki: 1. 0 k < 2 32 P(W = k) = k x=0 P(X = x)p(y = k x) = k x=0 1 2 64 = k + 1 2 64 2. 2 32 k < 2 6 4, niech k = 2 32 + l i wtedy 0 l < 2 32. Chcemy sumować w taki sposób, żeby 0 x < 2 32 i 0 k x < 2 32, rozwiązując nierówności otrzymujemy x {l + 1,..., 2 32 1} P(W = k) = 2 32 1 x=l+1 Następnie rozpatrzmy U = (X + Y ) mod 2 32. P(X = x)p(y = k x) = 232 1 (l + 1) + 1 2 6 4 = 1 (l + 1) 232 2 64 = 1 P(W = l) 232 P(U = k) = P(W = k) + P(W = k + 2 32 ) = P(W = k) + 1 1 P(W = k) = 232 2 32

Stan C 128 bitowy licznik, monotoniczny K 256 bitowy klucz, ciąg pseudolosowy Potrzebujemy regularnie wymieniać klucz, inaczej pojawią się statystycznie rozpoznawalne różnice, bo AES nie powtórzy bloku. Stąd ograniczenie do 2 20. Stan C 128 bitowy licznik, monotoniczny K 256 bitowy klucz, ciąg pseudolosowy 1 Function Generate(n) assert: 0 n 2 20 2 result [] 3 for k 1 to n 16 do 4 result result AES(K, C) 5 C C + 1 6 end 7 K AES(K, C) AES(K, C + 1) 8 C C + 2 9 return result 10 end Potrzebujemy regularnie wymieniać klucz, inaczej pojawią się statystycznie rozpoznawalne różnice, bo AES nie powtórzy bloku. Stąd ograniczenie do 2 20.

z automatycznym reseedowaniem z automatycznym reseedowaniem 1 Function FullRandom(n) 2 if w P0 spodziewamy się dostatecznie dużo entropii i od ostatniego reseedowania upłynęło co najmniej 100 ms then 3 Reseed() 4 C C + 1 5 end 6 if C > 0 then return Generate(n) 7 else return błąd 8 end 100ms 2 32 13lat, więc tak łatwo nie wyczerpiemy zapasów Źródła entropii Źródła entropii czas pomiędzy naciśnięciami klawiszy na klawiaturze, ruchami myszy https://software.intel.com/en-us/articles/ intel-digital-random-number-generator-drng-software-implementation-g

Testowanie generatorów Przeprowadzenie testu Przeprowadzenie testu P δ K N ( n 6 4, n 6 4 ) +δ n 6 4 ( n 6 4 δ K n 6 4 + δ ) δ =? = 0,95 k P( n 6 4 δ K n + δ) = P( δ 64 σ K µ σ 2Φ( δ σ ) 1 = 0,95 Φ( δ σ ) = 0,975 n δ = σφ 1 (0,975) = 6 4 1,96 = 0,054 n δ σ ) = Φ( δ σ ) Φ( δ σ ) = 2Φ( δ σ ) 1 Dla n = 10 9, δ 1708, zatem spodziewamy się wyniku pomiędzy 76988, a 77333. Podsumowanie Dobre praktyki Dobre praktyki Stosuj dobre generatory log2(nchoosek(200,80))=190