MODELOWANIE RZECZYWISTOŚCI

Podobne dokumenty
MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI

Podręcznik. Nieskończona liczba przypadków

MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI

Modelowanie rzeczywistości - jak w komputerze przegląda się świat

MODELOWANIE RZECZYWISTOŚCI

Metody probabilistyczne

Podręcznik. Model czy teoria

MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI

MODELOWANIE RZECZYWISTOŚCI

Matematyczne Podstawy Kognitywistyki

Metody probabilistyczne

Podręcznik. Wzór Shannona

Prawdopodobieństwo geometryczne

MODELOWANIE RZECZYWISTOŚCI

Ważne rozkłady i twierdzenia

Podstawy nauk przyrodniczych Matematyka

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 2 ZADANIA - ZESTAW 2

Metody Statystyczne. Metody Statystyczne.

Układy stochastyczne

Podręcznik. Przykład 1: Wyborcy

Metody Rozmyte i Algorytmy Ewolucyjne

RACHUNEK PRAWDOPODOBIEŃSTWA I KOMBINATORYKA

Excel - podstawa teoretyczna do ćwiczeń. 26 lutego 2013

Teoretyczne podstawy informatyki

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Rachunek prawdopodobieństwa- wykład 2

MODELOWANIE RZECZYWISTOŚCI

Moneta 1 Moneta 2 Kostka O, R O,R 1,2,3,4,5, Moneta 1 Moneta 2 Kostka O O ( )

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

0 + 0 = 0, = 1, = 1, = 0.

Technologie Informacyjne

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

Monte Carlo, bootstrap, jacknife

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

P r a w d o p o d o b i eństwo Lekcja 1 Temat: Lekcja organizacyjna. Program. Kontrakt.

Elementy modelowania matematycznego

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Rozkłady zmiennych losowych

Uczeń: -podaje przykłady ciągów liczbowych skończonych i nieskończonych oraz rysuje wykresy ciągów

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Prawdopodobieństwo zadania na sprawdzian

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa

Plan wynikowy. Klasa III Technik pojazdów samochodowych/ Technik urządzeń i systemów energetyki odnawialnej. Kształcenie ogólne w zakresie podstawowym

Materiały dla finalistów

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Symulacja w przedsiębiorstwie

Lista zadania nr 4 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ

Z poprzedniego wykładu

Sieci Mobilne i Bezprzewodowe laboratorium 2 Modelowanie zdarzeń dyskretnych

MODELOWANIE RZECZYWISTOŚCI

Rozkłady statystyk z próby

EGZAMIN MATURALNY W ROKU SZKOLNYM 2017/2018 INFORMATYKA

CZEŚĆ PIERWSZA. Wymagania na poszczególne oceny,,matematyka wokół nas Klasa III I. POTĘGI

Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Ćwiczenie 3 Generator liczb losowych o rozkładzie Rayleigha.

MATEMATYKA Z PLUSEM DLA KLASY VII W KONTEKŚCIE WYMAGAŃ PODSTAWY PROGRAMOWEJ. programowej dla klas IV-VI. programowej dla klas IV-VI.

Pojęcie szeregu nieskończonego:zastosowania do rachunku prawdopodobieństwa wykład 1

Deska Galtona. Adam Osękowski. Instytut Matematyki, Wydział Matematyki, Informatyki i Mechaniki Uniwersytet Warszawski

Wybrane rozkłady zmiennych losowych. Statystyka

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 1 ZADANIA - ZESTAW 1. (odp. a) B A C, b) A, c) A B, d) Ω)

Temat: Statystyka i prawdopodobieństwo w naszym życiu.

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Wykład 2: Tworzenie danych

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Uniwersytet Kazimierza Wielkiego w Bydgoszczy Zespół Szkół nr 5 Mistrzostwa Sportowego XV Liceum Ogólnokształcące w Bydgoszczy

Program MC. Obliczyć radialną funkcję korelacji. Zrobić jej wykres. Odczytać z wykresu wartość radialnej funkcji korelacji w punkcie r=

Plan wynikowy. Klasa III Technikum ekonomiczne. Kształcenie ogólne w zakresie rozszerzonym

= 10 9 = Ile jest wszystkich dwucyfrowych liczb naturalnych podzielnych przez 3? A. 12 B. 24 C. 29 D. 30. Sposób I = 30.

WYMAGANIA Z MATEMATYKI NA POSZCZEGÓLNE OCENY KLASYFIKACYJNE DLA UCZNIÓW KLAS TRZECICH. Sposoby sprawdzania wiedzy i umiejętności uczniów

KURS PRAWDOPODOBIEŃSTWO

ZAGADNIENIA NA EGZAMIN POPRAWKOWY Z MATEMATYKI W KLASIE III TECHNIKUM.

WYMAGANIA EDUKACYJNE Z MATEMATYKI DLA KLASY 7SP. V. Obliczenia procentowe. Uczeń: 1) przedstawia część wielkości jako procent tej wielkości;

Prawdopodobieństwo geometryczne

Systemy liczbowe. 1. Przedstawić w postaci sumy wag poszczególnych cyfr liczbę rzeczywistą R = (10).

a)dane są wartości zmiennej losowej: 2, 4, 2, 1, 1, 3, 2, 1. Obliczyć wartość średnią i wariancję.

Matematyka podstawowa X. Rachunek prawdopodobieństwa

Układy dynamiczne Chaos deterministyczny

SCENARIUSZ LEKCJI MATEMATYKI, FIZYKI LUB BIOLOGII Z WYKORZYSTANIEM FILMU ROZKŁAD NORMALNY.

ROZKŁAD NORMALNY. 2. Opis układu pomiarowego

Rachunek prawdopodobieństwa

Rachunek Prawdopodobieństwa i Statystyka

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Wybrane rozkłady zmiennych losowych. Statystyka

a. zbiór wszystkich potasowań talii kart (w którym S dostaje 13 pierwszych kart, W - 13 kolejnych itd.);

RACHUNEK PRAWDOPODOBIEŃSTWA ZADANIA Z ROZWIĄZANIAMI. Uwaga! Dla określenia liczebności zbioru (mocy zbioru) użyto zamiennie symboli: Ω lub

Rozkład Gaussa i test χ2

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Janusz Adamowski METODY OBLICZENIOWE FIZYKI Kwantowa wariacyjna metoda Monte Carlo. Problem własny dla stanu podstawowego układu N cząstek

Biostatystyka, # 2 /Weterynaria I/

Matematyka z el. statystyki, # 2 /Geodezja i kartografia II/

Transkrypt:

MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN Szkoła Wyższa Psychologii Społecznej d.wojcik@nencki.gov.pl dwojcik@swps.edu.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/

Podręcznik Iwo Białynicki-Birula Iwona Białynicka-Birula

Ciągi liczb losowych Czy ciąg 0,1,0,1,0,1,... jest losowy? Jaki ciąg uznamy za typowy przykład ciągu losowego? Napisz ciąg zer i jedynek o długości 128 znaków Policz ile jest w tym ciągu podciągów złożonych z trzech, czterech i pięciu jedynek Porównaj z wynikami wygenerowanymi przez program Bernoulli

Prawdopodobieństwo wylosowania ciągów samych jedynek Aby uzyskać samotną jedynkę w binarnym ciągu trzeba wyrzucić po kolei 0,1,0 prawdopodobieństwo ½ * ½ * ½ = 1/8 Aby uzyskać n jedynek w binarnym ciągu trzeba wyrzucić po kolei 0,1,...,1,0 to daje prawdopodobieństwo 1 1 1 1 1 n 2... = 2 2 2 2 2 n razy Zatem prawdopodobieństwo wyrzucenia 6,7,8 jedynek pod rząd to odpowiednio 1/256, 1/512 i 1/1024

Prawdopodobieństwo wylosowania ciągów samych jedynek Jeżeli prawdopodobieństwo wyrzucenia 8 jedynek pod rząd to 1/1024, ile razy trzeba rzucić monetą, żeby średnio zaobserwować jeden ciąg 8 jedynek w serii?

Ludzkie zachowanie przy zgadywaniu liczb losowych Alphone Chapanis, twórca ergonomiki, zauważył, że większość ludzi proszona o wypisanie ciągu liczb losowych starała się unikać powtarzania tej samej liczby trzy razy pod rząd (1953). Wiele osób uważało też niektóre liczby za bardziej losowe od innych.

Błędne rozumienie przypadkowości Jakie jest prawdopodobieństwo tego, że w grupie 30 osób znajdą się dwie urodzone tego samego dnia?

Błędne rozumienie przypadkowości Paradoks urodzinowy: prawdopodobieństwo, że w grupie 30 osób znajdą się dwie urodzone tego samego dnia wynosi ponad 70%, chociaż ludziom często wydaje się znacznie mniejsze. Takie efekty psychologiczne wykorzystuje się w konstrukcji schematów loteryjnych, żeby wytworzyć u ludzi przekonanie łatwej wygranej.

Błędne rozumienie przypadkowości Badania nad ludzkim rozumieniem przypadkowości są wykorzystywane do automatycznego wykrywania oszustw. Amerykański Urząd Skarbowy (IRS) nie jest w stanie sprawdzić wszystkich formularzy podatkowych. Najpierw sprawdza te, w których testy statystyczne sugerują nieprawidłowości

Prawo Benforda Najważniejszą rolę w wykrywaniu oszustw odgrywa prawo Bedforda: Weźmy dowolny rzeczywisty zbiór danych dotyczący jakiejś wielkości, np. liczba ludności krajów, powierzchnie krajów, długości rzek, statystyki sportowe, itd. i wybierzmy z niego jedną liczbę. Prawdopodobieństwo, że jej pierwszą cyfrą będzie 1 wynosi ok. 30%. Prawdopodobieństwo wystąpienia kolejnych cyfr wynosi: 1 P d =log 1 d

Prawo Benforda Program Benford Prawo to jest nieintuicyjne większość ludzi spodziewa się, że każda cyfra powinna być równie prawdopodobna. Wynika ono z faktu, że jeżeli istnieje prawo dotyczące rozkładu wszystkich cyfr w rzeczywistych zbiorach danych, to musi być ono niezmiennicze ze względu na skalowanie (zmianę jednostek). Jedyny taki rozkład to rozkład logarytmiczny dany w prawie Benforda.

Prawo Benforda Prawo Benforda stosowano wielokrotnie do wykrywania nadużyć i błędów, zarówno ludzkich jak i maszynowych (komputerowych). Przy jego pomocy nie można wykryć jednego błędu w dużym zbiorze danych, ale można stwierdzić niewłaściwą procedurę generacji lub przetwarzania danych.

Deska Galtona Pochylona deska z wbitymi gwoździami ułożonymi w trójkąt. Można jej użyć do wizualizacji wielokrotnego rzucania monetą

Deska Galtona Jeżeli prawdopodobieństwo skoku w prawo lub w lewo na każdym gwoździu jest takie samo, to prawdopodobieństwo rozkładu na ostatnim poziomie dane jest przez trójkąt Pascala Program Galton

Trójkąt Pascala Prawdopodobieństwo dojścia do najdalszego końca wynosi 1/2n. Łatwo to zgadnąć, bo istnieje tylko jedna droga, która tam prowadzi. Prawdopodobieństwo dojścia do pozycji s przy n rzutach (odbiciach) jest równe sumie prawdopodobieństw uzyskania s-1 w n-1 rzutach i odbicia w prawo, powiększonej o prawdopodobieństwo uzyskania s+1 w n-1 rzutach i odbicia w lewo. Tą regułę opisuje trójkąt Pascala.

Trójkąt Pascala Trójkąt Pascala powstaje przy obliczaniu n-tej potęgi dwumianu. Każdy współczynnik w trójkącie Pascala równy jest liczbie dróg jakimi można do niego dojść

Współczynniki dwumianu Liczby w n-tym wierszu trójkąta Pascala, zwane współczynnikami dwumianowymi, oznaczane są symbolem Newtona i dane są wzorem: n! n = k! n k! k Zatem prawdopodobieństwa trafienia do odpowiedniej przegródki wynoszą 1 n! p n, k = n 2 k! n k! Zachodzi n k =0 p n, k =1

Błądzenie przypadkowe Ruch punktu na prostej lub w przestrzeni o dowolnym wymiarze polegający na wykonywaniu losowych kroków o stałej długości w jednym z kilku wybranych kierunków. Deska Galtona jest równoważna błądzeniu przypadkowemu na prostej. Błądzenie przypadkowe jest modelem ruchu cząstki Browna

Spacery losowe model dyfuzji Błądzenie przypadkowe (spacer losowy) w przestrzeni stanowi model dyfuzji i ruchów Browna rozprzestrzeniania się cząsteczek w danym środowisku. Średnia odległość od punktu początkowego rośnie z czasem t jak t Program Smoluchowski

Wzór Stirlinga Prawdopodobieństwo powrotu do miejsca startu wynosi 2n! p 2 n, n = 2n 2 n!n! Dla n = 2,4,6,8,10,12... otrzymujemy 1/2, 3/8, 5/16, 35/128, 63/256, 231/1024... Ze wzoru Stirlinga n n n! 2 n n e otrzymujemy przybliżenie: 2 p 2 n, n n

Asymptotyka rozkładu dwumianowego Widzimy, że prawdopodobieństwo powrotu cząstki do punktu startu maleje do 0 Zauważmy, że także liczba możliwych wyników rośnie. Żeby badać zachowanie rozkładu dla dużych n musimy go znormalizować. Mnożąc prawdopodobieństwa przez n /2 i tak samo kurcząc skalę na osi x otrzymujemy dla dużych n rozkład Gaussa: 2 p x = 1 / exp x

Asymptotyka rozkładu dwumianowego Mnożąc prawdopodobieństwa przez n /2 i tak samo kurcząc skalę na osi x otrzymujemy dla dużych n rozkład Gaussa: 2 p x = 1 / exp x

Rozkład Gaussa Zwany też rozkładem normalnym, bardzo często występuje w przyrodzie. Jeżeli jakaś własność opisywana jest jedną liczbą, to bardzo często rozkład jej wartości dany jest krzywą Gaussa. Na przykład histogram wartości wzrostu ludzi w danej populacji jest dobrze przybliżany rozkładem Gaussa. Krzywa normalna opisuje też wagę, rozmiar buta, iloraz inteligencji i wiele innych rozkładów własności organizmów żywych.

Generatory liczb losowych Komputery generują liczby pseudolosowe, nie losowe. Generacja polega na wielokrotnym stosowaniu funkcji mieszającej do liczby początkowej (zarodka). Wybieramy zarodek, x0. Wyliczamy x1=f(x0), x2=f(x1), i tak dalej.

Generatory liczb losowych Wygenerowane liczby powtarzają się po pewnym czasie. Im dłuższy okres, tym lepszy generator. Im lepiej potasowane liczby, tym lepszy generator. Popularne generatory liczb losowych w kompilatorach mają często krótki okres, np. 224.

Generatory liczb losowych Popularne generatory liczb losowych w kompilatorach mają często krótki okres, np. 224. Taki generator przy rzutach monetą nigdy nie wygeneruje ciągu identycznych cyfr (na przykład jedynek) dłuższego niż 25. W symulacjach i w zastosowaniach potrzebujemy zwykle znacznie lepszych generatorów liczb losowych, takich jak np. Mersenne twister okres 219937-1

Inne źródła liczb losowych Tabele liczb losowych, np. rozwinięcia liczb normalnych Pomiary fizyczne odpowiednich układów Funkcje mieszające

Do czego potrzebujemy losowych ciągów? Do każdego praktycznego zastosowania teorii prawdopodobieństwa: Wybór próbki statystycznej Gry matematyczne (np. negocjacje) Obliczenia metodą Monte Carlo bezpieczny Internet: zakupy, komunikacja

Liczby normalne ponownie Liczba normalna liczba, w której rozwinięciu w danym układzie każdy blok cyfr jest tak samo prawdopodobny jak każdy inny blok tej samej długości Rozwijając liczbę normalną w bazie o podstawie 36 możemy generować losowe teksty: 10 cyfr + 26 liter łacińskich, albo 35 polskich liter i spacja. Przykład rozwinięcia liczby pi po polsku.

Prawdopodobieństwo wystąpienia dowolnego tekstu Trzydziestotomowa encyklopedia Britannica zawiera około 30 milionów znaków. Prawdopodobieństwo wystąpienia jej tekstu w przypadkowym tekście wynosi 30 000000 1 36 45 000 000 1 10 Prawdopodobieństwo wystąpienia krótkich słów, jak Budda wynosi 5 1 36 1 60 000 000 czyli w tekście długości 60 mln znaków takie słowa powinny wystąpić przynajmniej raz

Kodowanie tekstów w rozwinięciach Znajdowanie tekstów w rozwinięciach liczb normalnych nie tylko zależy od podstawy ale i od kodowania, tj. od tego co przypiszemy danemu symbolowi w rozwinięciu