Metody systemowe i decyzyjne w informatyce

Podobne dokumenty
Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce

Rozpoznawanie obrazów

Rozpoznawanie obrazów

Podstawowe modele probabilistyczne

WYKŁAD 2 i 3. Podstawowe pojęcia związane z prawdopodobieństwem. Podstawy teoretyczne. autor: Maciej Zięba. Politechnika Wrocławska

Metody systemowe i decyzyjne w informatyce

WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska

Metody systemowe i decyzyjne w informatyce

WYKŁAD 3. Klasyfikacja: modele probabilistyczne

Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak

Rozpoznawanie obrazów

SPOTKANIE 3: Regresja: Regresja liniowa

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Fuzja sygnałów i filtry bayesowskie

SPOTKANIE 4: Klasyfikacja: Regresja logistyczna

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

Wprowadzenie do uczenia maszynowego. Jakub Tomczak

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Metody systemowe i decyzyjne w informatyce

Prawdopodobieństwo i statystyka r.

5 Przegląd najważniejszych rozkładów

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

1 Gaussowskie zmienne losowe

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Rozkłady prawdopodobieństwa

Różne rozkłady prawdopodobieństwa

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Metody systemowe i decyzyjne w informatyce

Jądrowe klasyfikatory liniowe

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Modele zapisane w przestrzeni stanów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

1.1 Wstęp Literatura... 1

PROCESY STOCHASTYCZNE. PEWNE KLASY PROCESÓW STOCHASTYCZNYCH Definicja. Procesem stochastycznym nazywamy rodzinę zmiennych losowych X(t) = X(t, ω)

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych.

Procesy stochastyczne

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Najczęściej spotykane rozkłady dyskretne:

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Testowanie hipotez statystycznych.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Procesy stochastyczne

WYKŁAD 2. Problem regresji - modele liniowe

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Komputerowa analiza danych doświadczalnych

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Ważne rozkłady i twierdzenia c.d.

Algorytmy estymacji stanu (filtry)

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Dynamiczne stochastyczne modele równowagi ogólnej

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Komputerowa analiza danych doświadczalnych

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Wykład 3 Jednowymiarowe zmienne losowe

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Rozkłady prawdopodobieństwa zmiennych losowych

Centralne twierdzenie graniczne

Agata Boratyńska Statystyka aktuarialna... 1

12DRAP - parametry rozkładów wielowymiarowych

Własności statystyczne regresji liniowej. Wykład 4

Komputerowa analiza danych doświadczalnych

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Metoda najmniejszych kwadratów

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe.

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Metody probabilistyczne

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

Statystyka aktuarialna i teoria ryzyka, model indywidualny i zespołowy, rozkłady złożone

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Wnioskowanie bayesowskie

Wstęp do Rachunku Prawdopodobieństwa, IIr. WMS

Metoda największej wiarygodności

Wnioskowanie statystyczne. Statystyka w 5

Prawdopodobieństwo i statystyka

1 Zmienne losowe wielowymiarowe.

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Metoda największej wiarygodności

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Rachunek prawdopodobieństwa i statystyka

Funkcja tworząca Funkcja charakterystyczna. Definicja i własności Funkcja tworząca momenty

Transkrypt:

Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 2 autorzy: A. Gonczarek, J.M. Tomczak Metody estymacji ML Zad. 1 Pojawianie się spamu opisane jest zmienną losową x o rozkładzie dwupunktowym z parametrem θ [0, 1], gdzie zmienna x przyjmuje wartość 1, jeśli pojawiająca się wiadomość jest spamem. Pewien użytkownik otagował N wiadomości. Korzystając z metody największej wiarygodności wyznaczyć estymator parametru θ. Zad. 2 Populacja studentów Politechniki Wrocławskiej została podzielona na trzy grupy: 1. Studenci osiągający średnią do 3.5. 2. Studenci osiągający średnią od 3.5 do 4.5. 3. Studenci osiągający średnią powyżej 4.5. Populacja studentów opisana jest wektorem losowym x = (x 1 x 2 x 3 ) T, przyjmującym trzy wartości (1 0 0) T, gdy student należy do pierwszej grupy, (0 1 0) T, gdy student należy do drugiej grupy i (0 0 1) T, gdy student należy do trzeciej grupy. Rozkład zmiennej x wyraża się za pomocą rozkładu wielopunktowego o wektorze parametrów θ = (θ 1 θ 2 θ 3 ) T. Z populacji studentów wybrano N obserwacji. Korzystając z metody największej wiarygodności wyliczyć estymator parametrów θ. Zad. 3 Alarm samochodowy uzależnia swoje działanie od czujnika badającego poziom ultradźwięków w kabinie. Czujnik przed rozpoczęciem działania wymaga kalibracji. Przyjęto, że pomiary dokonywane przez czujnik są realizacjami zmiennej losowej x o rozkładzie normalnym N (x µ, σ 2 ). Dokonano N pomiarów, gdy w kabinie nie występował żaden ruch. Korzystając z metody największej wiarygodności wyznaczyć estymatory parametrów µ i σ 2. Zad. 4 Charakterystyka wybranego słowa wypowiadanego przez człowieka opisana jest wektorem losowym cech x = (x 1... x D ) T przyjmującym wartości z wielowymiarowego rozkładu normalnego 1

N (x µ, Σ). Pobrano N próbek danego słowa wypowiadanego przez różne osoby. Korzystając z metody największej wiarygodności wyznaczyć estymatory µ i Σ. Metoda estymacji MAP Zad. 5 Niech zmienna losowa x {0, 1} oznacza odpowiednio porażkę lub zwycięstwo Śląska Wrocław w meczu. Zmienna x opisana jest rozkładem dwupunktowym B(x θ). Zebrano wyniki N spotkań. Przyjmując rozkład a priori Beta(θ a, b), wyznaczyć estymator MAP (maksymalnego a posteriori) parametru θ. Jak można zinterpretować parametry a i b? 2

Rozkład dwupunktowy: DODATEK B(x θ) = θ x (1 θ) 1 x, gdzie x {0, 1} i θ [0, 1] E[x] = θ Var[x] = θ(1 θ) Rozkład wielopunktowy: D D M(x θ) = θ x d d, gdzie x d {0, 1} i θ d [0, 1] dla każdego d = 1, 2,..., D, θ d = 1 d=1 d=1 E[x d ] = θ d Var[x d ] = θ d (1 θ d ) Rozkład normalny: N (x µ, σ 2 ) = 1 { exp 2π σ E[x] = µ Var[x] = σ 2 } (x µ)2 2σ 2 Rozkład normalny wielowymiarowy: { 1 1 N (x µ, Σ) = (2π) D/2 Σ exp 1 } 1/2 2 (x µ)t Σ 1 (x µ), gdzie x jest wektorem D-wymiarowym, µ D-wymiarowy wektor średnich, Σ macierz D D kowariancji E[x] = µ Cov[x] = Σ Rozkład beta: Γ(a + b) Beta(x a, b) = Γ(a)Γ(b) xa 1 (1 x) b 1, gdzie x [0, 1] oraz a > 0 i b > 0, Γ(x) = E[x] = Var[x] = a a+b ab (a+b) 2 (a+b+1) 0 t x 1 e t dt Rozkład brzegowy: Dla rozkładu ciągłego: p(x) = p(x, y)dy i dla rozładu dyskretnego: p(x) = y p(x, y) 3

Rozkład warunkowy: p(y x) = p(x, y) p(x) Rozkład brzegowy i warunkowy dla wielowymiarowego rozkładu normalnego: Załóżmy, że x N (x µ, Σ), gdzie x = x a x b, µ = µ a µ b wtedy mamy następujące zależności: p(x a ) = N (x a µ a, Σ a ), p(x a x b ) = N (x a ˆµ a, ˆΣ a ), gdzie ˆµ a = µ a + Σ c Σ 1 b (x b µ b ), ˆΣ a = Σ a Σ c Σ 1 b Σ T c. Twierdzenie Bayesa:, Σ = Σ a Estymator największej wiarygodności: Σ T c Σ c Σ b, p(y x) = p(x y)p(y) p(x) Danych jest N niezależnych realizacji D = {x 1... x N } wektora losowego x o rozkładzie p(x θ). Funkcją wiarygodności nazywamy następującą funkcję: N p(d θ) = p(x n θ). n=1 Zlogarytmowaną funkcję p(d θ) możemy określić zależnością: N log p(d θ) = log p(x n θ). n=1 Estymatorem największej wiarygodności nazywamy θ ML takie, że Estymator maksymalnego a posteriori: p(d θ ML ) = max p(d θ). θ Dane są rozkład a priori p(θ) parametru θ oraz N niezależnych realizacji D = {x 1... x N } wektora losowego x o rozkładzie p(x θ). Estymatorem maksymalnego a posteriori (MAP) nazywamy θ MAP maksymalizujący rozkład a posteriori: p(θ MAP D) = max p(θ D). θ 4

Wybrane własności wektorów i macierzy: Dane są wektory x, y i macierz A symetryczna i dodatnio określona. Zachodzą wtedy następujące własności: ˆ y (x y)t A(x y) = 2A(x y) ˆ (x y)t A 1 (x y) A ˆ ln det(a) A = A 1 = A 1 (x y)(x y) T A 1 5