Metody systemowe i decyzyjne w informatyce

Podobne dokumenty
Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce

Rozpoznawanie obrazów

Rozpoznawanie obrazów

Podstawowe modele probabilistyczne

Metody systemowe i decyzyjne w informatyce

WYKŁAD 2 i 3. Podstawowe pojęcia związane z prawdopodobieństwem. Podstawy teoretyczne. autor: Maciej Zięba. Politechnika Wrocławska

SPOTKANIE 3: Regresja: Regresja liniowa

WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska

Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak

Metody systemowe i decyzyjne w informatyce

Wprowadzenie do uczenia maszynowego. Jakub Tomczak

WYKŁAD 2. Problem regresji - modele liniowe

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

WYKŁAD 3. Klasyfikacja: modele probabilistyczne

Rozpoznawanie obrazów

SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization

Metody systemowe i decyzyjne w informatyce

SPOTKANIE 4: Klasyfikacja: Regresja logistyczna

Metody systemowe i decyzyjne w informatyce

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Metody systemowe i decyzyjne w informatyce

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Metoda najmniejszych kwadratów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Rozpoznawanie obrazów

Fuzja sygnałów i filtry bayesowskie

5 Przegląd najważniejszych rozkładów

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Agata Boratyńska Statystyka aktuarialna... 1

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Jądrowe klasyfikatory liniowe

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

Komputerowa analiza danych doświadczalnych

1 Gaussowskie zmienne losowe

Dynamiczne stochastyczne modele równowagi ogólnej

Własności statystyczne regresji liniowej. Wykład 4

Prawdopodobieństwo i statystyka r.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Wprowadzenie. { 1, jeżeli ˆr(x) > 0, pozatym. Regresja liniowa Regresja logistyczne Jądrowe estymatory gęstości. Metody regresyjne

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Najczęściej spotykane rozkłady dyskretne:

Wstęp do Rachunku Prawdopodobieństwa, IIr. WMS

Rozkłady prawdopodobieństwa

Optymalizacja systemów

Modele zapisane w przestrzeni stanów

Procesy stochastyczne

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Metoda największej wiarogodności

Statystyka w przykładach

Centralne twierdzenie graniczne

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe.

Estymatory nieobciążone

Wykład 3 Jednowymiarowe zmienne losowe

Procesy stochastyczne

Statystyka matematyczna

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Ważne rozkłady i twierdzenia c.d.

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Różne rozkłady prawdopodobieństwa

Prawdopodobieństwo i statystyka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

1.1 Wstęp Literatura... 1

Wykład 11: Martyngały: definicja, twierdzenia o zbieżności

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Przestrzeń probabilistyczna

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

Natalia Neherbecka. 11 czerwca 2010

Zadania z Rachunku Prawdopodobieństwa III - 1

Wnioskowanie statystyczne. Statystyka w 5

PROCESY STOCHASTYCZNE. PEWNE KLASY PROCESÓW STOCHASTYCZNYCH Definicja. Procesem stochastycznym nazywamy rodzinę zmiennych losowych X(t) = X(t, ω)

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

1 Zmienne losowe wielowymiarowe.

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Komputerowa analiza danych doświadczalnych

12DRAP - parametry rozkładów wielowymiarowych

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Metody probabilistyczne

Weryfikacja hipotez statystycznych

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Transkrypt:

Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 2 autorzy: A. Gonczarek, J.M. Tomczak Metody estymacji Zad. 1 Pojawianie się spamu opisane jest zmienną losową x o rozkładzie dwupunktowym z parametrem θ [0, 1], gdzie zmienna x przyjmuje wartość 1, jeśli pojawiająca się wiadomość jest spamem. Pewien użytkownik otagował N wiadomości. Korzystając z metody największej wiarygodności wyznaczyć estymator parametru θ. Zad. 2 Populacja studentów Politechniki Wrocławskiej została podzielona na trzy grupy: 1. Studenci osiągający średnią do 3.5. 2. Studenci osiągający średnią od 3.5 do 4.5. 3. Studenci osiągający średnią powyżej 4.5. Populacja studentów opisana jest wektorem losowym x = (x 1 x 2 x 3 ) T, przyjmującym trzy wartości (1 0 0) T, gdy student należy do pierwszej grupy, (0 1 0) T, gdy student należy do drugiej grupy i (0 0 1) T, gdy student należy do trzeciej grupy. Rozkład zmiennej x wyraża się za pomocą rozkładu wielopunktowego o wektorze parametrów θ = (θ 1 θ 2 θ 3 ) T. Z populacji studentów wybrano N obserwacji. Korzystając z metody największej wiarygodności wyliczyć estymator parametrów θ. Zad. 3 Alarm samochodowy uzależnia swoje działanie od czujnika badającego poziom ultradźwięków w kabinie. Czujnik przed rozpoczęciem działania wymaga kalibracji. Przyjęto, że pomiary dokonywane przez czujnik są realizacjami zmiennej losowej x o rozkładzie normalnym N (x µ, σ 2 ). Dokonano N pomiarów, gdy w kabinie nie występował żaden ruch. Korzystając z metody największej wiarygodności wyznaczyć estymatory parametrów µ i σ 2. Zad. 4 Charakterystyka wybranego słowa wypowiadanego przez człowieka opisana jest wektorem losowym cech x = (x 1... x D ) T przyjmującym wartości z wielowymiarowego rozkładu normalnego 1

N (x µ, Σ). Pobrano N próbek danego słowa wypowiadanego przez różne osoby. Korzystając z metody największej wiarygodności wyznaczyć estymatory µ i Σ. Jaka przykładowa metoda może być zastosowana do ekstrakcji wektora cech x z fali dźwiękowej? Zad. 5 Niech zmienna losowa x {0, 1} oznacza odpowiednio porażkę lub zwycięstwo Śląska Wrocław w meczu. Zmienna x opisana jest rozkładem dwupunktowym B(x θ). Zebrano wyniki N spotkań. Przyjmując rozkład a priori Beta(θ a, b), wyznaczyć estymator MAP (maksymalnego a posteriori) parametru θ. Jak można zinterpretować parametry a i b? Teoria decyzji Zad. 6 (regresja) Dla zmiennych losowych x, y R o łącznym rozkładzie prawdopodobieństwa p(x, y) wyznaczyć optymalny model y(x) minimalizujący ryzyko (średnią stratę) w podejmowaniu decyzji. Przyjąć kwadratową funkcję straty L(y, y) = 1 2 (y y)2. Zad. 7 (klasyfikacja) Dla zmiennych losowych x R, y {1,..., L} o łącznym rozkładzie prawdopodobieństwa p(x, y) wyznaczyć optymalny model y(x) minimalizujący ryzyko (średnią stratę) w podejmowaniu decyzji. Przyjąć zero-jedynkową funkcję straty 0, y = y L(y, y) = 1, y y. Zad. 8 Zmienna losowa T {0, 1} oznacza czy zajazd udostępnia pokoje dla turystów, zmienna S {0, 1} oznacza czy jest sezon turystyczny, zmienna L {0, 1} oznacza czy jest ładna pogoda. Dane są następujące prawdopodobieństwa p(t = 1 S = 1, L = 1) = 0.9, p(t = 1 S = 0, L = 1) = 0.3 oraz p(s = 1 L = 1) = 0.2. Należy wyznaczyć p(t = 1 L = 1) i p(t = 0 L = 1) i na tej podstawie podjąć decyzję czy zajazd udostępnia pokoje dla turystów, jeśli wiemy, że jest ładna pogoda. Model regresji liniowej Zad. 9 Na przełomie roku zebrano N obserwacji D = {(x n, y n )} N n=1, gdzie x n oznacza cenę euro, a y n cenę dolara. Przyjmując model y = φ(x) T w + ε, 2

gdzie w = (w 0... w M 1 ) T, φ(x) = (φ 0 (x)... φ M 1 (x)) T, ε N (ε 0, σ 2 ). Korzystając z metody największej wiarygodności dopasować model regresji liniowej do ciągu obserwacji D wyznaczyć estymatory w i σ 2. Jaką dodatkową informację wnosi ten model w porównaniu do modelu z zadania 4 (lista nr 2)? Zad. 10 Dla problemu jak w zadaniu 10 dodatkowo przyjąć, że znany jest rozkład a priori wektora parametrów w, p(w) = N (w 0, α 2 I), gdzie α jest znane. Ponadto znamy wartość σ 2. Korzystając ze wzoru Bayesa wyznaczyć rozkład a posteriori p(w D), a następnie wyznaczyć estymator wektora parametrów maksymalizujący ten rozkład (estymator MAP). Jaki jest związek podanego podejścia z zadaniem najmniejszych kwadratów z regularyzacją Tichonowa? 3

Rozkład dwupunktowy: DODATEK B(x θ) = θ x (1 θ) 1 x, gdzie x {0, 1} i θ [0, 1] E[x] = θ Var[x] = θ(1 θ) Rozkład wielopunktowy: D D M(x θ) = θ x d d, gdzie x d {0, 1} i θ d [0, 1] dla każdego d = 1, 2,..., D, θ d = 1 d=1 d=1 E[x d ] = θ d Var[x d ] = θ d (1 θ d ) Rozkład normalny: N (x µ, σ 2 ) = 1 { exp 2π σ E[x] = µ Var[x] = σ 2 } (x µ)2 2σ 2 Rozkład normalny wielowymiarowy: { 1 1 N (x µ, Σ) = (2π) D/2 Σ exp 1 } 1/2 2 (x µ)t Σ 1 (x µ), gdzie x jest wektorem D-wymiarowym, µ D-wymiarowy wektor średnich, Σ macierz D D kowariancji E[x] = µ Cov[x] = Σ Rozkład beta: Γ(a + b) Beta(x a, b) = Γ(a)Γ(b) xa 1 (1 x) b 1, gdzie x [0, 1] oraz a > 0 i b > 0, Γ(x) = E[x] = Var[x] = a a+b ab (a+b) 2 (a+b+1) 0 t x 1 e t dt Rozkład brzegowy: Dla rozkładu ciągłego: p(x) = p(x, y)dy i dla rozładu dyskretnego: p(x) = y p(x, y) 4

Rozkład warunkowy: p(y x) = p(x, y) p(x) Rozkład brzegowy i warunkowy dla wielowymiarowego rozkładu normalnego: Załóżmy, że x N (x µ, Σ), gdzie x = x a x b, µ = µ a µ b wtedy mamy następujące zależności: p(x a ) = N (x a µ a, Σ a ), p(x a x b ) = N (x a ˆµ a, ˆΣ a ), gdzie ˆµ a = µ a + Σ c Σ 1 b (x b µ b ), ˆΣ a = Σ a Σ c Σ 1 b Σ T c. Twierdzenie Bayesa:, Σ = Σ a Estymator największej wiarygodności: Σ T c Σ c Σ b, p(y x) = p(x y)p(y) p(x) Danych jest N niezależnych realizacji D = {x 1... x N } wektora losowego x o rozkładzie p(x θ). Funkcją wiarygodności nazywamy następującą funkcję: N p(d θ) = p(x n θ). n=1 Zlogarytmowaną funkcję p(d θ) możemy określić zależnością: N log p(d θ) = log p(x n θ). n=1 Estymatorem największej wiarygodności nazywamy θ ML takie, że Estymator maksymalnego a posteriori: p(d θ ML ) = max p(d θ). θ Dane są rozkład a priori p(θ) parametru θ oraz N niezależnych realizacji D = {x 1... x N } wektora losowego x o rozkładzie p(x θ). Estymatorem maksymalnego a posteriori (MAP) nazywamy θ MAP maksymalizujący rozkład a posteriori: p(θ MAP D) = max p(θ D). θ 5

Ryzyko w podejmowaniu decyzji: Ryzyko (średnią stratę) definiujemy jako następujący funkcjonał: gdzie L(, ) oznacza funkcję straty. Wybrane własności wektorów i macierzy: R[y] = L(y, y(x)) p(x, y)dxdy, Dane są wektory x, y i macierz A symetryczna i dodatnio określona. Zachodzą wtedy następujące własności: ˆ y (x y)t A(x y) = 2A(x y) ˆ (x y)t A 1 (x y) A ˆ ln det(a) A = A 1 = A 1 (x y)(x y) T A 1 6