Budowa modeli klasyfikacyjnych w oparciu o funkcję odległości w przestrzeni zdarzeń i uogólnienie pojęć probabilistycznych na przestrzenie metryczne

Podobne dokumenty
Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.

Rachunek Prawdopodobieństwa Rozdział 5. Rozkłady łączne

Wykład 3 Jednowymiarowe zmienne losowe

Statystyka i eksploracja danych

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących

Rozkłady wielu zmiennych

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka

jest ciągiem elementów z przestrzeni B(R, R)

Pojęcie przestrzeni probabilistycznej

Prawdopodobieństwo i statystyka

Rozkłady dwóch zmiennych losowych

Stacjonarne procesy gaussowskie, czyli o zwiazkach pomiędzy zwykła

Korzystając z własności metryki łatwo wykazać, że dla dowolnych x, y, z X zachodzi

1 Wykład 3 Generatory liczb losowych o dowolnych rozkładach.

Technologie i systemy oparte na logice rozmytej

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Rachunek prawdopodobieństwa- wykład 6

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Aby przygotować się do kolokwiów oraz do egzaminów należy ponownie przeanalizować zadania

Przykładowe zadania na egzamin z matematyki - dr Anita Tlałka - 1

Prawa wielkich liczb, centralne twierdzenia graniczne

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Inżynieria Wiedzy i Systemy Ekspertowe. Logika rozmyta. dr inż. Michał Bereta Politechnika Krakowska

SID Wykład 7 Zbiory rozmyte

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Logika binarna. Prawo łączności mówimy, że operator binarny * na zbiorze S jest łączny gdy (x * y) * z = x * (y * z) dla każdego x, y, z S.

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Funkcja wykładnicza kilka dopowiedzeń

Rachunek prawdopodobieństwa Rozdział 4. Zmienne losowe

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

MIARY ZALEŻNOŚCI OPARTE NA KOPULACH

Estymacja w regresji nieparametrycznej

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Detekcja rozkładów o ciężkich ogonach

Statystyczna analiza awarii pojazdów samochodowych. Failure analysis of cars

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Wstęp do rachunku prawdopodobieństwa. Cz. 2 / William Feller. wyd. 4, dodr. 3. Warszawa, Spis treści

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa

Komputerowa Analiza Danych Doświadczalnych

Wymagania edukacyjne z matematyki

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Propozycja szczegółowego rozkładu materiału dla 4-letniego technikum, zakres podstawowy. Klasa I (60 h)

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Wykład 11: Martyngały: definicja, twierdzenia o zbieżności

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Statystyka i eksploracja danych

Kurs logiki rozmytej. Wojciech Szybisty

Rachunek prawdopodobieństwa (Elektronika, studia niestacjonarne) Wykład 3

W2 Podstawy rachunku prawdopodobieństwa (przypomnienie)

Metody iteracyjne rozwiązywania układów równań liniowych (5.3) Normy wektorów i macierzy (5.3.1) Niech. x i. i =1

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

O ŚREDNIEJ STATYSTYCZNEJ

Agnieszka Nowak Brzezińska Wykład III

Szkice do zajęć z Przedmiotu Wyrównawczego

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

PRÓBNY EGZAMIN MATURALNY







EGZAMIN MAGISTERSKI, Biomatematyka

Komputerowa Analiza Danych Doświadczalnych

Zmienna losowa i jej rozkład Dystrybuanta zmiennej losowej Wartość oczekiwana zmiennej losowej

Wykład 1. Informatyka Stosowana. 3 października Informatyka Stosowana Wykład 1 3 października / 26

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Inteligencja obliczeniowa


Wykład 2 Zmienne losowe i ich rozkłady

Zmienne losowe. Powtórzenie. Dariusz Uciński. Wykład 1. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

PRÓBNY EGZAMIN MATURALNY

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Rachunek Prawdopodobieństwa i Statystyka

Dystrybuanty pozorne. w analizie ekstremów szeregów czasowych

3. Generacja liczb losowych o różnych rozkładach

MATEMATYKA. kurs uzupełniający dla studentów 1. roku PWSZ. w ramach»europejskiego Funduszu Socjalnego« Adam Kolany.

Aleksander Adamowski (s1869) zmienn ą losow ą T o rozkładzie wykładniczym o średniej 5 minut.

PODSTAWY INŻYNIERI WIEDZY



Ekonometria Finansowa II EARF. Michał Rubaszek

Wynik pomiaru jako zmienna losowa

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Lista 0 wstęp do matematyki

Wycena papierów wartościowych - instrumenty pochodne

Jądrowe klasyfikatory liniowe

Wstęp do topologii Ćwiczenia

Krzywe Freya i Wielkie Twierdzenie Fermata

MATeMAtyka zakres podstawowy

Elementy logiki. Zdania proste i złożone

Fizyka statystyczna, elementy termodynamiki nierównowagowej Cele, zakres zagadnień

TERMODYNAMIKA I FIZYKA STATYSTYCZNA

Matematyka finansowa i ubezpieczeniowa - 8 Wycena papierów wartościowych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Transkrypt:

Budowa modeli klasyfikacyjnych w oparciu o funkcję odległości w przestrzeni zdarzeń i uogólnienie pojęć probabilistycznych na przestrzenie metryczne C. Dendek prof nzw. dr hab. J. Mańdziuk Politechnika Warszawska, Wydział Matematyki i Nauk Informacyjnych

Outline Cel prac 1 Cel prac 2 3

Zagadnienia Cel prac Cel pracy teoretyczne wyprowadzenie miary odległości w przestrzeniach probabilistycznych wykorzystanie teorii w praktycznych zastosowaniach klasyfikacyjnych (k-nn) znalezienie uogólnień możliwych do zastosowania dla innych klasyfikatorów

Norma trójkatna Cel prac Norma trójkatna T (x, y): uogólnienie koniunkcji w logice wielowartościowej (monotoniczność) a,b,c,d [0,1] a b c d T (a, c) T (b, d) (przemienność) x,y [0,1] T (x, y) = T (y, x) (łaczność) x,y,z [0,1] T (x, T (y, z)) = T (T (x, y), z) (neutralność względem prawdy liczby 1) x [0,1] T (x, 1) = x

Rozmyta relacja równoważności Rozmyta relacja równoważności R(x, y) R(1, 1) = R(0, 0) = 1 R(1, 0) = R(0, 1) = 0

Rozmyta równoważność metryczna Rozmyta równoważność metryczna R M 1 x,y [0,1] R M (x, y) = R M (y, x) 2 x,y [0,1] R M (x, y) = 1 x = y 3 R M (1, 0) = 0 4 x,y,z [0,1] R M (x, y) T (R M (x, z), R M (z, y))

Rozmyta równoważność metryczna Rozmyta równoważność metryczna R M Dla danej normy trójkatnej można zbudować równoważność metryczna (przy pomocy residuum): T (a, b) = sup {z T (a, z) b}. z [0,1] R M (a, b) = T (a, b) = min ( T (a, b), T (b, a)). Odległość rozmyta można wprowadzić jako d M (x, y) = 1 R M (x, y)

Wielowymiarowe rozmyte równoważności metryczne Wielowymiarowe rozmyte równoważności metryczne Jednowymiarowe równoważności metryczne można łaczyć przy wykorzystaniu norm trójkatnych (odległość wielowymiarowa): R C = T (R 1,..., R n )

Kopuły statystyczne Kopuły statystyczne 1 (zerowalność) u=(u1,...,u n) [0,1] nmin (u 1,..., u n ) = 0 C (u) = 0 2 (minimalność) u=(1,...,1,uk,1,...,1) [0,1] nc (u) = u k 3 (n monotoniczność) wybierajac dowolne punkty x 1,..., x n, y 1,..., y n tak, aby i {1,...,n} 0 x i < y i 1 i oznaczajac Q = {x 1, y 1 } {x n, y n }, sgn Q : Q {0, 1}, p = (z 1,..., z n ) ( 1) card{k {1,...,n}z k =x k } spełniony jest warunek sgn Q (p)c(p) 0 p Q

Kopuły statystyczne Kopuły statystyczne bliskie pojęciu norm trójkatnych (bez przemienności i monotoniczności) rozważamy jedynie kopuły monotoniczne określaja miarę na zbiorze (tak jak dystrybuanty) Twierdzenie Sklara: Dla każdego rozkładu prawdopodobieństwa charakteryzowanego dystrybuanta F(x 1,..., x n ) istnieje taka kopuła C(z 1,..., z n ), że dla rozkładów brzegowych charakteryzowanych dystrybuantami F 1 (x 1 ),..., F n (x n ) zachodzi F(x 1,..., x n ) = C(F 1 (x 1 ),..., F n (x n )).

Miara odległości pomiędzy zdarzeniem losowym i punktem z przestrzeni obserwacji Odległość probabilistyczna d(x; v) = F 1 (ˆx+ ˆx ˆv ) F 1 (ˆx ˆx ˆv ) df (x) = = min(1, ˆx + ˆx ˆv ) max(0, ˆx ˆx ˆv )

Uogólnienie odległości probabilistycznej: kopuły statystyczne Uogólnienie odległości probabilistycznej odległość probabilistyczna jest jednowymiarowa miara poprzez liczenie miar hiperprostopadłościanów

Miara odległości pomiędzy 2 zdarzeniami losowymi Odległość probabilistyczna Można wykorzystać normę trójkatn a w celu symetryzacji: D(u, v) = 1 T (1 d(u; v), 1 d(v; u)).

Specyfika klasyfikatora k NN Specyfika klasyfikatora k NN najwyższa rozdzielczość dla niewielkich wartości miary odległości możliwość zastosowania przybliżeń prawdziwych w otoczeniu 0.

Miary odległości dla klasyfikatora k NN Miary odległości dla klasyfikatora k NN W pracy wyprowadzono poprzez przybliżanie rozwinięć określonych norm trójkatnych następujace typy łaczeń: łaczenie liniowe łaczenie ważone łaczenie oparte o miękkie normy trójkatne łaczenie w oparciu parametryzowana t normę Yagera łaczenie w oparciu o odległość Mahalanobisa.

Miary odległości dla klasyfikatora k NN Miary odległości dla klasyfikatora k NN W pracy wyprowadzono następujace typy symetryzacji: symetryzacja w oparciu o t normę maksymalna symetryzacja w oparciu o t normę maksymalna zastosowana bezpośrednio symetryzacja w oparciu o parametryzowana t normę Yagera symetryzacja w oparciu o t normę multiplikatywna symetryzacja w oparciu o t normę Łukasiewicza symetryzacja w oparciu o wartość oczekiwana argumentów.

Dziękuję za uwagę Dziękuję za uwagę