Minimalizacja ryzyka strukturalnego, podejście Vapnika
|
|
- Małgorzata Skiba
- 9 lat temu
- Przeglądów:
Transkrypt
1 Miimalizacja ryzyka strukturalego, podejście Vapika Wykład IV Wisła, grudzień 2009
2 Miimalizacja ryzyka strukturalego Problem klasyfikacji dla dwóch klas, g = 2. L(f (x), y) = I {f (x) y}. Załóżmy, że daa jest rodzia C potecjalych klasyfikatorów φ R p φ : R p { 1, 1}. (ideks klasy Y = ±1). Na przykład C = {φ a : φ a (x) = sig(a x)} Problem: Ocea błędu predykcji dla reguły miimalizującej ryzyko empirycze (estymator błędu przez powtóre podstawieie).
3 Przykład p(x 1) U[0, 1] i p(x 1) U[1, 2] Miimale ryzyko reguły (ryzyko bayesowskie rówa) się 0. A 1,..., A obserwacje z populacji pierwszej B 1,..., B obserwacje z populacji drugiej. LDA Fishera w tym przypadku redukuje się do: klasyfikuj do drugiej populacji gdy X > T = (Ā + B )/2 Err U = 1 (P(X > T Y = 1) + P(X < T Y = 1) = T 1 /2 2 Err = E T 1 /2 E N(0, 1 24 ) = 1 4 π
4 Szacujemy bład, jaki popełimy, wybierając klasyfikator φ miimalizujący estymator błędu przez powtóre podstawieie (ryzyko empirycze) Ile różi się err(φ) = 1 I {φ(x i ) Y i }. i=1 φ = argmi φ C err(φ). Err U (φ ) = P(φ (X 0 ) Y 0 U) od miimalego błędu w klasie wszystkich klasyfikatorów if φ Err(φ).
5 (Err U (φ ) if Err(φ)) φ C } {{ } błąd estymacji Err U (φ ) if φ Err(φ) = + (if φ C Err(φ) if φ Err(φ)) } {{ } błąd aproksymacji Zwiększając rodzię C zwiększamy (zmiejszamy) błąd estymacji (aproksymacji). Zmiejszając rodzię C zmiejszamy (zwiększamy) błąd estymacji (aproksymacji).
6 Błąd estymacji φ = argmi φ C Err(φ) Err U (φ ) Err( φ) Err U (φ ) err(φ ) + err( φ) Err( φ) } {{ } 0 Err U (φ ) err(φ } {{ ) } + err( φ) Err( φ) } {{ } 2 sup φ C Err(φ) err(φ) ( ) Poadto Err U (φ ) err(φ ) + sup(err(φ) err(φ)) φ C ( ) Problem ( ): szacowaie błędu predykcji Err U (φ ) w termiach err(φ ).
7 sup(err(φ) err(φ)) = sup(pf P f ) φ C f F Z = (X, Y ), Z i = (X i, Y i ) f (z) = I {φ(x) y}, Pf = Ef (Z), P f = 1 i=1 f (Z i). F: rodzia fukcji f utworzoa a podstawie C.
8 Nierówość kocetracyja McDiarmida g : X R: sup g(x 1,..., x ) g(x 1,..., x i 1, x x 1,...,x,x i X i, x i+1,..., x ) c 1 i to dla Z = g(x 1,..., X ), gdzie X 1,..., X - iezależe, P(Z EZ > t) exp( 2t 2 /c 2 ) (!) Dla Z = sup f F Pf P f, c = 2/ i (!) implikuje
9 Z prawdopodobieństwem > 1 δ ( sup[pf P f ] E f F sup f F Średie Rademachera zbioru A R R (A) = E { ) 2 log(1/δ) [Pf P f ] + sup a a = (a 1,..., a ) i σ i zl Rademachera. 1 σ i a i }, i=1
10 Własości średich Rademachera (i) R (A) = R (abscov(a)), gdzie abscov(a) = { N j=1 c ja (j), N j=1 c j 1, a (j) A} (ii) R (φ A) L φ R (A), gdzie φ : R R Lipschitzowska ze stałą L φ, a φ A = {(φ(a 1 ),..., φ(a )), a = (a 1,..., a ) A} (iii) A = {a 1,..., a m } to R (A) max i=1,...,m a i 2 log m
11 (Z 1,..., Z ) iezależa kopia (Z 1,..., Z ) i P f = 1 i=1 f (Z i). Techika sprzęgaia daje ( ) E [Pf P f ] sup f F = E(sup f F = E sup 1 f F i=1 E[P f P f Z 1,..., Z ]) E sup E[P f P f ] f F σ i (f (Z i ) f (Z i )) 2ER (Z ) Nasz zbiór A: F(z ) = {(f (z 1 ),..., f (z ))} f F, (iii) 2 log R (Z SF (Z ) ), gdzie S F (z ) = F(z ), z = (z 1, z 2,..., z ).
12 Jeśli V (z ) wymiar Vapika-Czervoekisa zbioru S F (z ) to i log S F (z ) V (z ) log( + 1) 2V R (Z (Z ) log( + 1) ), Jeśli sup z V (z ) V to z prawdopodobieństwem > 1 δ V log 2 log(1/δ) sup[pf P f ] C + f F Czyik log moża pomiąć.
13 Miimalizacja ryzyka strukturalego Rodziy klasyfikatorów C 1 C 2... C N (1) Err U (φ,i) err(φ,i) + B(, F i ) i = 1,..., Miimalizacja prawej stroy (1) Problemy: (i) Klasy z małym wymiarem mogą mieć duży bład aproksymacji (ii) miimalizacja err(φ) często problem NP-trudy (ii) ierówość Err U (φ ) err(φ ) + sup(err(φ) err(φ)) φ C ( ) za gruba!
14 Oszacowaia oparte a margiesach Niech φ będzie regułą klasyfikacyją oparta a fukcji klasyfikacyjej d: φ(x) = 1 jeśli d(x) 0 i φ(x) = 1 w przeciwym przypadku. Wtedy P(φ(X) Y ) = P(sig(d(X)) Y ) E I {d(x)y 0} Niech γ : R R + będzie fukcją kosztu taką, że γ(x) I {x 0}. Typowe przykłady γ(x) = e x, γ(x) = (1 + x) +, γ(x) = log 2 (1 + x) Fukcjoał kosztu i jego wersja empirycza A(d) = E(γ( d(x)y ) U), A (d) = 1 γ( d(x i )Y i ) i=1
15 Mamy Err(d) A(d) Niech B = γ( d(x)y)). Wtedy err (d) A (d). Err U (d ) A(d ) = E(γ( d (X)Y ) U)) L γ - stała Lipschitza fukcji γ. A (d ) + sup(a(d) A (d)) d D A (d ) + 2L γ ER (F(Z 2 log 1 δ )) + B,
16 Systemy głosowaia Systemy głosowaia opierają się a podejmowaiu decyzji a podstawie kombiacji liiowych klasyfikatorów. C- rodzia bazowych klasyfikatorów. D λ = { d(x) = m c j g j (x) : m N, i=1 j=1 } c j λ, g 1,..., g C Na podstawie własości średich Rademachera zbioru R (D λ (Z 2VC log( + 1) )) = λr (C(Z )) λ
17 Stąd Err U (sig(d )) A (d 2VC log( + 1) 2 log 1 δ ) + 2L φ λ + B, gddzie sig(d ) miimalizuje ryzyko empirycze w klasie {sig(d)} d D Oszacowaie błedu predykcji sig(d ) w termiach wymiaru Vapika-Chervoekisa klasy bazowej.
18 Margiesy Przykład φ η (x) = 1 x η φ η (x) = 0 x 0 φ η (x) = 1 + x/η w p.p. W tym przypadku B = 1 i L φ = 1/η. Poadto A (d) err γ (d), gdzie err γ (d) = 1 I {d(x i )Y i η}. Liczymy ie tylko źle sklasyfikowae elemety, ale rówież te sklasyfikowae dobrze, ale z małym margiesem i=1
19 Err U (d ) err (d ) + 2λ η 2VC log( + 1) + 2 log 1 δ.
20 Ie waże kieruki/perspektywy Własości skończeiepróbkowe estymatorów PMS i ich ryzyka (Barro, Birgé, Massart, Barraud..) Metody rzadkiej regresji (Lasso, Least Agle Regressio LAR,...). potecjala liczba predyktorów w modelu liiowym p, p >, jedakże #{i : β i 0} << p Związki metod selekcji z wielokrotym testowaiem, w szczególości z procedurami typu Bejamiiego-Hochberga (M 1 M 2 ˆM AIC = M 2 LRT M1,M 2 > 2(p 2 p 1 )) metody selekcji w modelach regresyjych oparte a wstępym uporządkowaiu predyktorów. metody predykcji oparte a uśrediaiu modeli
21 Własości skończeiepróbkowe Y i = f (x i ) + ε i, i = 1,..., ε i (0, σ 2 ), σ 2 -zae, f ; [0, 1] R, x i [0, 1]. M m : fukcje stałe a odcikach [(j 1)/m, j/m). f Holder(L, α), to dla ˆf = ˆf MNK (M m ) optymaly wybór m: R = E f ˆf 2 L 2 M 2α + mσ2 ( L m(α, L) = σ ) 2/(1+α)m 1/(2α+1) Ryzyko R = O( 2α/(2α+1) ). Kostrukcja estymatorów PMS o takim rzędzie ryzyka, bez wykorzystywaia wiedzy, że f Holder(L, α). Kalibracja stałych w fukcji kryterialej!!!
22 Referecje Bousquet, O., Bouchero, S., Lugosi, G. (2005) Theory of classificatio: a survey of recet results, ESAIM: Probability ad Statistics, Claeskes, G., Hjort, N. (2008) Model selectio ad model averagig, Cambridge Uiversity Press Friedma, J. (1997) O bias, variace, 0/1-loss ad the curse of dimesioality, Data miig ad Kowledge Discovery, str Hastie, T., Tibshirai, R., Friedma, J. (2009) The Elemets of Statistical Learig, (wydaie drugie) tibs/elemstatlear/ Koishi, S., Kitagawa, G. (2008) Iformatio Criteria ad Statistical Modellig, Spriger Leeb, H., Pötscher, B. (2008) Sparse estimators ad the oracle property, or the retur of Hodges estimator, J. Ecoometrics, str Leeb, H., Pötscher, B. (2008) Model selectio,w Hadbook of Fiacial Time Series (wyd Aderse,Davis,Kreiss,Mikosch), Spriger,2008
23 Nishii, R. (1984) Asymptotic properties of criteria for selectio of variables i multiple regressio, A. Statist., str Schiavo, R., Had, D.(2000) Te more years of error rate research, Iteratioal Statistical Review, str Shao, J. (1993) Liear model selectio by cross-validatio, JASA, str Shao, J. (1997) A asymptotic theory for liear model selectio, Statistica Siica, str Yag, Y. (2005) Ca the stregths of AIC ad BIC be shared? A coflict betwee model idetificatio ad regressio estimatio, Biometrika, str
ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA
ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA Jan Mielniczuk Wisła, grudzień 2009 PLAN Błędy predykcji i ich podstawowe estymatory Estymacja błędu predykcji w modelu liniowym. Funkcje kryterialne Własności
Jądrowe klasyfikatory liniowe
Jądrowe klasyfikatory liniowe Waldemar Wołyński Wydział Matematyki i Informatyki UAM Poznań Wisła, 9 grudnia 2009 Waldemar Wołyński () Jądrowe klasyfikatory liniowe Wisła, 9 grudnia 2009 1 / 19 Zagadnienie
Prawdopodobieństwo i statystyka
Wykład VI: Metoda Mote Carlo 17 listopada 2014 Zastosowaie: przybliżoe całkowaie Prosta metoda Mote Carlo Przybliżoe obliczaie całki ozaczoej Rozważmy całkowalą fukcję f : [0, 1] R. Chcemy zaleźć przybliżoą
Estymatory regresji rangowej oparte na metodzie LASSO
Estymatory regresji rangowej oparte na metodzie LASSO Wojciech Rejchel UMK Toruń Wisła 2013 Z = (X, Y ), Z = (X, Y ) - niezależne wektory losowe o tym samym rozkładzie P X, X X R m, Y, Y R Z = (X, Y ),
P = 27, 8 27, 9 27 ). Przechodząc do granicy otrzymamy lim P(Y n > Y n+1 ) = P(Z 1 0 > Z 2 X 2 X 1 = 0)π 0 + P(Z 1 1 > Z 2 X 2 X 1 = 1)π 1 +
Zadaia róże W tym rozdziale zajdują się zadaia ietypowe, często dotyczące łańcuchów Markowa oraz własości zmieych losowych. Pojawią się także zadaia z estymacji Bayesowskiej.. (Eg 8/) Rozważamy łańcuch
Regresja nieparametryczna series estimator
Regresja nieparametryczna series estimator 1 Literatura Bruce Hansen (2018) Econometrics, rozdział 18 2 Regresja nieparametryczna Dwie główne metody estymacji Estymatory jądrowe Series estimators (estymatory
Estymacja gęstości prawdopodobieństwa metodą selekcji modelu
Estymacja gęstości prawdopodobieństwa metodą selekcji modelu M. Wojtyś Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Wisła, 7 grudnia 2009 Wstęp Próba losowa z rozkładu prawdopodobieństwa
Maszyny wektorów podpierajacych w regresji rangowej
Maszyny wektorów podpierajacych w regresji rangowej Uniwersytet Mikołaja Kopernika Z = (X, Y ), Z = (X, Y ) - niezależne wektory losowe o tym samym rozkładzie X X R d, Y R Z = (X, Y ), Z = (X, Y ) - niezależne
Własności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
0.1 ROZKŁADY WYBRANYCH STATYSTYK
0.1. ROZKŁADY WYBRANYCH STATYSTYK 1 0.1 ROZKŁADY WYBRANYCH STATYSTYK Zadaia 0.1.1. Niech X 1,..., X będą iezależymi zmieymi losowymi o tym samym rozkładzie. Obliczyć ES 2 oraz D 2 ( 1 i=1 X 2 i ). 0.1.2.
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 2 autorzy: A. Gonczarek, J.M. Tomczak Metody estymacji Zad. 1 Pojawianie się spamu opisane jest zmienną losową x o rozkładzie dwupunktowym
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Własności estymatorów regresji porządkowej z karą LASSO
Własności estymatorów regresji porządkowej z karą LASSO Uniwersytet Mikołaja Kopernika w Toruniu Uniwersytet Warszawski Badania sfinansowane ze środków Narodowego Centrum Nauki przyznanych w ramach finansowania
Statystyka Matematyczna Anna Janicka
Statystyka Matematycza Aa Jaicka wykład XIII, 30.05.06 STATYSTYKA BAYESOWSKA Pla a dzisiaj. Statystyka Bayesowska rozkłady a priori i a posteriori estymacja Bayesowska: Bayesowski Estymator Największej
Estymacja parametru rozkładu Rayleigha i logistycznego w terminach k-tych wartości rekordowych
Estymacja parametru rozkładu Rayleigha i logistycznego w terminach k-tych wartości rekordowych Iwona Malinowska Politechnika Lubelska Dominik Szynal UMCS, Lublin XXXIII Konferencja "STATYSTYKA MATEMATYCZNA
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Zrównoleglona optymalizacja stochastyczna na dużych zbiorach danych
Zrównoleglona optymalizacja stochastyczna na dużych zbiorach danych mgr inż. C. Dendek prof. nzw. dr hab. J. Mańdziuk Politechnika Warszawska, Wydział Matematyki i Nauk Informacyjnych Outline 1 Uczenie
Elementy modelowania matematycznego
Elemety modelowaia matematyczego Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Modelowaie daych (ilościowe): Metody statystycze: estymacja parametrów modelu,
Rozpoznawanie obrazów
Rozpoznawanie obrazów Ćwiczenia lista zadań nr 5 autorzy: A. Gonczarek, J.M. Tomczak Przykładowe problemy Klasyfikacja binarna Dla obrazu x zaproponowano dwie cechy φ(x) = (φ 1 (x) φ 2 (x)) T. Na obrazie
Statystyka Matematyczna Anna Janicka
Statystyka Matematycza Aa Jaicka wykład XIV, 06.06.06 STATYSTYKA BAYESOWSKA CD. Pla a dzisiaj. Statystyka Bayesowska rozkłady a priori i a posteriori estymacja Bayesowska: Bayesowski Estymator Największej
Wybór modelu i ocena jakości klasyfikatora
Wybór modelu i ocena jakości klasyfikatora Błąd uczenia i błąd testowania Obciążenie, wariancja i złożoność modelu (klasyfikatora) Dekompozycja błędu testowania Optymizm Estymacja błędu testowania AIC,
Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja
Charakterystyki liczbowe zmieych losowych: wartość oczekiwaa i wariacja dr Mariusz Grządziel Wykłady 3 i 4;,8 marca 24 Wartość oczekiwaa zmieej losowej dyskretej Defiicja. Dla zmieej losowej dyskretej
WYKŁAD I: PROBLEM KLASYFIKACJI POD NADZOREM, LINIOWA ANALIZA DYSKRYMINACYJNA. Wydział Matematyki i Nauk Informacyjnych PW
WYKŁAD I: PROBLEM KLASYFIKACJI POD NADZOREM, LINIOWA ANALIZA DYSKRYMINACYJNA Wydział Matematyki i Nauk Informacyjnych PW Problem klasyfikacji (pod nadzorem) LDA Model sytuacji praktycznej: n par losowych
NOWY PROGRAM STUDIÓW 2016/2017 SYLABUS PRZEDMIOTU AUTORSKIEGO: Wprowadzenie do teorii ekonometrii. Część A
NOWY PROGRAM STUDIÓW 2016/2017 SYLABUS PRZEDMIOTU AUTORSKIEGO: Autor: 1. Dobromił Serwa 2. Tytuł przedmiotu Sygnatura (będzie nadana, po akceptacji przez Senacką Komisję Programową) Wprowadzenie do teorii
Konstrukcja biortogonalnych baz dyskryminacyjnych dla problemu klasyfikacji sygnałów. Wit Jakuczun
Konstrukcja biortogonalnych baz dyskryminacyjnych dla problemu klasyfikacji sygnałów Politechnika Warszawska Strona 1 Podstawowe definicje Politechnika Warszawska Strona 2 Podstawowe definicje Zbiór treningowy
Predykcja i selekcja zmiennych w klasyfikacji z wieloma etykietami przy użyciu łańcuchów klasyfikatorów i sieci elastycznej
Seminarium Poznań 2016 Predykcja i selekcja zmiennych w klasyfikacji z wieloma etykietami przy użyciu łańcuchów klasyfikatorów i sieci elastycznej Paweł Teisseyre Instytut Podstaw Informatyki PAN Plan
Wprowadzenie. { 1, jeżeli ˆr(x) > 0, pozatym. Regresja liniowa Regresja logistyczne Jądrowe estymatory gęstości. Metody regresyjne
Wprowadzenie Prostym podejściem do klasyfikacji jest estymacja funkcji regresji r(x) =E(Y X =x)zpominięciemestymacjigęstościf k. Zacznijmyodprzypadkudwóchgrup,tj.gdy Y = {1,0}. Wówczasr(x) =P(Y =1 X =x)ipouzyskaniuestymatora
Twierdzenia graniczne:
Twierdzeia graicze: Tw. ierówośd Markowa Jeżeli P(X > 0) = 1 oraz EX 0: P X k 1 k EX. Tw. ierówośd Czebyszewa Jeżeli EX = m i 0 < σ = D X 0: P( X m tσ) 1 t. 1. Z partii towaru o wadliwości
Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7
Metody probabilistycze i statystyka Estymacja Dr Joaa Baaś Zakład Badań Systemowych Istytut Sztuczej Iteligecji i Metod Matematyczych Wydział Iformatyki Politechiki Szczecińskiej Metody probabilistycze
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych Mateusz Kobos, 25.11.2009 Seminarium Metody Inteligencji Obliczeniowej 1/25 Spis treści Dolne ograniczenie na wsp.
Zadania z Rachunku Prawdopodobieństwa III - 1
Zadania z Rachunku Prawdopodobieństwa III - 1 Funkcją tworzącą momenty (transformatą Laplace a) zmiennej losowej X nazywamy funkcję M X (t) := Ee tx, t R. 1. Oblicz funkcję tworzącą momenty zmiennych o
O zgodności procedur jednoczesnego testowania zastosowanych do problemu selekcji zmiennych w modelu liniowym
O zgodności procedur jednoczesnego testowania zastosowanych do problemu selekcji zmiennych w modelu liniowym Konrad Furmańczyk Katedra Zastosowań Matematyki SGGW Wis a 2010 Plan referatu 1. Modele liniowe
Stosowana Analiza Regresji
Stosowana Analiza Regresji Wykład VI... 16 Listopada 2011 1 / 24 Jest to rozkład zmiennej losowej rozkład chi-kwadrat Z = n i=1 X 2 i, gdzie X i N(µ i, 1) - niezależne. Oznaczenie: Z χ 2 (n, λ), gdzie:
Rozpoznawanie obrazów
Rozpoznawanie obrazów Ćwiczenia lista zadań nr 7 autorzy: A. Gonczarek, J.M. Tomczak Przykładowe problemy Klasyfikacja binarna Dla obrazu x zaproponowano dwie cechy φ(x) = (φ 1 (x) φ 2 (x)) T. Na obrazie
Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania
Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 2 autorzy: A. Gonczarek, J.M. Tomczak Metody estymacji ML Zad. 1 Pojawianie się spamu opisane jest zmienną losową x o rozkładzie dwupunktowym
Estymacja w regresji nieparametrycznej
Estymacja w regresji nieparametrycznej Jakub Kolecki Politechnika Gdańska 28 listopada 2011 1 Wstęp Co to jest regresja? Przykład regresji 2 Regresja nieparametryczna Założenia modelu Estymacja i jej charakterystyki
Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2
Wykład 5 Przedziały ufości Zwykle ie zamy parametrów populacji, p. Chcemy określić a ile dokładie y estymuje Kostruujemy przedział o środku y, i taki, że mamy 95% pewości, że zawiera o Nazywamy go 95%
INSTRUKCJA DO ĆWICZEŃ LABORATORYJNYCH Z WYTRZYMAŁOŚCI MATERIAŁÓW
INSTYTUT MASZYN I URZĄDZEŃ ENERGETYCZNYCH Politechika Śląska w Gliwicach INSTRUKCJA DO ĆWICZEŃ LABORATORYJNYCH Z WYTRZYMAŁOŚCI MATERIAŁÓW BADANIE ODKSZTAŁCEŃ SPRĘŻYNY ŚRUBOWEJ Opracował: Dr iż. Grzegorz
2. Empiryczna wersja klasyfikatora bayesowskiego
Algorytmy rozpoznawania obrazów 2. Empiryczna wersja klasyfikatora bayesowskiego dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Brak pełnej informacji probabilistycznej Klasyfikator bayesowski
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
STATYSTYKA OPISOWA PODSTAWOWE WZORY
MIARY POŁOŻENIA Średia Dla daych idywidualych: STATYSTYKA OPISOWA PODSTAWOWE WZORY Q i = x lmi + i mi 1 4 j h m i mi x = 1 x i x = 1 i ẋ i gdzie ẋ i środek i-tego przedziału i liczość i- tego przedziału
3. Funkcje elementarne
3. Fukcje elemetare Fukcjami elemetarymi będziemy azywać fukcję tożsamościową x x, fukcję wykładiczą, fukcje trygoometrycze oraz wszystkie fukcje, jakie moża otrzymać z wyżej wymieioych drogą astępujących
POISSONOWSKA APROKSYMACJA W SYSTEMACH NIEZAWODNOŚCIOWYCH
POISSONOWSKA APROKSYMACJA W SYSTEMACH NIEZAWODNOŚCIOWYCH Barbara Popowska bpopowsk@math.put.poznan.pl Politechnika Poznańska http://www.put.poznan.pl/ PROGRAM REFERATU 1. WPROWADZENIE 2. GRAF JAKO MODEL
Wprowadzenie. Data Science Uczenie się pod nadzorem
Wprowadzenie Wprowadzenie Wprowadzenie Wprowadzenie Machine Learning Mind Map Historia Wstęp lub uczenie się z przykładów jest procesem budowy, na bazie dostępnych danych wejściowych X i oraz wyjściowych
Teoria systemów uczacych się i wymiar Vapnika-Chervonenkisa
Systemy uczace się 2009 1 / 32 Teoria systemów uczacych się i wymiar Vapnika-Chervonenkisa Hung Son Nguyen Wydział Matematyki, Informatyki i Mechaniki Uniwersytet Warszawski email: son@mimuw.edu.pl Grudzień
Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.
Miary położeia Średia Dla daych idywidualych: x = 1 x = 1 x i i ẋ i gdzie ẋ i środek i tego przedziału i - liczość i-tego przedziału Domiata moda Liczba ajczęściej występująca jeśli taka istieje - dla
Jak trudne jest numeryczne całkowanie (O złożoności zadań ciągłych)
Jak trudne jest numeryczne całkowanie (O złożoności zadań ciągłych) Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki leszekp@mimuw.edu.pl Horyzonty 2014 17-03-2014 Będlewo Zadania numeryczne
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak 1 Wprowadzenie. Zmienne losowe Podczas kursu interesować nas będzie wnioskowanie o rozpatrywanym zjawisku. Poprzez wnioskowanie rozumiemy
Estymatory nieobciążone o minimalnej wariancji
Estymatory ieobciążoe o miimalej wariacji Model statystyczy (X, {P θ, θ Θ}); g : Θ R 1 Zadaie: oszacować iezaą wartość g(θ) Wybrać takie δ(x 1, X 2,, X ) by ( θ Θ) ieobciążoość E θ δ(x 1, X 2,, X ) = g(θ)
Wojciech Skwirz
1 Regularyzacja jako metoda doboru zmiennych objaśniających do modelu statystycznego. 2 Plan prezentacji 1. Wstęp 2. Część teoretyczna - Algorytm podziału i ograniczeń - Regularyzacja 3. Opis wyników badania
Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.
Miary położeia Średia Dla daych idywidualych: x = 1 x = 1 x i i ẋ i gdzie ẋ i środek i tego przedziału i - liczość i-tego przedziału Domiata moda Liczba ajczęściej występująca jeśli taka istieje - dla
Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład II bogumil.konopka@pwr.edu.pl 2017/2018 Określenie rzeczywistej dokładności modelu Zbiór treningowym vs zbiór testowy Zbiór treningowy
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki
WYKŁAD 6 Witold Bednorz, Paweł Wolff 1 Instytut Matematyki Uniwersytet Warszawski Rachunek Prawdopodobieństwa, WNE, 2010-2011 Własności Wariancji Przypomnijmy, że VarX = E(X EX) 2 = EX 2 (EX) 2. Własności
Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja
Podstawowe ozaczeia i wzory stosowae a wykładzie i laboratorium Część I: estymacja 1 Ozaczeia Zmiee losowe (cechy) ozaczamy a wykładzie dużymi literami z końca alfabetu. Próby proste odpowiadającymi im
Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania
Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej
STATYSTYKA OPISOWA PODSTAWOWE WZORY
MIARY POŁOŻENIA Średia Dla daych idywidualych: x = 1 STATYSTYKA OPISOWA PODSTAWOWE WZORY x i x = 1 i ẋ i gdzie ẋ i środek i-tego przedziału i liczość i- tego przedziału Domiata (moda Liczba ajczęściej
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 13 i 14 1 / 15 MODEL BAYESOWSKI, przykład wstępny Statystyka
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE Joanna Sawicka Plan prezentacji Model Poissona-Gamma ze składnikiem regresyjnym Konstrukcja optymalnego systemu Bonus- Malus Estymacja
Matematyka finansowa 08.10.2007 r. Komisja Egzaminacyjna dla Aktuariuszy. XLIII Egzamin dla Aktuariuszy z 8 października 2007 r.
Matematyka fiasowa 08.10.2007 r. Komisja Egzamiacyja dla Aktuariuszy XLIII Egzami dla Aktuariuszy z 8 paździerika 2007 r. Część I Matematyka fiasowa WERSJA TESTU A Imię i azwisko osoby egzamiowaej:...
Estymatory kwantylowe i estymacja kwantyli
Tomasz Rychlik Instytut Matematyczny PAN Chopina 12, 87 100 Toruń e-mail: trychlik@impan.gov.pl XXXVIII Konferencja Statystyka Matematyczna Sesja poświȩcona pamiȩci prof. Ryszarda Zielińskiego Wisła, 3
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
1 Twierdzenia o granicznym przejściu pod znakiem całki
1 Twierdzeia o graiczym przejściu pod zakiem całki Ozaczeia: R + = [0, ) R + = [0, ] (X, M, µ), gdzie M jest σ-ciałem podzbiorów X oraz µ: M R + - zbiór mierzaly, to zaczy M Twierdzeie 1.1. Jeżeli dae
Entropia Renyi ego, estymacja gęstości i klasyfikacja
Entropia Renyi ego, estymacja gęstości i klasyfikacja Wojciech Czarnecki Jacek Tabor 6 lutego 2014 1 / Wojciech Czarnecki, Jacek Tabor Renyi s Multithreshold Linear Classifier 1/36 36 2 / Wojciech Czarnecki,
5. Analiza dyskryminacyjna: FLD, LDA, QDA
Algorytmy rozpoznawania obrazów 5. Analiza dyskryminacyjna: FLD, LDA, QDA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Liniowe funkcje dyskryminacyjne Liniowe funkcje dyskryminacyjne mają ogólną
STATYSTKA I ANALIZA DANYCH LAB II
STATYSTKA I ANALIZA DANYCH LAB II 1. Pla laboratorium II rozkłady prawdopodobieństwa Rozkłady prawdopodobieństwa dwupuktowy, dwumiaowy, jedostajy, ormaly. Związki pomiędzy rozkładami prawdopodobieństw.
Wektory Funkcje rzeczywiste wielu. Matematyka Studium doktoranckie KAE SGH Semestr letni 2008/2009 R. Łochowski
Wektory Fukcje rzeczywiste wielu zmieych rzeczywistych Matematyka Studium doktorackie KAE SGH Semestr leti 2008/2009 R. Łochowski Wektory pukty w przestrzei R Przestrzeń R to zbiór uporządkowaych -ek liczb
Selekcja zmiennych w klasyfikacji z wieloma etykietami
Seminarium IPIPAN, Maj 2016 Selekcja zmiennych w klasyfikacji z wieloma etykietami Paweł Teisseyre Instytut Podstaw Informatyki PAN Plan prezentacji Klasyfikacja z wieloma etykietami. Selekcja zmiennych
Stosowana Analiza Regresji
prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile
Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej
Porównanie modeli logicznej regresji z klasycznymi modelami regresji liniowej i logistycznej Instytut Matematyczny, Uniwersytet Wrocławski Małgorzata Bogdan Instytut Matematyki i Informatyki, Politechnika
Historia Rachunku Prawdopodobieństwa i Statystyki WYKŁAD VII: Ronald Fisher. Statystyka Matematyczna jako oddzielna dyscyplina
Historia Rachunku Prawdopodobieństwa i Statystyki WYKŁAD VII: Ronald Fisher. Statystyka Matematyczna jako oddzielna dyscyplina MiNI PW, semestr zimowy 2016/2017 Ronald Fisher (1890-1962) Studiował matematykę
Wykład 7. Przestrzenie metryczne zwarte. x jest ciągiem Cauchy ego i posiada podciąg zbieżny. Na mocy
Wyład 7 Przestrzeie metrycze zwarte Defiicja 8 (przestrzei zwartej i zbioru zwartego Przestrzeń metryczą ( ρ X azywamy zwartą jeśli ażdy ciąg elemetów tej przestrzei posiada podciąg zbieży (do putu tej
WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska
Wrocław University of Technology WYKŁAD 4 Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie autor: Maciej Zięba Politechnika Wrocławska Klasyfikacja Klasyfikacja (ang. Classification):
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba Cel zadania Celem zadania jest implementacja klasyfikatorów
Statystyka matematyczna. Wykład II. Estymacja punktowa
Statystyka matematycza. Wykład II. e-mail:e.kozlovski@pollub.pl Spis treści 1 dyskretych Rozkłady zmieeych losowych ciągłych 2 3 4 Rozkład zmieej losowej dyskretej dyskretych Rozkłady zmieeych losowych
Analiza numeryczna Kurs INP002009W. Wykład 4 Rozwiązywanie równań nieliniowych. Karol Tarnowski A-1 p.
Aaliza umerycza Kurs INP002009W Wykład 4 Rozwiązywaie rówań ieliiowych Karol Tarowski karol.tarowski@pwr.wroc.pl A-1 p.223 Pla wykładu Metoda bisekcji Algorytm Aaliza błędu Metoda Newtoa Algorytm Aaliza
1 Modele ADL - interpretacja współczynników
1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać
Natalia Nehrebecka Stanisław Cichocki. Wykład 10
Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Asymptotyczna kontrola FDR dla zaleznych testowań wielu hipotez statystycznych. Konrad Furmańczyk Wydzia Zastosowań Informatyki i Matematyki SGGW
Asymptotyczna kontrola FDR dla zaleznych testowań wielu hipotez statystycznych Konrad Furmańczyk Wydzia Zastosowań Informatyki i Matematyki SGGW 1 PLAN REFERATU Sformuowanie zagadnienia testowania wielu
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 2 3 1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów
Budowa modelu i testowanie hipotez
Problemy metodologiczne Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Gdzie jest problem? Obciążenie Lovella
Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH
Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego Łukasz Kończyk WMS AGH Plan prezentacji Model regresji liniowej Uogólniony model liniowy (GLM) Ryzyko ubezpieczeniowe Przykład
1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o
1. Wioskowaie statystycze. W statystyce idetyfikujemy: Cecha-Zmiea losowa Rozkład cechy-rozkład populacji Poadto miaem statystyki określa się także fukcje zmieych losowych o tym samym rozkładzie. Rozkłady
(LMP-Liniowy model prawdopodobieństwa)
OGÓLNY MODEL REGRESJI BINARNEJ (LMP-Liniowy model prawdopodobieństwa) Dla k3 y α α α α + x + x + x 2 2 3 3 + α x x α x x + α x x + α x x + ε + x 4 2 5 3 6 2 3 7 2 3 Zał.: Wszystkie zmienne interakcyjne
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 3 Metody estymacji. Estymator największej wiarygodności Zad. 1 Pojawianie się spamu opisane jest zmienną losową y o rozkładzie zero-jedynkowym
ć Ą ą ą Ż Ż ó ą ż Ć ą ĆŻ Ż Ó Ó Ó ą Ó ń ą ę ą ę Ź ń ą Ó ą ą ą ą ą ą Ó Ż ęż ę ą ę ą ą ż ĘĆ ż ę Żą ż ą ń Ó ą Ó ą ę ż ęż ó ó ć ż ń ęż ń ń ć ń ż ć ć ą ą Ó Ó ó ó ń ó ę ó Ó ą ż Ć ę Ó ę ż Ó ó ą ó Ó ż Ć ę ó Ó ó
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 3 1 / 8 ZADANIE z rachunku
1 Klasyfikator bayesowski
Klasyfikator bayesowski Załóżmy, że dane są prawdopodobieństwa przynależności do klasp( ),P( 2 ),...,P( L ) przykładów z pewnego zadania klasyfikacji, jak również gęstości rozkładów prawdopodobieństw wystąpienia
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017
STATYSTYKA OPISOWA Dr Alia Gleska Istytut Matematyki WE PP 18 listopada 2017 1 Metoda aalitycza Metoda aalitycza przyjmujemy założeie, że zmiay zjawiska w czasie moża przedstawić jako fukcję zmieej czasowej
Odporność statystyk według Ryszarda Zielińskiego a porządki stochastyczne
Odporność statystyk według Ryszarda Zielińskiego a porządki stochastyczne Jarosław Bartoszewicz Uniwersytet Wrocławski Zieliński (1977) wprowadził następującą definicję odporności statystycznej. M 0 =
Drzewa klasyfikacyjne Lasy losowe. Wprowadzenie
Wprowadzenie Konstrukcja binarnych drzew klasyfikacyjnych polega na sekwencyjnym dzieleniu podzbiorów przestrzeni próby X na dwa rozłączne i dopełniające się podzbiory, rozpoczynając od całego zbioru X.
Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/ n 333))
46. Wskazać liczbę rzeczywistą k, dla której graica k 666 + 333)) istieje i jest liczbą rzeczywistą dodatią. Obliczyć wartość graicy przy tak wybraej liczbie k. Rozwiązaie: Korzystając ze wzoru a różicę
O liczbach naturalnych, których suma równa się iloczynowi
O liczbach aturalych, których suma rówa się iloczyowi Lew Kurladczyk i Adrzej Nowicki Toruń UMK, 10 listopada 1998 r. Liczby aturale 1, 2, 3 posiadają szczególą własość. Ich suma rówa się iloczyowi: Podobą
Obliczenia naukowe Wykład nr 6
Obliczenia naukowe Wykład nr 6 Paweł Zieliński Katedra Informatyki, Wydział Podstawowych Problemów Techniki, Politechnika Wrocławska Literatura Literatura podstawowa [1] D. Kincaid, W. Cheney, Analiza
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe