AUTO-ENKODER JAKO SKŠADNIK ARCHITEKTURY DEEP LEARNING

Wielkość: px
Rozpocząć pokaz od strony:

Download "AUTO-ENKODER JAKO SKŠADNIK ARCHITEKTURY DEEP LEARNING"

Transkrypt

1 AUTO-ENKODER JAKO SKŠADNIK ARCHITEKTURY DEEP LEARNING Magdalena Wiercioch Uniwersytet Jagiello«ski 3 kwietnia 2014

2 Plan Uczenie gª bokie (deep learning) Auto-enkodery Rodzaje Zasada dziaªania Przykªady Bibliograa 2 z 48

3 Uczenie gª bokie (deep learning) cel - wydobycie cech najbardziej istotnych 3 z 48

4 Uczenie gª bokie (deep learning) Potrzeba funkcji, która zapewni efektywno± oblicze«i wydajno± uczenia. Nasuwa si pytanie w jaki sposób j reprezentowa. 4 z 48

5 Uczenie gª bokie (deep learning) Technika uczenia gª bokiego ma swoje ideologiczne podstawy w procesie skªadania funkcji. Ka»da z funkcji skªadanych otrzymuje dane do przetworzenia. 5 z 48

6 Uczenie gª bokie (deep learning) 6 z 48

7 Uczenie gª bokie (deep learning) A mo»e sie wielowarstwowa (uczona gradientowo)? 7 z 48

8 Uczenie gª bokie (deep learning) (Bengio, 2007) Idea greedy layer-wise training: trenowanie krok po kroku, a wi c najpierw trenuje si sie z jedn warstw ukryt, potem z dwoma itd. w ka»dym kroku do rozwa»anej sieci zawieraj cej k 1 warstw ukrytych dodaje si kolejn warstw, która na wej±ciu przyjmuje rezultat poprzedniej architektury 8 z 48

9 Uczenie gª bokie (deep learning) mo»liwe jest zarówno podej±cie nadzorowane jak i nienadzorowane (cz ±ciej stosowane, realizowane za pomoc auto-enkoderów) wyuczone wagi sªu» do inicjalizacji wag w caªej sieci pozwala to na dostrojenie caªej architektury (ne-tune) 9 z 48

10 Uczenie gª bokie (deep learning) Zalety: zdecydowanie lepsza dost pno± danych metoda spadku gradientu znajduje wªa±ciwe (lub prawie poprawne) lokalne minimum 10 z 48

11 Auto-enkoder obecno± trzech warstw reprodukcja informacji wej±ciowej na wyj±ciu 11 z 48

12 Auto-enkoder rzadki (sparse autoencoder) W zwyczajnym trybie sie uczyªaby si funkcji identyczno±ciowej, co nie miaªoby sensu. Dlatego wprowadza si pewne kryteria, jak np. ilo± neuronów w warstwie ukrytej. Okazuje si,»e ciekawe wªasno±ci ujawniaj si gdy ilo± neuronów w warstwie ukrytej jest wi ksza od wymiaru danych wej±ciowych. Wówczas wprowadza si dodatkowe ograniczenie na rzadko± (sparsity). 12 z 48

13 Auto-enkoder 13 z 48

14 Auto-enkoder x [0, 1] d, y [0, 1] d, z [0, 1] d y f θ (x) = s(wx + b); θ = W, b z g θ (y) = s(w y + b ); θ = W, b θ, θ = argmin θ,θ 1 n n R(x (i), g i=1 θ (f θ (x (i) ))) 14 z 48

15 Auto-enkoder R(x, z) = x z 2 R H (x, z) = d j=1 [x j log z j + (1 x j ) log(1 z j )] Istnieje dowód na to,»e gdy neurony w warstwie ukrytej oraz w warstwie wyj±ciowej maj charakterystyki liniowe (lub qasiliniowe), to taka sie w rzeczywisto±ci uczy si aproksymowa standardowy algorytm analizy gªównych skªadowych. 15 z 48

16 Dywergencja Kullbacka-Leiblera Dywergencja Kullbacka-Leiblera (entropia wzgl dna, rozbie»no± Kullbacka-Leiblera) to miara stosowana w teorii informacji. Sªu»y do okre±lenia rozbie»no±ci pomi dzy dwoma rozkªadami p oraz q. Przyjmuje zawsze warto±ci nieujemne. Je±li dwa rozkªady s identyczne, wówczas jej warto± wynosi 0. Dla rozkªadów dyskretnych dywergencja Kullbacka-Leiblera wyra»a si wzorem: gdzie q - dane rzeczywiste; p - model teoretyczny. D KL (q, p) = i=1 q i log 2 q(i) p(i) 16 z 48

17 Ograniczenie na rzadko± (sparsity) a (2) k (x) - poziom aktywacji neuronu k w warstwie ukrytej pod wpªywem wej±cia x ˆρ k = 1 n n i=1 [a(2) k (x (i) )] - ±rednia aktywacja neuronu ρ jako parametr odnosz cy si do wymuszanej cechy rzadko±ci (sparsity parameter) celem jest doprowadzenie do równo±ci ˆρ k = ρ funkcja straty: L s (W, b) = L(W, b) + β n KL(ρ ˆρ i=1 i) 17 z 48

18 Dywergencja Kullbacka-Leiblera a auto-enkoder 18 z 48

19 Auto-enkoder odszumiaj cy (denoising autoencoder) wej±cie x [0, 1] d modykacja wej±cia daje x q( x x) przeksztaªcenie x do reprezentacji zredukowanej y = f θ ( x) odtworzenie z na podstawie y, z = g θ (y) 19 z 48

20 Auto-enkoder odszumiaj cy (denoising autoencoder) (Vincent, 2008) ró»ne interpretacje, jedno z nich oparte na idei rozmaito±ci przyjmuje si,»e oryginalne dane s umiejscowione bli»ej rozmaito±ci o mniejszej liczbie wymiarów p(x X ) = B gθ (f θ ( X ))(X ) zapewnia stosowne rzutowanie 20 z 48

21 Auto-enkoder stosowy (stacked autoencoder) warstwa 1 21 z 48

22 Auto-enkoder stosowy (stacked autoencoder) warstwa 1 warstwa 2 22 z 48

23 Auto-enkoder stosowy (stacked autoencoder) warstwa 1 warstwa 2 warstwa 3 23 z 48

24 Auto-enkoder stosowy (stacked autoencoder) warstwa 1 warstwa 2 warstwa 3 warstwa uczona z nadzorem 24 z 48

25 Auto-enkoder stosowy (stacked autoencoder) 25 z 48

26 Auto-enkoder stosowy (stacked autoencoder) 26 z 48

27 Auto-enkoder stosowy (stacked autoencoder) 27 z 48

28 Auto-enkoder stosowy (stacked autoencoder) 28 z 48

29 Zestaw odszumiaj cych auto-enkoderów (stacked denoising autoencoders) wstawianie kolejnych warstw z auto-enkoderem (odszumiaj cym) rezultat ka»dego procesu oczyszczenia przesyªany jest do warstwy poªo»nej wy»ej 29 z 48

30 Strojenie (ne tuning) inicjalizacja parametrów sieci w sposób nienadzorowany dostrajanie w wersji nadzorowanej 30 z 48

31 Auto-enkoder 31 z 48

32 Auto-enkoder 32 z 48

33 Auto-enkoder 33 z 48

34 Auto-enkoder 34 z 48

35 Auto-enkoder 35 z 48

36 Auto-enkoder 36 z 48

37 Auto-enkoder Zbiór STL z 48

38 Auto-enkoder 38 z 48

39 Auto-enkoder odszumiaj cy (denoising autoencoder) MNIST 39 z 48

40 Auto-enkoder odszumiaj cy (denoising autoencoder) poziom zaszumienia = 0% 40 z 48

41 Auto-enkoder odszumiaj cy (denoising autoencoder) poziom zaszumienia = 15% 41 z 48

42 Auto-enkoder odszumiaj cy (denoising autoencoder) poziom zaszumienia = 30% 42 z 48

43 Auto-enkoder odszumiaj cy (denoising autoencoder) poziom zaszumienia = 45% 43 z 48

44 Wynik zestawienia auto-enkoderów 44 z 48

45 Wynik zestawienia auto-enkoderów odszumiaj cych 45 z 48

46 Rezultat zastosowania sieci Deep Belief 46 z 48

47 Bibliograa Bengio Y., Learning deep architectures for AI, Foundations and trends in Machine Learning (2009) Vincent P., Larochelle H., Lajoie I., Bengio Y., Manzagol P.A., Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Denoising Criterion (2010) Bengio Y., Lamblin P., Popovici D., Larochelle H., Greedy layer-wise training of deep networks. NIPS (2006) Ranzato M., Poultney C., Chopra S., and LeCun Y., Ecient learning of sparse representations with an energy-based model. NIPS 2006, MIT Press, 2006 Ranzato M., Boureau Y., LeCun Y., Sparse feature learning for deep belief networks. Advances in Neural Information Processing Systems (NIPS 2007) 47 z 48

48 Bibliograa Hinton G.E., Osindero S., Teh Y., A fast learning algorithm for deep belief nets. Neural Computation 18 (2006) Hinton G. E., Salakhutdinov R., Reducing the dimensionality of data with neural networks. Science (2006) 48 z 48

UNIWERSYTET GDA SKI WYDZIAŠ MATEMATYKI, FIZYKI I INFORMATYKI. Mateusz Puwaªowski UKRYTE INDEKSOWANIE SEMANTYCZNE

UNIWERSYTET GDA SKI WYDZIAŠ MATEMATYKI, FIZYKI I INFORMATYKI. Mateusz Puwaªowski UKRYTE INDEKSOWANIE SEMANTYCZNE UNIWERSYTET GDA SKI WYDZIAŠ MATEMATYKI, FIZYKI I INFORMATYKI Mateusz Puwaªowski Kierunek studiów: INFORMATYKA Numer albumu: 179761 UKRYTE INDEKSOWANIE SEMANTYCZNE Praca magisterska wykonana w Zakªadzie

Bardziej szczegółowo

Optymalizacja zapyta«w ±rodowisku rozproszonym w modelu semistrukturalnym

Optymalizacja zapyta«w ±rodowisku rozproszonym w modelu semistrukturalnym Uniwersytet Warszawski Wydziaª Matematyki, Informatyki i Mechaniki Jakub Matusz Nr albumu: 201071 Optymalizacja zapyta«w ±rodowisku rozproszonym w modelu semistrukturalnym Praca magisterska na kierunku

Bardziej szczegółowo

POLITECHNIKA WARSZAWSKA WYDZIAŠ ELEKTRYCZNY INSTYTUT ELEKTROTECHNIKI TEORETYCZNEJ I SYSTEMÓW INFORMACYJNO-POMIAROWYCH

POLITECHNIKA WARSZAWSKA WYDZIAŠ ELEKTRYCZNY INSTYTUT ELEKTROTECHNIKI TEORETYCZNEJ I SYSTEMÓW INFORMACYJNO-POMIAROWYCH POLITECHNIKA WARSZAWSKA WYDZIAŠ ELEKTRYCZNY INSTYTUT ELEKTROTECHNIKI TEORETYCZNEJ I SYSTEMÓW INFORMACYJNO-POMIAROWYCH PRACA DYPLOMOWA MAGISTERSKA na kierunku INFORMATYKA Zbigniew Przemysªaw Król Nr indeksu

Bardziej szczegółowo

Alternatywne modele neuronów i wªa±ciwo±ci ich sieci

Alternatywne modele neuronów i wªa±ciwo±ci ich sieci Uniwersytet Marii Curie-Skªodowskiej w Lublinie Wydziaª Matematyki, Fizyki i Informatyki Beata Joanna Grzyb Alternatywne modele neuronów i wªa±ciwo±ci ich sieci (Alternative neuron models and properties

Bardziej szczegółowo

Obsªuga bª dów w procesach automatycznej konsolidacji rachunków bankowych.

Obsªuga bª dów w procesach automatycznej konsolidacji rachunków bankowych. Uniwersytet Warszawski Wydziaª Matematyki, Informatyki i Mechaniki Sebastian Tomaszewski Nr albumu: 219712 Obsªuga bª dów w procesach automatycznej konsolidacji rachunków bankowych. Praca magisterska na

Bardziej szczegółowo

Drzewa klasykacyjne Konspekt do zaj : Statystyczne metody analizy danych

Drzewa klasykacyjne Konspekt do zaj : Statystyczne metody analizy danych Drzewa klasykacyjne Konspekt do zaj : Statystyczne metody analizy danych Agnieszka Nowak-Brzezi«ska 11 stycznia 2010 1 Wprowadzenie Drzewa klasykacyjne 1 jako reprezentacja wiedzy o klasykacji s do± atrakcyjne

Bardziej szczegółowo

Metody testowania platformy KASKADA

Metody testowania platformy KASKADA Metody testowania platformy KASKADA Jerzy Procz Bartªomiej Daca Tomasz Bieli«ski 12 wrze±nia 2011 Streszczenie W rozdziale przedstawiono wykorzystywany iteracyjny i inkrementalny proces wytwarzania oprogramowania,

Bardziej szczegółowo

Opracowanie i implementacja zdecentralizowanej struktury sterowania zespoªem heterogenicznch robotów mobilnych

Opracowanie i implementacja zdecentralizowanej struktury sterowania zespoªem heterogenicznch robotów mobilnych Opracowanie i implementacja zdecentralizowanej struktury sterowania zespoªem heterogenicznch robotów mobilnych Wojciech Szynkiewicz, Andrzej Rydzewski, Marek Majchrowski, Piotr Trojanek, Cezary Zieli«ski

Bardziej szczegółowo

Klastry Wysokiej Dost pno±ci i pakiet heartbeat

Klastry Wysokiej Dost pno±ci i pakiet heartbeat Klastry Wysokiej Dost pno±ci i pakiet heartbeat Paweª Topa Dariusz bik Remigiusz Górecki 24 pa¹dziernika 2007 1 Wprowadzenie Najwy»sz dost pno± systemu komputerowego uzyskuje si poprzez redundancj caªego

Bardziej szczegółowo

Zastosowanie funkcji copula w nansach i statystyce

Zastosowanie funkcji copula w nansach i statystyce UNIWERSYTET JAGIELLO SKI WYDZIAŠ MATEMATYKI I INFORMATYKI INSTYTUT MATEMATYKI Marcin Pitera Zastosowanie funkcji copula w nansach i statystyce ze szczególnym uwzgl dnieniem wyceny instrumentów opartych

Bardziej szczegółowo

Elementy Sztucznej Inteligencji

Elementy Sztucznej Inteligencji Elementy Sztucznej Inteligencji Sztuczne sieci neuronowe wykład Elementy Sztucznej Inteligencji - wykład Plan Wzorce biologiczne. Idea SSN - model sztucznego neuronu. Perceptron prosty i jego uczenie reguł

Bardziej szczegółowo

Elementy Sztucznej Inteligencji

Elementy Sztucznej Inteligencji Elementy Sztucznej Inteligencji Sztuczne sieci neuronowe Plan Wzorce biologiczne. Idea SSN - model sztucznego neuronu. Perceptron prosty i jego uczenie reguł delta Perceptron wielowarstwowy i jego uczenie

Bardziej szczegółowo

AKADEMIA GÓRNICZO-HUTNICZA

AKADEMIA GÓRNICZO-HUTNICZA AKADEMIA GÓRNICZO-HUTNICZA im. Stanisªawa Staszica w Krakowie Wydziaª In»ynierii Mechanicznej i Robotyki Katedra Systemów Energetycznych i Urz dze«ochrony rodowiska mgr in». Roman Filipek ZASTOSOWANIE

Bardziej szczegółowo

Klasykacja ryzyka. Politechnika Gda«ska Wydziaª Fizyki Technicznej i Matematyki Stosowanej

Klasykacja ryzyka. Politechnika Gda«ska Wydziaª Fizyki Technicznej i Matematyki Stosowanej Politechnika Gda«ska Wydziaª Fizyki Technicznej i Matematyki Stosowanej Katedra Analizy Matematycznej i Numerycznej Kierunek Matematyka Specjalno± Matematyka Finansowa Studia II stopnia - magisterskie

Bardziej szczegółowo

Politechnika Szczeci«ska Wydziaª Informatyki. Opracowanie algorytmów przekªadu zda«w j zyku VHDL opisuj cych logik kombinacyjn na równania boolowskie

Politechnika Szczeci«ska Wydziaª Informatyki. Opracowanie algorytmów przekªadu zda«w j zyku VHDL opisuj cych logik kombinacyjn na równania boolowskie Politechnika Szczeci«ska Wydziaª Informatyki Marcin Radziewicz Opracowanie algorytmów przekªadu zda«w j zyku VHDL opisuj cych logik kombinacyjn na równania boolowskie Rozprawa doktorska Promotor: prof.

Bardziej szczegółowo

Budowa rekomendacji w oparciu o wspóln filtracj

Budowa rekomendacji w oparciu o wspóln filtracj Politechnika Warszawska Wydzia Elektroniki i Technik Informacyjnych Instytut Automatyki i Informatyki Stosowanej Rok akademicki 2011/2012 PRACA DYPLOMOWA MAGISTERSKA Wojciech B k Budowa rekomendacji w

Bardziej szczegółowo

Wprowadzenie do Scilaba

Wprowadzenie do Scilaba Wprowadzenie do Scilaba Bruno Pinçon Institut Elie Cartan Nancy E.S.I.A.L. Université Henri Poincaré Email : Bruno.Pincon@iecn.u-nancy.fr Przekªad z j zyka francuskiego Piotr Fulma«ski Wydziaª Matematyki

Bardziej szczegółowo

Wykªady z analizy matematycznej dla studentów informatyki Politechniki Lubelskiej. A. Bobrowski

Wykªady z analizy matematycznej dla studentów informatyki Politechniki Lubelskiej. A. Bobrowski Wykªady z analizy matematycznej dla studentów informatyki Politechniki Lubelskiej A. Bobrowski Spis tre±ci Teoria zbie»no±ci ci gów liczbowych strona 6. Gªówne zagadnienia 6.2 Granice sko«czone i niesko«czone

Bardziej szczegółowo

Uwierzytelnianie i archiwizacja w elektronicznych systemach s downictwa

Uwierzytelnianie i archiwizacja w elektronicznych systemach s downictwa Wydziaª Podstawowych Problemów Techniki Politechniki Wrocªawskiej Uwierzytelnianie i archiwizacja w elektronicznych systemach s downictwa Šukasz Rajchel Praca dyplomowa napisana pod kierunkiem dra Marcina

Bardziej szczegółowo

Metody Informatyki Stosowanej

Metody Informatyki Stosowanej Polska Akademia Nauk Oddział w Gdańsku Komisja Informatyki Metody Informatyki Stosowanej Nr 3/2009 (20) Szczecin 2009 Metody Informatyki Stosowanej Kwartalnik Komisji Informatyki Polskiej Akademii Nauk

Bardziej szczegółowo

Algorytm doboru metod wielokryterialnych w ±rodowisku niedoprecyzowania informacji preferencyjnej

Algorytm doboru metod wielokryterialnych w ±rodowisku niedoprecyzowania informacji preferencyjnej Zachodniopomorski Uniwersytet Technologiczny Wydziaª Informatyki ROZPRAWA DOKTORSKA mgr in». Zbigniew Piotrowski Algorytm doboru metod wielokryterialnych w ±rodowisku niedoprecyzowania informacji preferencyjnej

Bardziej szczegółowo

Metody numeryczne i statystyka dla in»ynierów

Metody numeryczne i statystyka dla in»ynierów Kierunek: Automatyka i Robotyka, II rok Wprowadzenie PWSZ Gªogów, 2009 Plan wykªadów Wprowadzenie, podanie zagadnie«, poj cie metody numerycznej i algorytmu numerycznego, obszar zainteresowa«i stosowalno±ci

Bardziej szczegółowo

Prezentacja - Omówienie trzech istotnych metodyk zarz dzania projekami: PRINCE2, Scrum, TenStep

Prezentacja - Omówienie trzech istotnych metodyk zarz dzania projekami: PRINCE2, Scrum, TenStep Akademia Górniczo-Hutnicza w Krakowie Wydziaª Elektrotechniki, Automatyki, Informatyki i Elektroniki Informatyka Stosowana Prezentacja - Omówienie trzech istotnych metodyk zarz dzania projekami: PRINCE2,

Bardziej szczegółowo

Wst p do sieci neuronowych, wykªad 15 Algorytmy genetyczne

Wst p do sieci neuronowych, wykªad 15 Algorytmy genetyczne Wst p do sieci neuronowych, wykªad 15 Algorytmy genetyczne M. Czoków, J. Piersa Faculty of Mathematics and Computer Science, Nicolaus Copernicus University, Toru«, Poland 2011-25-01 Motywacja Algorytmy

Bardziej szczegółowo

Podstawowe mechanizmy systemu Linux w przetwarzaniu rozproszonym

Podstawowe mechanizmy systemu Linux w przetwarzaniu rozproszonym Podstawowe mechanizmy systemu Linux w przetwarzaniu rozproszonym Boi«ski T. 5 marca 2006 Streszczenie. Linux to otwarty, ci gle rozwijany system operacyjny. Dost pno± kodu ¹ródªowego oraz peªnej dokumentacji

Bardziej szczegółowo

1 Podstawowe wªasno±ci arytmetyczne liczb caªkowitych

1 Podstawowe wªasno±ci arytmetyczne liczb caªkowitych 1 Podstawowe wªasno±ci arytmetyczne liczb caªkowitych 1.1 Oznaczenia W caªym skrypcie b dziemy u»ywali nast puj cych oznacze«: N = {0, 1, 2,... } jest zbiorem liczb naturalnych (z zerem), Z jest zbiorem

Bardziej szczegółowo

ORGANIZACJA KOMUNIKACJI W ZESPOLE PROJEKTOWYM Z WYKORZYSTANIEM OPROGRAMOWANIA WIKI KAROLINA MUSZYŃSKA

ORGANIZACJA KOMUNIKACJI W ZESPOLE PROJEKTOWYM Z WYKORZYSTANIEM OPROGRAMOWANIA WIKI KAROLINA MUSZYŃSKA ORGANIZACJA KOMUNIKACJI W ZESPOLE PROJEKTOWYM Z WYKORZYSTANIEM OPROGRAMOWANIA WIKI KAROLINA MUSZYŃSKA Streszczenie Oprogramowanie oparte na mechanizmach Wiki coraz cz ciej znajduje zastosowanie w ró nego

Bardziej szczegółowo

Wybór metody preprocessingu zmiennych wejciowych do prognozowania płacenia przez przedsibiorstwo dywidendy

Wybór metody preprocessingu zmiennych wejciowych do prognozowania płacenia przez przedsibiorstwo dywidendy Agata Raszka 1 Wybór metody preprocessingu zmiennych wejciowych do prognozowania płacenia przez przedsibiorstwo dywidendy 1. Wprowadzenie Termin sztuczna inteligencja został zaproponowany w 1956 roku przez

Bardziej szczegółowo

ZASTOSOWANIE TECHNIK EKSPLORACJI DANYCH DO ESTYMACJI PRACOCHŁONNO CI PROJEKTÓW INFORMATYCZNYCH

ZASTOSOWANIE TECHNIK EKSPLORACJI DANYCH DO ESTYMACJI PRACOCHŁONNO CI PROJEKTÓW INFORMATYCZNYCH ZASTOSOWANIE TECHNIK EKSPLORACJI DANYCH DO ESTYMACJI PRACOCHŁONNO CI PROJEKTÓW INFORMATYCZNYCH ANDRZEJ KOBYLI SKI, PRZEMYSŁAW POSPIESZNY Szkoła Główna Handlowa w Warszawie Streszczenie W dzisiejszym wiecie

Bardziej szczegółowo

Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych.

Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych. Metody Sztucznej Inteligencji 2 Projekt Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych. Autorzy: Robert Wojciechowski Michał Denkiewicz Mateusz Gągol Wstęp Celem projektu

Bardziej szczegółowo