Wykład 1: Wprowadzenie do sieci neuronowych

Podobne dokumenty
Wykład 1: Wprowadzenie do sieci neuronowych

Wstęp do teorii sztucznej inteligencji Wykład III. Modele sieci neuronowych.

Sztuczne sieci neuronowe

Podstawy Sztucznej Inteligencji (PSZT)

Sztuczne sieci neuronowe

Wstęp do sztucznych sieci neuronowych

Temat: Sieci neuronowe oraz technologia CUDA

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

Wstęp do teorii sztucznej inteligencji Wykład II. Uczenie sztucznych neuronów.

Inteligentne systemy informacyjne

Literatura. Sztuczne sieci neuronowe. Przepływ informacji w systemie nerwowym. Budowa i działanie mózgu

SIECI NEURONOWE Liniowe i nieliniowe sieci neuronowe

MODELOWANIE RZECZYWISTOŚCI

Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD X: Sztuczny neuron

Elementy kognitywistyki III: Modele i architektury poznawcze

Metody Sztucznej Inteligencji II

Sieć Hopfielda. Sieci rekurencyjne. Ewa Adamus. ZUT Wydział Informatyki Instytut Sztucznej Inteligencji i Metod Matematycznych.

Sztuczne sieci neuronowe (SNN)

Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga;

Uczenie sieci neuronowych i bayesowskich

8. Neuron z ciągłą funkcją aktywacji.

Sieci neuronowe jako sposób na optymalizacje podejmowanych decyzji. Tomasz Karczyoski Wydział W-08 IZ

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

synaptycznych wszystko to waży 1.5 kg i zajmuje objętość około 1.5 litra. A zużywa mniej energii niż lampka nocna.

wiedzy Sieci neuronowe

Podstawy sztucznej inteligencji

Inteligentne systemy przeciw atakom sieciowym

Spis treści I. Systemy Eksperckie

Temat: Sztuczne Sieci Neuronowe. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

Elementy inteligencji obliczeniowej

WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO. Stanisław Kowalik (Poland, Gliwice)

SIECI NEURONOWE Wprowadzenie

METODY INŻYNIERII WIEDZY

BIOCYBERNETYKA SIECI NEURONOWE. Akademia Górniczo-Hutnicza. Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej.

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

Obliczenia Naturalne - Sztuczne sieci neuronowe

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2013/2014

Elementy kognitywistyki III: Modele i architektury poznawcze

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

HAŁASU Z UWZGLĘDNIENIEM ZJAWISK O CHARAKTERZE NIELINIOWYM

Deep Learning na przykładzie Deep Belief Networks

I EKSPLORACJA DANYCH

ZACHODNIOPOMORSKI UNIWERSYTET TECHNOLOGICZNY W SZCZECINIE

Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD XI: Sztuczne sieci neuronowe

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Sztuczne sieci neuronowe

Wprowadzenie do teorii systemów ekspertowych

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

OCENA DZIAŁANIA AE. METODY HEURYSTYCZNE wykład 4 LOSOWOŚĆ W AE KRZYWE ZBIEŻNOŚCI ANALIZA STATYSTYCZNA:

Wstęp do sieci neuronowych, wykład 01 Neuron biologiczny. Model perceptronu prostego.

SZTUCZNA INTELIGENCJA

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

miejsca przejścia, łuki i żetony

Sztuczne Sieci Neuronowe. Wiktor Tracz Katedra Urządzania Lasu, Geomatyki i Ekonomiki Leśnictwa, Wydział Leśny SGGW

ELEMENTY SZTUCZNEJ INTELIGENCJI. Sztuczne sieci neuronowe

Zastosowania sieci neuronowych

MODELOWANIE RZECZYWISTOŚCI

Sztuczna inteligencja

Wstęp do sieci neuronowych, wykład 04. Skierowane sieci neuronowe. Algorytmy konstrukcyjne dla sieci skierowanych

Sieci Petriego. Sieć Petriego

Seminarium magisterskie. Dyskusja nad tematem pracy magisterskiej pisanej pod kierunkiem pani Dr hab. Małgorzaty Doman

Zastosowania sieci neuronowych

Algorytmy sztucznej inteligencji

Definicja perceptronu wielowarstwowego

Lekcja 5: Sieć Kohonena i sieć ART

Identyfikacja obiektów dynamicznych za pomocą sieci neuronowych

Sztuczne siei neuronowe - wprowadzenie

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych.

SIECI REKURENCYJNE SIECI HOPFIELDA

SZTUCZNE SIECI NEURONOWE

Elementy Sztucznej Inteligencji. Sztuczne sieci neuronowe cz. 2

METODY INTELIGENCJI OBLICZENIOWEJ wykład 5

Sieci neuronowe do przetwarzania informacji / Stanisław Osowski. wyd. 3. Warszawa, Spis treści

Prof. Stanisław Jankowski

MATLAB Neural Network Toolbox przegląd

PRZEWODNIK PO PRZEDMIOCIE

Sieci neuronowe w Statistica

SIEĆ NEURONOWA JAKO NARZĘDZIE APROKSYMACJI I KLASYFIKACJI DANYCH. Jakub Karbowski Gimnazjum nr 17 w Krakowie

Sieć przesyłająca żetony CP (counter propagation)

METODY INTELIGENCJI OBLICZENIOWEJ wykład 4

Sztuczne sieci neuronowe i sztuczna immunologia jako klasyfikatory danych. Dariusz Badura Letnia Szkoła Instytutu Matematyki 2010

Optymalizacja optymalizacji

SZTUCZNE SIECI NEURONOWE

WYKŁAD 4 PLAN WYKŁADU. Sieci neuronowe: Algorytmy uczenia & Dalsze zastosowania. Metody uczenia sieci: Zastosowania

Sieci M. I. Jordana. Sieci rekurencyjne z parametrycznym biasem. Leszek Rybicki. 30 listopada Leszek Rybicki Sieci M. I.

Sieci neuronowe w Statistica. Agnieszka Nowak - Brzezioska

Redakcja: Urszula Markowska-Kaczmar Halina Kwaśnicka SIECI NEURONOWE W ZASTOSOWANIACH. Praca zbiorowa

Uniwersytet Mikołaja Kopernika. Wydział Matematyki i Informatyki. Jarosław Piersa piersaj(at)mat.uni.torun.pl

KARTA MODUŁU KSZTAŁCENIA

Sztuczne sieci neuronowe

Praktyczne informacje o sieciach neuronowych. Elżbieta Dłubis. Państwowa Wyższa Szkoła Zawodowa w Chełmie

1. Architektury, algorytmy uczenia i projektowanie sieci neuronowych

Sztuczne sieci neuronowe Ćwiczenia. Piotr Fulmański, Marta Grzanek

Systemy Inteligentnego Przetwarzania wykład 1: sieci elementarne

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Sieci neuronowe i ich ciekawe zastosowania. Autor: Wojciech Jamrozy III rok SMP / Informatyka

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE

Transkrypt:

Wykład 1: Wprowadzenie do sieci neuronowych Historia badań nad sieciami neuronowymi. - początki: badanie komórek ośrodkowego układu nerwowego zwierząt i człowieka, czyli neuronów; próby wyjaśnienia i matematycznego opisu działania błony komórkowej i całego neuronu [McCu43] - koniec lat pięćdziesiątych i lata sześćdziesiąte: pierwsze modele pojedynczych neuronów i sieci, w tym: popularny perceptron Rosenblatta i Wightmana [Rose65] (przeznaczony do rozpoznawania znaków alfanumerycznych) pierwsze neurokomputery oferowane komercyjnie: Madaline Widrowa - zahamowanie badań na przełomie lat '60 i '70 po publikacji książki Minsky'ego i Paperta [Mins69], wykazującej m.in. poważną ograniczoność pola zastosowań liniowych sieci neuronowych (zdolne jedynie do realizacji funkcji liniowych) - lata '70 i początek '80: sieciami zajmuje się w świecie zaledwie kilka ośrodków (Grossberg, Hinton, Hopfield, PDP Research Group) - początek '80: rozwój i większa dostępność komputerowych technik symulacji przyczynia się do stopniowej intensyfikacji badań - druga połowa lat '80: "renesans" sieci: fala nowych koncepcji, architektur, algorytmów uczenia; ważna, monograficzna praca Rumelharta, McClellanda i PDP Research Group "Parallel Distributed Processing. Explorations in the Microstructure of Cognition" [Rume86], podsumowująca stan badań nad sieciami neuronowymi; w nim publikacja algorytmu nadającego się do uczenia wielowarstwowych sieci o nieliniowych neuronach (backpropagation) wraz z wykazaniem ich przewagi nad sieciami opartymi na perceptronach; inna przyczyna wzrostu popularności: rosnące zainteresowanie ze strony specjalistów zajmujących się Sztuczną Inteligencją, wobec kryzysu nękającego tradycyjne, symboliczne techniki rozwijane w latach '60, '70 i '80 (Newell, Simon itp.) - lata '90: dalsza rosnąca popularność; rozwój sektora zastosowań w medycynie, przemyśle, edukacji i innych dziedzinach coraz większa ilość przystępnych cenowo realizacji sprzętowych

Koncepcja obliczeń neuronowych: Definicja opisowa: duża (1) ilość prostych (2), niezależnych jednostek obliczeniowych komunikujących się ze sobą, pracujących równolegle (3) (1) liczba neuronów w sieci zależy od rozmiaru zadania; w przypadku małego problemu może to być ich zaledwie kilka; w istocie chodzi o to, żeby był więcej niż jeden (2) w sensie "realizujących proste odwzorowanie matematyczne" (3) zależnie od implementacji; w praktyce większość sieci realizowana jest sekwencyjnie i programowo; rozwiązania sprzętowe i równoległe spotyka się tam, gdzie liczy się czas, w szczególności w zastosowaniach wymagających funkcjonowanie w czasie rzeczywistym (np. sterowanie)

Inspiracja: neuron "biologiczny" - budowa: soma, akson, dendryty, synapsy - kluczowe znaczenie błony komórkowej w przesyłaniu sygnału; polega ono na propagacji zaburzenia różnicy potencjałów pomiędzy wnętrzem a zewnętrzem komórki; przyczyną tych zaburzeń jest chwilowa utrata "szczelności" przez błonę komórkową - zasada działania: "wpływające" dendrytami bodźce (modulowane częstotliwościowo) sumują się na błonie komórkowej i przy pomocy aksonu zakończonego synapsą przekazywane są do innego neuronu/neuronów - neuronów mamy ~1010, dendrytów ~1014..1015 - różne rodzaje neuronów

Neuron "sztuczny" (dalej zwany "neuronem", inaczej element przetwarzający (processing element), jednostka (unit) ) - znaczne uproszczenie w porównaniu z neuronem biologicznym (precyzyjnym modelowaniem działania neuronu biologicznego zajmuje się tzw.neuroscience); - podstawowe elementy składowe: wejścia (synapsy) opatrzone wagami (lub wektor wag w i wektor wejść x); waga synapsy podłączonej do wyjścia innego neuronu decyduje o jej ważności i jego wpływie na neuron odniesienia pobudzenie e (excitation) neuronu jako suma ważona sygnałów wejściowych pomniejszona o próg θ (threshold) funkcja przejścia/przenosząca/aktywacji f (transfer function): liniowa lub (z reguły) nieliniowa (element progowy, funkcja sigmoidalna, tangens hiperboliczny); ma kluczowe znaczenie dla funkcjonowania neuronu wyjście y, - zasada działania ([Tade93], s.27): wyjście = iloczyn skalarny wektora wejść i wektora wag "przepuszczony" przez funkcję przenoszącą n e w x - θ w x - θ i 1 i i W najprostszym przypadku, jeśli funkcja przenosząca ma postać y=e, mówimy o neuronie liniowym. Dla ujednolicenia zapisu często "ukrywa się" próg θ w postaci wagi w 0 = θ, podłączonej do stałego sygnału. Prowadzi to do uproszczenia powyższej formuły:

- symbol graficzny neuronu - mimo uproszczenia w stosunku do neuronu biologicznego zachowana jest istota działania: ważone sumowanie sygnałów docierających przez wejścia Sieć neuronowa (Sztuczna) sieć neuronowa ((artificial) neural network) wiele połączonych ze sobą neuronów. Każda sieć ma z reguły pewną wyróżnioną grupę "dendrytów" będących jej wejściem i "aksonów" stanowiących wyjście (niekiedy wejście pokrywa się z wyjściem, np. w sieci Hopfielda)

"Systematyka" sieci neuronowych Topologia (architektura), tj. sposób połączenia neuronów ze sobą jednokierunkowe (feed forwarded); połączenia między neuronami nie zamykają się w cykle; Szczególnym przypadkiem architektury jednokierunkowej jest sieć warstwowa, reprezentująca zdecydowanie najpopularniejszą topologię; wyjœcia sieci warstwa wyjœciowa warstwy ukryte warstwa wejœciowa wejœcia sieci rekurencyjne (feedback, bidirectional): obecność sprzężeń zwrotnych Np. sieć Hopfielda: y y y y 1 2 3 N... y 1 y 2 y 3 y N

Sposób propagacji pobudzenia (sygnałów) przez sieć (dotyczy głównie realizacji programowych sieci ze sprzężeniami zwrotnymi) synchroniczny: bieżący stan sieci jest "zamrażany" i na jego podstawie dla każdego neuronu oblicza się nową wartość pobudzenia i wyjścia; następnie wielkości te aktualizuje się dla całej sieci w jednym kroku, jednocześnie dla wszystkich neuronów; asynchroniczny: w kolejnych krokach każdy (z reguły wybrany losowo) neuron oblicza nową wartość swojego pobudzenia i wyjścia, która jest natychmiast, tj. już w następnym kroku, "widziana" przez inne neurony podłączone do jego wyjścia; "przesyłanie żetonów" (counter-propagation): specyficzny model propagacji sygnału bazujący na "dyskretnym" pobudzeniu w postaci "żetonu". Reguła łączenia neuronów między sobą "każdy z każdym" (fully connected); w szczególności: między kolejnymi warstwami w sieciach warstwowych tylko z pewną grupą neuronów, najczęściej z tzw. sąsiedztwem

Cechy sieci neuronowych: + rozproszony charakter przetwarzania informacji i wynikająca z niego odporność na uszkodzenie/eliminację znacznej nawet części neuronów odporność na uszkodzone i zaszumione wzorce + równoległe przetwarzanie informacji (w przypadku implementacji sprzętowych) szybkość działania (w realizacji sprzętowej, wciąż raczej rzadkiej i kosztownej) - powolność większości algorytmów uczących: często setki tysięcy iteracji - trudności z interpretacją wiedzy nabytej przez sieć (brak lub słabe własności eksplikatywne) w związku z jej (tj. wiedzy) rozproszeniem w sieci (tzw. distributed knowledge representation); czarna skrzynka, blackbox - zwłaszcza w uczeniu maszynowym: trudności z reprezentacją niektórych typów danych, np. cech/atrybutów nominalnych o wartościach nie podlegających uporządkowaniu; konieczność stosowania kodowania "1 of n" - duża ilość parametrów (sieci i algorytmu uczącego), przy jednoczesnym braku ścisłych reguł do estymacji ich wartości