Wykład 2. Model Neuronu McCulocha-Pittsa Perceptron Liniowe Sieci Neuronowe
|
|
- Elżbieta Iwona Socha
- 7 lat temu
- Przeglądów:
Transkrypt
1 Sztuczne Sieci Neuronowe Wykład 2 Model Neuronu McCulocha-Pittsa Perceptron Liniowe Sieci Neuronowe wykład przygotowany na podstawie. R. Tadeusiewicz, Sieci Neuronowe, Rozdz. 3. Akademicka Oficyna Wydawnicza RM, Warszawa S. Osowski, Sieci neuronowe do przetwarzania informacji, Oficyna Wydawnicza PW, Warszawa J. Żurada, M. arc, W. Jędruch, Sztuczne sieci neuronowe, Wydawnictwo naukowe PWN, Warszawa
2 Neuron McCullocha-Pittsa Pierwsza formalna definicja sztucznego neutronu opartą na uproszczonym modelu biologicznym podali McCulloch i Pitts (1943). Sygnały wejściowe mają wartość 1 lub 0, reguła aktywacji ma postać y k+1 = 1 gdy Σ w i x i k T = 0 gdy Σ w i x i k < T gdzie k = 0,1,2, oznacza kolejne momenty czasu, w i zaś jest multiplikatywną wagą przypisaną połączeniu. Mimo swojej prostoty neuron ten wykazuje duże potencjalne możliwości. Przy odpowiednim doborze wag i progów można przy jego pomocy zrealizować funkcje logiczne NOT, OR, NOR, NAND 2
3 Neuron McCullocha-Pittsa 3
4 Neuron McCullocha-Pittsa Model McCullocha-Pittsa cechuje elegancja i precyzja matematycznej definicji. Ale zawiera szereg drastycznych uproszczeń. Dopuszcza tylko binarne stany 0,1 Zakłada dyskretność czasu i synchronizacje neuronów w sieci Wagi i progi są niezmienne 4
5 Perceptron Prosty perceptron jest zwykłym modelem McCullocha-Pittsa o odpowiednio przyjętej strategii uczenia. y k (u k ) = 1 gdy u k 0 = 0 gdy u k < 0 Gdzie u k k = Σ w i x i, w i = ±1 dla i=1, 2,..n x1 x2 x3 w1 w2 wn T=0 y Najpopularniejszą metodą uczenia (przeprogramowania) jest tzw. metoda perceptronu, zgodnie z którą dobór wag odbywa się w następującym cyklu: (0) Przy zadanych wstępnie najczęściej losowo wartościach wag, podajemy wektor uczący x k, referencyjny sygnał wyjściowy d k oraz obliczamy sygnał wyjściowy y k. (1) W wyniku porównania dokonujemy uaktualnienia wektora wag: jeżeli y k = d k, wagi pozostają niezmienione jeżeli y k = 0 i d k = 1, w k i (t+1) = wk i (t) + x i jeżeli y k = 1 i d k = 0, w k i (t+1) = wk i (t) - x i 5
6 Perceptron Po uaktualnieniu wag, podajemy nowy wektor x i skojarzoną z nim wartość d. Krok (1) powtarza się wielokrotnie, aż uzyska się minimalizację różnice między wszystkimi wartościami y k i odpowiadającymi im wartościami żądanych d k. Minimalizacja różnic pomiędzy odpowiedziami aktualnymi neuronu y k i wartościami żądanymi d k odpowiada minimalizacji określonej funkcji błędu (funkcji celu) E, definiowanej najczęściej jako E = Σ m (y k (m) d k (m) ) 2 Gdzie sumowanie po indeksie m odpowiada sumowaniu po wszystkich wzorach uczących. 6
7 Perceptron Minimalizacja ta w regule perceptronu odbywa się zgodnie z metodą bezgradientowej optymalizacji. Efektywność metody przy dużej liczbie wzorców jest stosunkowo niewielka, a liczba cykli uczących i czas uczenia wzrasta szybko, nie dając przy tym gwarancji uzyskania minimum funkcji celu. Usunąć te wady można jedynie przez przyjęcie funkcji aktywacji ciągłej, przy której funkcja celu E staje się również ciągła, co umożliwia wykorzystanie w procesie uczenia informacji o wartości grandientu. 7
8 Liniowy Sztuczny Neuron Element opisany powyższym równaniem liniowym jest między innymi zdolny do rozpoznawania wejściowych sygnałów. Sygnały wejściowe Sygnał wyjściowy x 1 x 2... ω2 ωn Funkcja aktywacji, Próg Θ y ω1 x n Współczynniki ω i, nazywane wagami synaptycznymi, podlegają modyfikacjom w trakcie procesu uczenia, który stanowi jeden z zasadniczych wyróżników sieci neuronowych jako adaptacyjnych systemów przetwarzania informacji. 8
9 Liniowy Sztuczny Neuron Niech zestaw sygnałów wejściowych neutronu stanowi wektor x 1 x 2 ω 1 x = x 1 x 2.. x n x n ω n ω 2 e y Σ Próg Θ ϕ Wektor ten można interpretować jako punkt w n-wymiarowej przestrzeni X, nazywanej przestrzenią wejść. Wektor ten możemy też zapisać jako X = < x 1, x 2,..., x n > T Zestaw n współczynników wagowych możemy również rozpatrywać jako wektor W = < ω 1, ω 2,..., ω n > T wyznaczający punkt w n-wymiarowej przestrzeni zwanej przestrzenią wag: y = W X (iloczyn skalarny) 9
10 Rozpoznawanie sygnału Z własności iloczynu skalarnego, można powiedzieć, że wartość y będzie tym większa im bardziej położenie wektora X będzie przypominać położenie wektora wag. Jeżeli założymy, że wektory X, W są znormalizowane do 1, to wówczas y = cos(φ) gdzie φ jest katem pomiędzy wektorem X i W. Jeżeli na wejście neuronu będziemy podawali różne sygnały, X, to sygnał na wyjściu neuronu będzie miał tym większą wartość, im bardziej podany sygnał X będzie podobny do sygnału wzorcowego, który neuron pamięta w postaci swojego zestawu wag W. 10
11 Rozpoznawanie sygnalu Pojedynczy neuron w typowych przypadkach realizuje (z matematycznego punktu widzenia) operacje iloczynu skalarnego wektora sygnałów wejściowych oraz wektora wag. W efekcie, odpowiedź neuronu zależy od wzajemnych stosunków geometrycznych pomiędzy wektorami sygnałów i wektorami wag. 11
12 Warstwa neuronów jako najprostsza sieć Rozważmy warstwę neutronów, z których każdy ma ten sam zestaw sygnałów wejściowych X = < x 1, x 2,..., x n > T, natomiast każdy ma swój własny wektor wag. Ponumerujmy neurony i oznaczmy jako W (m) = < ω 1, ω 2,..., ω n >T wektor wag m-tego neuronu ( m = 1, 2,..., k). Sygnał wyjściowy m-tego neuronu można wyznaczyć ze wzoru: Omawiana struktura stanowi najprostszy przykład sieci neuronowej. Działanie sieci polega na tym, że pojawienie się określonego wektora wejściowego X powoduje powstanie sygnałów wyjściowych y m na wszystkich (m) neuronach wchodzących w skład rozważanej warstwy. 12
13 Warstwa neuronów jako najprostsza sieć y 1 y 2 y 3 w 1 (1), w 2 (1)...w n (1) w 1 (2), w 2 (2)...w n (2) w 1 (3), w 2 (3)...w n (3) x 1 x 2 x 3 Oczekujemy maksymalnego sygnału w tym neuronie, którego wektor wag W (m) najbardziej przypomina X. Sieć tego typu może rozpoznawać k różnych klas obiektów, gdyż każdy neuron zapamiętuje jeden wzorcowy obiekt na którego pojawienie się jest uczulony. Wzorce różnych klas zawarte są w poszczególnych neuronach w postaci ich wektorów wag. Stosując notacje wektorową możemy zapisać Y = < y 1, y 2,..., y k > T 13
14 Warstwa neuronów jako najprostsza sieć Możemy wprowadzić macierz W k o wymiarach k n, utworzoną w taki sposób, że jej kolejnymi wierszami są (transponowane) kolejne wektory W (m) (dla m = 1,2,...,k). Macierz W (m) ma więc następującą budowę: ω (1) 1 ω(1) 2... ω(1) n ω (2) 1 ω(2) 2... ω(2) n... ω (k) 1 ω(k) 2... ω(k) n y 1 y 2 y 3 w 1 (1), w 2 (1)...w n (1) w 1 (2), w 2 (2)...w n (2) w 1 (3), w 2 (3)...w n (3) x 1 x 2 x 3 14
15 Warstwa neuronów jako najprostsza sieć Wykorzystując macierz W k można zapisać funkcję realizowaną przez całą sieć w formie y 1 y 2 y 3 Y = W k X w 1 (1), w 2 (1)...w n (1) w 1 (2), w 2 (2)...w n (2) w 1 (3), w 2 (3)...w n (3) x 1 x 2 x 3 Macierz W k zadaje odwzorowanie liniowe sygnału X R n w sygnał Y R k. Odwzorowanie to może być w zasadzie dowolne (np. transformacja Fouriera). Przekształcenie sygnału X w sygnał Y można też interpretować jako filtrację, w związku z tym o sieci neuronowej dokonującej takiego przekształcenia możemy mówić jako o filtrze. 15
16 Uczenie pojedynczego neuronu O zachowaniu pojedynczego neuronu decydował wektor wag W, a o działaniu sieci macierz wag W k. Istnieje możliwość zastąpienia jednorazowego w n aktu zaprogramowania sieci, iteracyjnym, δ wieloetapowym procesem jej uczenia. z - Aby zapewnić możliwość uczenia, trzeba wprowadzony już model neuronu uzupełnić o dwa dodatkowe elementy: procesor zmiany wag oraz detektor błędu. Tak zmodyfikowany neuron nazywany bywa ADALINE (ADAptive LINear Element), i wykazuje zastanawiająco bogate możliwości w zakresie dostosowywania swojego działania do wymagań wynikających z postawionego zadania. x 1 w 1 w 2 y 16
17 ADALINE, MADALINE Neurony liniowe ADALINE i zbudowane z nich sieci liniowe, znane w literaturze pod MADALINE są najprostsze w budowie, a równocześnie są w wielu wypadkach wysoce użyteczne. Neurony Elementy z których buduje się sieci, charakteryzują się występowaniem wielu wejść i jednego wyjścia. Sygnały wejściowe x i (i=1, 2,...n) oraz sygnał wyjściowy y mogą przyjmować wartości z pewnego ograniczonego przedziału. Z dokładnością do prostej funkcji skalującej można przyjąć, że x i [-1, 1] dla każdego i, a także y [-1, 1] Zależność y = f( x 1, x 2,..., x n ) w najprostszym przypadku może być rozważana jako liniowa n y = Σ ω i x i i=1 17
18 Uczenie pojedynczego neuronu Załóżmy, że zadanie stawiane ADALINE polega na tym, by sygnał wyjściowy y był związany z sygnałami wejściowymi X pewną zależnością funkcyjną x 1 w 1 y = f (X) w 2 y Funkcja f nie musi być zadana w sposób jawny; wystarczy, że dla każdego konkretnego wektora wejściowego potrafimy wskazać konkretną wartość z w n δ - z = f(x) stanowiącą referencyjną wartość odnośnie sygnału wyjściowego y. 18
19 Uczenie pojedynczego neuronu Zasada działania ADALINE przy rozwiązaniu tego zadania oparta jest na podstawowym algorytmie uczenia wprowadzonym przez Widrowa i Hoffa, zwanym regułą DELTA. Wraz z każdym wektorem wejściowym X, do neuronu podany jest również sygnał z, czyli żądana (wymagana) odpowiedź neuronu na sygnał X. Neuron odpowiada na sygnał X sygnałem x 1 z w 1 w 2 w n δ - y y = W X, przy czym jeśli neuron nie jest nauczony, sygnał ten jest inny niż wymagany, czyli y z. Wewnątrz neuronu ADALINE istnieje blok składający się z sumatora i inwertora oceniający wielkość błędu δ = z y 19
20 Uczenie pojedynczego neuronu Na podstawie sygnału błędu δ oraz wektora wejściowego X możliwe jest takie skorygowanie wektora wag W, by neuron lepiej realizował zadaną funkcję y = f(x). Nowy wektor wag obliczany jest ze wzoru W = W + η δ X x 1 z w 1 w 2 w n δ - y gdzie η jest współczynnikiem liczbowym, decydującym o szybkości uczenia. Korekta W jest tym silniejsza im większy został odnotowany błąd. 20
21 Matematyczne aspekty procesu uczenia sieci Wprowadźmy pojecie ciągu uczącego. Ciąg ten ma następującą budowę: U = < < X (1), z (1) >, < X (2), z (2) >,..., < X (N), z (N) > > czyli składa się z par postaci < X (j), z (j) > zawierających wektor X (j) podany w j-tym kroku procesu uczenia i informacje o wymaganej odpowiedzi neutronu z (j) w tym kroku. Regułę uczenia możemy napisać następująco: W (j+1) = W (j) + η (j) δ (j) X (j) gdzie δ (j) = z (j) - y (j) oraz y (j) = W (j) X (j) Reguła ta daje się łatwo stosować pod warunkiem wprowadzenia początkowego wektora wag W (1) ; zwykle zakłada się że wektor ten ma składowe wybrane losowo. 21
22 Matematyczne aspekty procesu uczenia sieci Celem procesu uczenia jest uzyskanie zgodności odpowiedzi neutronu y (j) z wymaganymi wartościami z (j), co daje się sprowadzić do problemu minimalizacji funkcji kryterialnej Q = ½ ( z (j) - y (j) ) 2 Σ N j=1 powyższy wzór możemy też zapisać jako Q = Q (j), gdzie Q (j) = ½ ( z (j) - y (j) ) 2 Σ N j=1 22
23 Matematyczne aspekty procesu uczenia sieci Ponieważ Q = Q(W), zatem poszukiwanie minimum może być dokonywane metodą gradientową. Skupiając uwagę na i-tej składowej wektora W, możemy więc zapisać: ω i - ω i = ω i = - η Q ω i Wzór ten można interpretować w sposób następujący: poprawka ω i jakiej powinna podlegać i-ta składową wektora W, musi być proporcjonalna do i-tej składowej gradientu funkcji Q. Znak w omawianym wzorze wynika z faktu, że gradient Q wskazuje kierunek najszybszego wzrastania tej funkcji, podczas gdy w omawianej metodzie zależy nam na tym, by zmieniać W w kierunku najszybszego malenia błędu popełnianego przez sieć, czyli w kierunku najszybszego malenia funkcji Q. Współczynnik proporcjonalności η (i) określa wielkość kroku ω i i może być w zasadzie wybierany dowolnie. 23
24 Matematyczne aspekty procesu uczenia sieci Przy wyborze współczynnika η (i) mogą pojawić się pewne subtelności: a) Z teorii aproksymacji stochastycznej można wyprowadzić wniosek, że η (i) powinny spełniać warunki Σ j=1 η (i) =, ( η (i) ) 2 < W najprostszym przykładzie warunki te spełnia ciąg η (i) = η (0) /j Σ j=1 ale szybkie malenie η (i) może ograniczać skuteczność procesu uczenia. b) w celu ograniczenia malenia η (i) oraz ograniczenia rośnięcia modułu wektora W, często proponuje się η (i) = λ / X (j) 2, gdzie λ jest pewną ustaloną stałą (zwykle 0.1 < λ < 1). 24
25 Matematyczne aspekty procesu uczenia sieci Gradientowa minimalizacja funkcji błędu (funkcji kryterialnej) Rozpisując wzór gradientowego uczenia dla kroku (j), otrzymujemy: Uwzględniając fakt, że Q zależne jest od y, a dopiero y jest funkcją wektora wag W, możemy zapisać wzór, odpowiadający pochodnej funkcji złożonej Na podstawie zależności Q (j) = ½ ( z (j) - y (j) ) 2 można ustalić że, 25
26 Matematyczne aspekty procesu uczenia sieci Natomiast liniowa funkcja wiążąca sygnał wyjściowy y (j) z wektorem wag W (j) powoduje, że Zbierając razem wszystkie powyższe rozważania, końcowa formuła uczenia neuronu typu ADALINE wygląda następująco: co potwierdza jej poprawność. Proces uczenia jest zbieżny i pozwala wyznaczyć potrzebny wektor wag W*, zapewniający dokładną realizację przez neuron wymaganej funkcji y = f(x), jeśli f jest funkcją liniową, lub gwarantujący optymalną (w sensie minimum średniokwadratowego) aproksymację tej funkcji, jeżeli jest ona nieliniowa. 26
27 Uczenie sieci elementów liniowych W sposób analogiczny do opisanego algorytmu uczenia pojedynczego neuronu można uczyć także całą sieć elementów liniowych. y 1 y 2 y k w 1 (1), w 2 (1)... w n (1) w 1 (2), w 2 (2)... w n (2) w 1 (k), w 2 (k)... w n (k) x 1 x 2 x k 27
28 Uczenie sieci elementów liniowych Obiektem i podlegającym uczeniu jest w tym wypadku macierz W k, a ciąg uczący ma postać: gdzie Z (j) są k-elementowymi wektorami oznaczającymi wymagane zestawy odpowiedzi sieci na wymuszenia danych odpowiednimi wektorami X (j). Sieć taka w literaturze nazywana jest MADALINE ( Many ADALINE s). Uczenie sieci MADALINE odbywa się w sposób zupełnie analogiczny do uczenia neuronu ADALINE, z tą różnicą że formuła uczenia ma postać macierzową 28
29 Uczenie sieci elementów liniowych: filtry Przypominając interpretację funkcjonowania sieci o n-wejściach i k- wyjściach jako filtra przetwarzającego sygnały X na odpowiadające im (zgodnie z określonym odwzorowaniem) sygnały Y można interpretować proces uczenia sieci jako adaptację filtra do określonych potrzeb. Wkraczamy w ten sposób w krąg zagadnień filtracji adaptacyjnej oraz problemu poszukiwania optymalnego filtra (z punktu widzenia określonych kryteriów), samoczynnie dostosowującego się do potrzeb. Sieci neuronowe (zwłaszcza typu MADALINE) były i są chętnie stosowane jako filtry adaptacyjne (na przykład do eliminacji efektu echa w liniach telefonicznych). Filtry tworzone w wyniku uczenia sieci neuronowej mogą być wykorzystywane do typowych zadań (dolno lub górnoprzepustowa filtracja sygnału, eliminacja zakłóceń, polepszanie stosunku sygnału do szumu, wydobywanie określonych cech sygnału, analiza widmowa, itp.), ale mogą też mieć zupełnie nowe zastosowania. 29
30 Uczenie sieci elementów liniowych: filtry Filtry tego typu mogą służyć do odtwarzania kompletnego sygnału na podstawie jego fragmentu. Takie zadanie nazywa się pamięcią adresowaną kontekstowo lub pamięcią asocjacyjną. Pamięć taka pozwala odtworzyć cały zestaw zapamiętanych informacji w przypadku przedstawienia informacji niekompletnej lub niedokładnej. Tego rodzaju urządzenie, działając w powiązaniu z systemem ekspertowym, może doskonale odpowiadać na pytania użytkowników. Zadaniem sieci jest w tym wypadku uzupełnienie wiadomości podanych przez użytkownika w taki sposób, by system ekspertowy mógł (w oparciu o bazę wiedzy) efektywnie szukać rozwiązania. Innym zastosowaniem omawianych tu filtrów może być tzw. filtr nowości, czyli tej informacji która uległa nagłej zmianie (ochrona przed włamaniem, automatyka przemysłowa). 30
31 Uczenie z lub bez nauczyciela Opisany poprzednio schemat uczenia sieci MADALINE opierał się na założeniu że istnieje zewnętrzny arbiter ( nauczyciel ), który podaje poprawne odpowiedzi Z, w wyniku czego korekta macierzy wag W k następuje w sposób sterowany i zdeterminowany przez cel, jakim jest minimalizacja błędu Q. Taki schemat nazywamy supervised learning albo delta rule. Jest on często niewygodny, ponadto mało wiarygodny biologicznie, gdyż wielu czynności mózg uczy się bez świadomego i celowego instruktażu. 31
32 Uczenie z lub bez nauczyciela Często stosowaną metodą jest technika uczenia bez nauczyciela, zwaną unsupervised learning lub hebbian learning. Zasada tego uczenia polega na tym, że waga ω i (m), i-tego wejścia m-tego neuronu wzrasta podczas prezentacji j-tego wektora wejściowego X (j) proporcjonalnie do iloczynu i-tej składowej sygnału wejściowego tego x i (j) docierającego do rozważanej synapsy i sygnału wyjściowego rozważanego neuronu. przy czym oczywiście Wzmocnieniu w sieci ulegają te wagi, które są aktywne (duże x i (j) ) w sytuacji gdy ich neuron jest pobudzony (duże y m (j) ). Tego typu sieć jest zatem autoasocjacyjna : jeśli pewien wzór pobudzeń X jest sygnalizowany przez pewne m-te wyjście sieci, to w miarę upływu czasu ta sygnalizacja staje się coraz bardziej wyraźna. 32
33 Uczenie z lub bez nauczyciela Sieć uczy się rozpoznawać bodźce oraz grupować w pewne kategorie (clusters), gdyż neuron wytrenowany do rozpoznawania pewnego sygnału X, będzie zdolny do rozpoznawania także tych sygnałów które są podobne do wzorcowego. Zdolność do uogólniania zdobytego już doświadczenia jest jedną z najważniejszych cech sieci neuronowej. Regułę uczenia pochodzącą od praw Hebba nazywa się także niekiedy uczeniem korelacyjnym ( correlation learning ), ponieważ zmierza ona do takiego dopasowania wag aby uzyskać najlepszą korelację pomiędzy sygnałami wejściowymi, a zapamiętanym w formie wartości wag wzorcem sygnału, na który określony neuron ma reagować. Eksponuje ona fakt uśredniania wejściowych sygnałów przez sieć uczoną wg. reguły Hebba. 33
34 Uczenie z lub bez nauczyciela W wyniku takiego uczenia sieć jest zdolna do rozpoznawania sygnałów których wcześniej nigdy jej nie pokazywano: zniekształcone, niekompletne, zaburzone przez szum. Sieć uczona wg. metody Hebba na ogół uzyskuje dobre wyniki i samoczynnie grupuje sygnały wejściowe w kategorie. Efekt ten nie jest jednak nigdy pewny, gdyż istotnie zależy od stanu początkowego sieci. Często też wiele neuronów uczy się rozpoznawać te same kategorie, czyli na ogół ilość neuronów w sieci musi być większa niż liczba oczekiwanych kategorii. 34
35 Warianty metod uczenia i samouczenia Przyrostowe samouczenie (Hebba): Proces samouczenia i samoorganizacji można uczynić bardziej efektywnym poprzez zastosowanie tak zwanego przyrostowego samouczenia ( differential hebbian learning ) polegającego na uzależnieniu procesu zmiany wag od przyrostów sygnałów wejściowych na danej synapsie i wyjściowych na danym neuronie: W niektórych wypadkach ta przyrostowa strategia daje znacznie lepsze rezultaty niż czysty algorytm Hebba. 35
36 Warianty metod uczenia i samouczenia Metoda gwiazdy wejść (Grossberga): W metodzie tej, instar training, wybiera się pewien neuron i narzuca mu się taką strategie uczenia, by zapamiętał i potrafił rozpoznać aktualnie wprowadzany sygnał X. Inne neurony sieci są w tym czasie bezczynne. Z praktyki stosowania tej metody wynikają pewne zalecenia odnośnie wyboru wartości η (j), które powinny się zmieniać zgodnie z empiryczna regułą: przy czym współczynnik λ należy wybrać na tyle mały, by w ciągu całego uczenia zachodził warunek η (j) > 0. 36
37 Warianty metod uczenia i samouczenia Metoda gwiazdy wyjść (Grossberga): Na zasadzie analogii można wprowadzić koncepcje outgoing stars. W koncepcji tej rozważa się wagi wszystkich neuronów całej warstwy, jednak wybiera się wyłącznie wagi łączące te neurony z pewnym ustalonym wejściem. W sieciach wielowarstwowych wejście to pochodzi od pewnego ustalonego neuronu wcześniejszej warstwy i to właśnie ten neuron staje się gwiazdą wyjść (outstar). W powyższym wzorze i jest ustalone, natomiast m jest zmienne i przebiega wszelkie możliwe wartości (m = 1,2,...,k). Reguła zmieniania η (j) jest dana wzorem 37
38 Warianty metod uczenia i samouczenia Metoda instar stosowana jest w przypadku, kiedy trzeba sieć nauczyć rozpoznawania określonego sygnału X, natomiast metoda outstar znajduje zastosowanie przy uczeniu sieci wytwarzania określonego wzorca zachowań Y w odpowiedzi na określony sygnał inicjujący x i. Reguły uczenia podane przez Hebba i Grossberga były przez wielu badaczy wzbogacane i modyfikowane. 38
39 Warianty metod uczenia i samouczenia Dyskryminacja wejściowych i wyjściowych sygnałów. Polega na dzieleniu sygnałów x i (j) i y m (j) na aktywne i nieaktywne. W tym celu wprowadza się pewna ustaloną lub zależną od j wartość progową i wprowadza się nowe zmienne ˆx i (j) = (j) 1 gdy x i > ε 0 w przeciwnym wypadku oraz ŷ i (j) = (j) 1 gdy y i > ε 0 w przeciwnym wypadku Przy tych oznaczeniach nową technikę uczenia wg. zmodyfikowanego algorytmu Hebba zapisać można w postaci: Czy zmiana wagi jest dokonana decyduje logiczny warunek podany powyżej. 39
40 Warianty metod uczenia i samouczenia Reguła Hebb/Anti-Hebb Podany wzór pozwala jedynie na zwiększanie wartości wag, co może prowadzić do osiągania przez nie bardzo dużych wartości. (j) Proponuje się niekiedy uogólniony algorytm, w którym przy aktywnym wyjściu ŷ i ˆ(j) synapsy obsługujące aktywne wejścia x i uzyskują wzmocnienie, a synapsy (j) obsługujące nieaktywne wyjścia są osłabiane (zakłada się że ŷ i {0,1} ) ŷ i (j) Dalsze poszerzenie rozważanej metody uczenia daje wzór Hopfielda, w podobny (j) sposób traktujący zarówno ˆx (j) i jak i ŷ i ˆx i (j) ŷ i (j) Wszystkie współczynniki wagowe podlegają przy nim bardzo intensywnemu treningowi, niezależnie od tego, czy dotyczą wejść aktywnych i niezależnie od tego, czy odpowiednie wyjścia są aktywne, natomiast oczywiście kierunek zmian aktywności wag zależy od aktywności wejść i wyjść. 40
41 Uczenie z rywalizacją i sieci Kohonena Uczenie z rywalizacja (competitive learning) wprowadził Kohonen przy tworzeniu sieci neuronowych uczących się realizacji dowolnych odwzorowań X Y. Zasada uczenia z rywalizacja jest formalnie identyczna z regułą instar z dwoma dość istotnymi uzupełnieniami. Wektor wejściowy X jest przed procesem uczenia normalizowany tak, aby X = 1. Index poddawanego treningowi neuronu m* nie jest przypadkowy czy arbitralnie wybierany, jest to bowiem ten (i tylko ten) neuron którego sygnał wyjściowy y m* (j) jest największy. Przy każdorazowym podaniu sygnału wejściowego X (j) neurony rywalizują ze sobą i wygrywa ten, który uzyskał największy sygnał wyjściowy y m* (j). Tylko ten zwycięski neuron podlega uczeniu, którego efektem jest jeszcze lepsze dopasowanie wag W (m*)(j+1) do rozpoznawania obiektów podobnych do X (j). 41
42 Uczenie z rywalizacją i sieci Kohonena Reguła uczenia Kohonena bywa często wzbogacana o dodatkowy element związany z topologią uczącej się sieci. Neurony w sieci są uporządkowane, można więc wprowadzić pojęcie sąsiedztwa. Uogólniona metoda samoorganizującej się sieci Kohonena polega na tym, że uczeniu podlega nie tylko neuron m* wygrywający w konkurencji z innymi neuronami sieci, ale także neurony które z nim sąsiadują. Formalnie regule można zapisać wzorem: formuła uczenia może być zapisana w formie: ω i (m*)(j+1) = ω i (m*)(j) + η (j) x i (j) ( 2 y m (j) -1 ) 42
43 Uczenie z rywalizacją i sieci Kohonena Funkcjonowanie powyższego wzoru w istotny sposób oparto na fakcie, że y m (j) {0,1}. Wzór ten nazywamy regułą Hebb/Anti-Hebb. Funkcje h(m,m*) można definiować na wiele różnych sposobów, na przykład: 1 dla m=m* h(m,m*) = 0.5 dla m-m* =1 0 dla m-m* > 1 h(m,m*) = 1/ρ(m,m ) h(m,m*) = exp ( - [ρ(m,m )] 2 ) 43
44 Uczenie z forsowaniem Omawiane dotychczas techniki uczenia bez nauczyciela mają bardzo interesującą odmianę polegającą na wykorzystaniu przytoczonych powyżej metod wówczas kiedy wektor wymaganych wartości sygnałów wyjściowych sieci Z (j) jest znany. Wszystkie wymienione powyżej metody uczenia dadzą się łatwo zastosować poprzez zamianę y przez stosowne z. Takie uczenie ma charakter forsowania poprawnych rozwiązań bez względu na to co robi sieć. 44
45 Uczenie z forsowaniem Wyróżnić możemy następujące metody: metoda autoasocjacji: metoda przyrostowej autoasocjacji: metoda zbliżania wektora wag do wektora odpowiedzi: Wybór jednej z różnych możliwości podyktowany musi być ocena ich przydatności w konkretnym zadaniu. Brak jest tutaj konkretnej teorii, konieczne są eksperymenty i poszukiwania oparte na badaniach empirycznych. 45
46 Uczenie z forsowaniem Sieć może służyć jako pamięć Wystartujmy od równania autoasocjacji i przepiszmy go do postaci macierzowej Efekt uczenia można zapisać w postaci sumarycznego wzoru N Σ j=1 Załóżmy, że W k (1) =0 oraz przyjmijmy że wszystkie wektory wejściowe w ciągu uczącym są ortonormalne. Wówczas sieć nauczy się wiernie odtwarzać wymagane sygnały wyjściowe dla wszystkich rozważanych sygnałów wejściowych. 46
47 Uczenie z forsowaniem Sieć ma zdolność uogólniania: Sieć jest zdolna do uogólniania sygnałów wejściowych: gdzie ζ (j) reprezentuje szum zniekształcający sygnały wejściowe w każdym kolejnym przykładzie. Taki model odpowiada np. procedurze odczytywania ręcznie pisanych liter. Jeżeli dla każdego wczytywanego X (j) będziemy podawać ten sam wektor wyjściowy Z (np. uczmy sieć rozpoznawania litery A), to w wyniku uczenia macierz wag zostanie zbudowana następująco: 47
48 Uczenie z forsowaniem W macierzy wag manifestować się będzie głownie idealny wzorzec X, podczas gdy na ogół ma niewielką wartość, ponieważ poszczególne składniki ζ (j) mogą się wzajemnie kompensować. Oznacza to, że sieć ma zdolność uśredniania sygnałów wejściowych i może sama odkryć nowy wzorzec X. Oba omawiane efekty są niezależne od siebie i mogą być nałożone, co w wyniku daje sieć która ma zdolność zapamiętania różnych reakcji Z na różne sygnały wejściowe X wydobywane z serii przypadkowo zniekształconych obserwacji. Organiczeniem może być pojemność pamięci związana z liczbą neuronów w sieci: 48
49 Przyspieszanie procesu uczenia W bardziej złożonych i rozbudowanych sieciach istotną rolę odgrywa sprawność procesu uczenia. Jak optymalizujemy potrzebne CPU? Odpowiedni dobór wartości η (j) Wprowadzanie do wzoru na korektę wektora wag dodatkowego składnika uwzględniającego bezwładność procesu zmiany wag w postaci tzw. momentu. gdzie moment M (j) wyliczane jest ze wzoru: 49
50 Przyspieszanie procesu uczenia Ograniczanie procesu uczenia wyłącznie do dużych poprawek. Oznacza to, że reguła uczenia ma dodatkowy parametr η 3 i działa następująco: (m)(j+1) (m)(j) (j) ω i = ω i + η 1 x i (j) (j) (z m - y m ) (j) (j) gdy (z m - y m ) η 3 (m)(j) ω i (j) (j) gdy (z m - y m ) < η 3 Wybór współczynników η 1, η, η 2 3 jest sprawą doświadczenia/intuicji osoby która stosuje specyficzny algorytm. Wygładzanie wykładnicze: W k (j+1) = W k (j) + η 1 { (1 - η 1 ) ( Z (j) Y (j) ) [ X (j) ] T + η 2 ( W k (j) - W k (j-1) ) } Istotnym problemem jest również odpowiednia randomizacja zbioru uczącego, kolejne elementy X (j) powinny być losowo wybierane (a nie cyklicznie). 50
51 Uwagi końcowe Sieci MADALINE były pierwszymi efektywnie zastosowanymi sieciami neuronowymi i wciąż pozostają używanym narzędziem przy budowaniu systemów rozpoznających, filtrów, pamięci asocjacyjnych. Jednakże: Możliwości systemów budowanych z elementów liniowych są ograniczone. sieć może realizować tylko odwzorowania liniowe klasa dostępnych odwzorowań nie zależy od tego czy mamy odczynienia z siecią jednowarstwową czy wielowarstwową. Budowa wielowarstwowej sieci liniowej nie ma sensu, ponieważ można ją zastąpić efektywną siecią jednowarstwową. Y = W n X ( W n = W k W l ) 51
52 Uwagi końcowe W ramach sieci liniowych, rozważa się dwa schematy funkcjonowania takiej sieci jednokierunkowy przepływ sygnałów (feedforward) sygnały X pojawiające się na wejściu są niezależne od sygnałów na wyjściu Y sieci ze sprzężeniem zwrotnym (feedback) w których sygnały wyjściowe Y są pośrednio lub bezpośrednio podawane na wejście X. Takie sieci nazywane są autoasocjacyjnymi i oznaczają się bogatymi własnościami dynamicznymi. X SIEć Y 52
53 Zestaw pytań do testu 1. Co to jest neuron McCullocha-Pittsa i jakie układy logiczne można przy jego pomocy zrealizować? 2. Jakie elementy musi zawierać neutron ADALINE? 3. Napisz wzór na sygał wyjściowy neuronu liniowego. 4. Co to jest reguła delta? 5. Napisz końcowy wzór na zmianę wag neuronu ADALINE. 6. Co to jest sieć MADALINE i czy może być stosowana jako filter? 7. Dlaczego w sieci liniowej nie wprowadzamy warstw? 8. Na czym polega idea samouczenia Hebba? 9. Napisz wzór na zmianie wag w sieci Kohonena uczonej metodą Hebb/Anti-Hebb. 10. Napisz wzór na zmianę wag przy uczeniu z forsowaniem. 53
54 Elementarne układy logiczne x1 x2 x3 w =1 w =1 w =1 T=1 w= -1 T=0 NOR x1 w = -1 T=0 w=1 x2 x3 w = -1 w = -1 T=0 T=0 w=1 w=1 T=0 NAND 54
Sieci Neuronowe. Liniowe Sieci Neuronowe
Sieci Neuronowe Liniowe Sieci Neuronowe Paweł KrzyŜanowski ETI 9.4 Sieci Liniowe Sieci liniowe, znane w literaturze pod nazwami ADALINE i MADALINE są najprostsze w budowie, a równocześnie są w wielu wypadkach
Wstęp do teorii sztucznej inteligencji Wykład II. Uczenie sztucznych neuronów.
Wstęp do teorii sztucznej inteligencji Wykład II Uczenie sztucznych neuronów. 1 - powtórzyć o klasyfikacji: Sieci liniowe I nieliniowe Sieci rekurencyjne Uczenie z nauczycielem lub bez Jednowarstwowe I
Literatura. Sztuczne sieci neuronowe. Przepływ informacji w systemie nerwowym. Budowa i działanie mózgu
Literatura Wykład : Wprowadzenie do sztucznych sieci neuronowych Małgorzata Krętowska Wydział Informatyki Politechnika Białostocka Tadeusiewicz R: Sieci neuronowe, Akademicka Oficyna Wydawnicza RM, Warszawa
Wstęp do teorii sztucznej inteligencji Wykład III. Modele sieci neuronowych.
Wstęp do teorii sztucznej inteligencji Wykład III Modele sieci neuronowych. 1 Perceptron model najprostzszy przypomnienie Schemat neuronu opracowany przez McCullocha i Pittsa w 1943 roku. Przykład funkcji
wiedzy Sieci neuronowe
Metody detekcji uszkodzeń oparte na wiedzy Sieci neuronowe Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski Wykład 7 Wprowadzenie Okres kształtowania się teorii sztucznych sieci
Sztuczne sieci neuronowe
www.math.uni.lodz.pl/ radmat Cel wykładu Celem wykładu jest prezentacja różnych rodzajów sztucznych sieci neuronowych. Biologiczny model neuronu Mózg człowieka składa się z około 10 11 komórek nerwowych,
8. Neuron z ciągłą funkcją aktywacji.
8. Neuron z ciągłą funkcją aktywacji. W tym ćwiczeniu zapoznamy się z modelem sztucznego neuronu oraz przykładem jego wykorzystania do rozwiązywanie prostego zadania klasyfikacji. Neuron biologiczny i
Sztuczna Inteligencja Tematy projektów Sieci Neuronowe
PB, 2009 2010 Sztuczna Inteligencja Tematy projektów Sieci Neuronowe Projekt 1 Stwórz projekt implementujący jednokierunkową sztuczną neuronową złożoną z neuronów typu sigmoidalnego z algorytmem uczenia
Lekcja 5: Sieć Kohonena i sieć ART
Lekcja 5: Sieć Kohonena i sieć ART S. Hoa Nguyen 1 Materiał Sieci Kohonena (Sieć samo-organizująca) Rysunek 1: Sieć Kohonena Charakterystyka sieci: Jednowarstwowa jednokierunkowa sieć. Na ogół neurony
Metody Sztucznej Inteligencji II
17 marca 2013 Neuron biologiczny Neuron Jest podstawowym budulcem układu nerwowego. Jest komórką, która jest w stanie odbierać i przekazywać sygnały elektryczne. Neuron działanie Jeżeli wartość sygnału
Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga;
Sieci Hopfielda Najprostsze modele sieci z rekurencją sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga; Modele bardziej złoŝone: RTRN (Real Time Recurrent Network), przetwarzająca sygnały w czasie
Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe
Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe Trening jednokierunkowych sieci neuronowych wykład 2. dr inż. PawełŻwan Katedra Systemów Multimedialnych Politechnika Gdańska
Sztuczna inteligencja
Sztuczna inteligencja Wykład 7. Architektury sztucznych sieci neuronowych. Metody uczenia sieci. źródła informacji: S. Osowski, Sieci neuronowe w ujęciu algorytmicznym, WNT 1996 Podstawowe architektury
SIECI NEURONOWE Liniowe i nieliniowe sieci neuronowe
SIECI NEURONOWE Liniowe i nieliniowe sieci neuronowe JOANNA GRABSKA-CHRZĄSTOWSKA Wykłady w dużej mierze przygotowane w oparciu o materiały i pomysły PROF. RYSZARDA TADEUSIEWICZA BUDOWA RZECZYWISTEGO NEURONU
Podstawy Sztucznej Inteligencji (PSZT)
Podstawy Sztucznej Inteligencji (PSZT) Paweł Wawrzyński Uczenie maszynowe Sztuczne sieci neuronowe Plan na dziś Uczenie maszynowe Problem aproksymacji funkcji Sieci neuronowe PSZT, zima 2013, wykład 12
Sieci neuronowe do przetwarzania informacji / Stanisław Osowski. wyd. 3. Warszawa, Spis treści
Sieci neuronowe do przetwarzania informacji / Stanisław Osowski. wyd. 3. Warszawa, 2013 Spis treści Przedmowa 7 1. Wstęp 9 1.1. Podstawy biologiczne działania neuronu 9 1.2. Pierwsze modele sieci neuronowej
1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda
Sieci neuropodobne 1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN Agenda Trochę neurobiologii System nerwowy w organizmach żywych tworzą trzy
Oprogramowanie Systemów Obrazowania SIECI NEURONOWE
SIECI NEURONOWE Przedmiotem laboratorium jest stworzenie algorytmu rozpoznawania zwierząt z zastosowaniem sieci neuronowych w oparciu o 5 kryteriów: ile zwierzę ma nóg, czy żyje w wodzie, czy umie latać,
SIECI REKURENCYJNE SIECI HOPFIELDA
SIECI REKURENCYJNE SIECI HOPFIELDA Joanna Grabska- Chrząstowska Wykłady w dużej mierze przygotowane w oparciu o materiały i pomysły PROF. RYSZARDA TADEUSIEWICZA SPRZĘŻENIE ZWROTNE W NEURONIE LINIOWYM sygnał
Elementy Sztucznej Inteligencji. Sztuczne sieci neuronowe cz. 2
Elementy Sztucznej Inteligencji Sztuczne sieci neuronowe cz. 2 1 Plan wykładu Uczenie bez nauczyciela (nienadzorowane). Sieci Kohonena (konkurencyjna) Sieć ze sprzężeniem zwrotnym Hopfielda. 2 Cechy uczenia
Temat: Sieci neuronowe oraz technologia CUDA
Elbląg, 27.03.2010 Temat: Sieci neuronowe oraz technologia CUDA Przygotował: Mateusz Górny VIII semestr ASiSK Wstęp Sieci neuronowe są to specyficzne struktury danych odzwierciedlające sieć neuronów w
Wstęp do sztucznych sieci neuronowych
Wstęp do sztucznych sieci neuronowych Michał Garbowski Zachodniopomorski Uniwersytet Technologiczny w Szczecinie Wydział Informatyki 15 grudnia 2011 Plan wykładu I 1 Wprowadzenie Inspiracja biologiczna
METODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY SZTUCZNE SIECI NEURONOWE MLP Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii
Uczenie sieci typu MLP
Uczenie sieci typu MLP Przypomnienie budowa sieci typu MLP Przypomnienie budowy neuronu Neuron ze skokową funkcją aktywacji jest zły!!! Powszechnie stosuje -> modele z sigmoidalną funkcją aktywacji - współczynnik
Sieci Neuronowe - Rok III - kierunek IS w IFAiIS UJ 2008/2009. Sieci Neuronowe. Wykład 4 Wariacje na temat propagacji wstecznej Sieci CP
Sieci Neuronowe - Rok III - kierunek IS w IFAiIS UJ 2008/2009 Sieci Neuronowe Wykład 4 Wariacje na temat propagacji wstecznej Sieci CP wykład przygotowany na podstawie. S. Osowski, Sieci neuronowe w ujęciu
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta www.michalbereta.pl Sieci radialne zawsze posiadają jedną warstwę ukrytą, która składa się z neuronów radialnych. Warstwa wyjściowa składa
SIECI KOHONENA UCZENIE BEZ NAUCZYCIELA JOANNA GRABSKA-CHRZĄSTOWSKA
SIECI KOHONENA UCZENIE BEZ NAUCZYCIELA JOANNA GRABSKA-CHRZĄSTOWSKA Wykłady w dużej mierze przygotowane w oparciu o materiały i pomysły PROF. RYSZARDA TADEUSIEWICZA SAMOUCZENIE SIECI metoda Hebba W mózgu
BIOCYBERNETYKA SIECI NEURONOWE. Akademia Górniczo-Hutnicza. Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej.
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej BIOCYBERNETYKA Adrian Horzyk SIECI NEURONOWE www.agh.edu.pl Mózg inspiruje nas od wieków Co takiego
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 8. SZTUCZNE SIECI NEURONOWE INNE ARCHITEKTURY Częstochowa 24 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska SIEĆ O RADIALNYCH FUNKCJACH BAZOWYCH
Sieć przesyłająca żetony CP (counter propagation)
Sieci neuropodobne IX, specyficzne architektury 1 Sieć przesyłająca żetony CP (counter propagation) warstwa Kohonena: wektory wejściowe są unormowane jednostki mają unormowane wektory wag jednostki są
Elementy inteligencji obliczeniowej
Elementy inteligencji obliczeniowej Paweł Liskowski Institute of Computing Science, Poznań University of Technology 9 October 2018 1 / 19 Perceptron Perceptron (Rosenblatt, 1957) to najprostsza forma sztucznego
Zastosowania sieci neuronowych
Zastosowania sieci neuronowych aproksymacja LABORKA Piotr Ciskowski zadanie 1. aproksymacja funkcji odległość punktów źródło: Żurada i in. Sztuczne sieci neuronowe, przykład 4.4, str. 137 Naucz sieć taką
Inteligentne systemy informacyjne
Inteligentne systemy informacyjne Moduł 10 Mieczysław Muraszkiewicz www.icie.com.pl/lect_pw.htm M. Muraszkiewicz strona 1 Sieci neuronowe szkic Moduł 10 M. Muraszkiewicz strona 2 Dwa nurty M. Muraszkiewicz
METODY INTELIGENCJI OBLICZENIOWEJ wykład 5
METODY INTELIGENCJI OBLICZENIOWEJ wykład 5 1 2 SZTUCZNE SIECI NEURONOWE cd 3 UCZENIE PERCEPTRONU: Pojedynczy neuron (lub 1 warstwa neuronów) typu percep- tronowego jest w stanie rozdzielić przestrzeń obsza-
Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335
Sztuczne sieci neuronowe Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335 Wykład 10 Mapa cech Kohonena i jej modyfikacje - uczenie sieci samoorganizujących się - kwantowanie wektorowe
synaptycznych wszystko to waży 1.5 kg i zajmuje objętość około 1.5 litra. A zużywa mniej energii niż lampka nocna.
Sieci neuronowe model konekcjonistyczny Plan wykładu Mózg ludzki a komputer Modele konekcjonistycze Perceptron Sieć neuronowa Uczenie sieci Sieci Hopfielda Mózg ludzki a komputer Twój mózg to 00 000 000
Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.
Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe. zajecia.jakubw.pl/nai Literatura: S. Osowski, Sieci neuronowe w ujęciu algorytmicznym. WNT, Warszawa 997. PODSTAWOWE ZAGADNIENIA TECHNICZNE AI
Podstawy sztucznej inteligencji
wykład 5 Sztuczne sieci neuronowe (SSN) 8 grudnia 2011 Plan wykładu 1 Biologiczne wzorce sztucznej sieci neuronowej 2 3 4 Neuron biologiczny Neuron Jest podstawowym budulcem układu nerwowego. Jest komórką,
Sztuczne sieci neuronowe Ćwiczenia. Piotr Fulmański, Marta Grzanek
Sztuczne sieci neuronowe Ćwiczenia Piotr Fulmański, Marta Grzanek Piotr Fulmański 1 Wydział Matematyki i Informatyki, Marta Grzanek 2 Uniwersytet Łódzki Banacha 22, 90-232, Łódź Polska e-mail 1: fulmanp@math.uni.lodz.pl,
Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe
Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe wykład 1. Właściwości sieci neuronowych Model matematyczny sztucznego neuronu Rodzaje sieci neuronowych Przegląd d głównych g
Sztuczne Sieci Neuronowe
Sztuczne Sieci Neuronowe Wykład 11 Podsumowanie wykłady przygotowane wg. W. Duch, J. Korbicz, L. Rutkowski, R. Tadeusiewicz, Sieci Neuronowe, Rozdz. 1. Biocybernetyka i Inżynieria Medyczna, tom VI, AOFE,
Sieć Hopfielda. Sieci rekurencyjne. Ewa Adamus. ZUT Wydział Informatyki Instytut Sztucznej Inteligencji i Metod Matematycznych.
Sieci rekurencyjne Ewa Adamus ZUT Wydział Informatyki Instytut Sztucznej Inteligencji i Metod Matematycznych 7 maja 2012 Jednowarstwowa sieć Hopfielda, z n neuronami Bipolarna funkcja przejścia W wariancie
Wstęp do teorii sztucznej inteligencji
Wstęp do teorii sztucznej inteligencji Wykład IV SSN = Architektura + Algorytm Uczenie sztucznych neuronów. Przypomnienie. Uczenie z nauczycielem. Wagi i wejścia dla sieci neuronuowej: reprezentacja macierzowa
Zastosowania sieci neuronowych
Zastosowania sieci neuronowych klasyfikacja LABORKA Piotr Ciskowski zadanie 1. klasyfikacja zwierząt sieć jednowarstwowa żródło: Tadeusiewicz. Odkrywanie własności sieci neuronowych, str. 159 Przykład
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2011-10-11 1 Modelowanie funkcji logicznych
Sieci neuronowe jako sposób na optymalizacje podejmowanych decyzji. Tomasz Karczyoski Wydział W-08 IZ
optymalizacje podejmowanych decyzji Tomasz Karczyoski Wydział W-08 IZ Czym są sieci neuronowe Struktura matematycznych oraz programowy lub sprzętowy model, realizujących obliczenia lub przetwarzanie sygnałów
Sztuczne sieci neuronowe (SNN)
Sztuczne sieci neuronowe (SNN) Pozyskanie informacji (danych) Wstępne przetwarzanie danych przygotowanie ich do dalszej analizy Selekcja informacji Ostateczny model decyzyjny SSN - podstawy Sieci neuronowe
MODELOWANIE RZECZYWISTOŚCI
MODELOWANIE RZECZYWISTOŚCI Daniel Wójcik Instytut Biologii Doświadczalnej PAN Szkoła Wyższa Psychologii Społecznej d.wojcik@nencki.gov.pl dwojcik@swps.edu.pl tel. 022 5892 424 http://www.neuroinf.pl/members/danek/swps/
Inteligentne systemy przeciw atakom sieciowym
Inteligentne systemy przeciw atakom sieciowym wykład Sztuczne sieci neuronowe (SSN) Joanna Kołodziejczyk 2016 Joanna Kołodziejczyk Inteligentne systemy przeciw atakom sieciowym 2016 1 / 36 Biologiczne
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Maja Czoków, Jarosław Piersa, Andrzej Rutkowski Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2018-10-15 Projekt
1. Logika, funkcje logiczne, preceptron.
Sieci neuronowe 1. Logika, funkcje logiczne, preceptron. 1. (Logika) Udowodnij prawa de Morgana, prawo pochłaniania p (p q), prawo wyłączonego środka p p oraz prawo sprzeczności (p p). 2. Wyraź funkcję
Sieci Neuronowe - Rok III - kierunek IS w IFAiIS UJ 2008/2009. Sieci Neuronowe
Sieci Neuronowe Wykład 6 Sieci pamieci skojarzeniowej: sieci Hamminga, sieci Hintona, sieci BAM wykład przygotowany na podstawie. S. Osowski, Sieci neuronowe w ujęciu algorytmicznym, WNT, W-wa 1996. R.
Sieci Neuronowe - Rok III - kierunek IS w IFAiIS UJ 2008/2009. Sieci Neuronowe. Wykład 8 Sieci rezonansowe
Sieci Neuronowe Wykład 8 Sieci rezonansowe wykład przygotowany na podstawie. R. Tadeusiewicz, Sieci Neuronowe, Rozdz. 6. Akademicka Oficyna Wydawnicza RM, Warszawa 1993. Wprowadzenie Sieci wielowarstwowe
Temat: Sztuczne Sieci Neuronowe. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE
Temat: Sztuczne Sieci Neuronowe Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE Dr inż. Barbara Mrzygłód KISiM, WIMiIP, AGH mrzyglod@ agh.edu.pl 1 Wprowadzenie Sztuczne sieci neuronowe
Wstęp do sieci neuronowych, wykład 03 Warstwy RBF, jednostka Adaline.
Wstęp do sieci neuronowych, wykład 3 Warstwy, jednostka Adaline. Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 211-1-18 1 Pomysł Przykłady Zastosowanie 2
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
HAŁASU Z UWZGLĘDNIENIEM ZJAWISK O CHARAKTERZE NIELINIOWYM
ZASTOSOWANIE SIECI NEURONOWYCH W SYSTEMACH AKTYWNEJ REDUKCJI HAŁASU Z UWZGLĘDNIENIEM ZJAWISK O CHARAKTERZE NIELINIOWYM WPROWADZENIE Zwalczanie hałasu przy pomocy metod aktywnych redukcji hałasu polega
Wstęp do sieci neuronowych, wykład 9 Sieci rekurencyjne. Autoasocjator Hopfielda
Wstęp do sieci neuronowych, wykład 9. M. Czoków, J. Piersa 2010-12-07 1 Sieci skierowane 2 Modele sieci rekurencyjnej Energia sieci 3 Sieci skierowane Sieci skierowane Sieci skierowane graf połączeń synaptycznych
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Mechatronika Rodzaj przedmiotu: obowiązkowy Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1. Zapoznanie studentów z inteligentnymi
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2014/2015
Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner rok akademicki 2014/2015 Sieci Kohonena Sieci Kohonena Sieci Kohonena zostały wprowadzone w 1982 przez fińskiego
2.4. Algorytmy uczenia sieci neuronowych
2.4. Algorytmy uczenia sieci neuronowych Prosta struktura sieci jednokierunkowych sprawia, że są najchętniej stosowane. Ponadto metody uczenia ich należą również do popularnych i łatwych w realizacji.
Optymalizacja systemów
Optymalizacja systemów Laboratorium - problem detekcji twarzy autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, P. Klukowski Cel zadania Celem zadania jest zapoznanie się z gradientowymi algorytmami optymalizacji
ELEMENTY SZTUCZNEJ INTELIGENCJI. Sztuczne sieci neuronowe
ELEMENTY SZTUCZNEJ INTELIGENCJI Sztuczne sieci neuronowe Plan 2 Wzorce biologiczne. Idea SSN - model sztucznego neuronu. Perceptron prosty i jego uczenie regułą delta Perceptron wielowarstwowy i jego uczenie
I EKSPLORACJA DANYCH
I EKSPLORACJA DANYCH Zadania eksploracji danych: przewidywanie Przewidywanie jest podobne do klasyfikacji i szacowania, z wyjątkiem faktu, że w przewidywaniu wynik dotyczy przyszłości. Typowe zadania przewidywania
ZASTOSOWANIA SIECI NEURONOWYCH
SN... 1 DZIEJE BADA¼ NAD SIECIAMI NEURONOWYMI - równoleg»y sposób przetwarzania informacji - 1957 : Perceptron, Cornell Aeronautical Laboratory (uk»ad elektromechaniczny do rozpoznawania znaków) 8 komórek,
Elementy kognitywistyki III: Modele i architektury poznawcze
Elementy kognitywistyki III: Modele i architektury poznawcze Wykład VII: Modelowanie uczenia się w sieciach neuronowych Uczenie się sieci i trening nienaruszona struktura sieci (z pewnym ale ) nienaruszone
OCENA DZIAŁANIA AE. METODY HEURYSTYCZNE wykład 4 LOSOWOŚĆ W AE KRZYWE ZBIEŻNOŚCI ANALIZA STATYSTYCZNA:
METODY HEURYSTYCZNE wykład 4 OCENA DZIAŁANIA AE 1 2 LOSOWOŚĆ W AE Różne zachowanie algorytmuw poszczególnych uruchomieniach przy jednakowych ustawieniach parametrów i identycznych populacjach początkowych.
Obliczenia Naturalne - Sztuczne sieci neuronowe
Literatura Wprowadzenie Obliczenia Naturalne - Sztuczne sieci neuronowe Paweł Paduch Politechnika Świętokrzyska 13 marca 2014 Paweł Paduch Obliczenia Naturalne - Sztuczne sieci neuronowe 1 z 43 Plan wykładu
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2012-10-10 Projekt pn. Wzmocnienie
wiedzy Sieci neuronowe (c.d.)
Metody detekci uszkodzeń oparte na wiedzy Sieci neuronowe (c.d.) Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski Wykład 8 Metody detekci uszkodzeń oparte na wiedzy Wprowadzenie
Programowanie celowe #1
Programowanie celowe #1 Problem programowania celowego (PC) jest przykładem problemu programowania matematycznego nieliniowego, który można skutecznie zlinearyzować, tzn. zapisać (i rozwiązać) jako problem
Wstęp do teorii sztucznej inteligencji
Wstęp do teorii sztucznej inteligencji Wykład V Algorytmy uczenia SSN Modele sieci neuronowych. SSN = Architektura + Algorytm Wagi i wejścia dla sieci neuronuowej: reprezentacja macierzowa δ i = z i y
Wykład z Technologii Informacyjnych. Piotr Mika
Wykład z Technologii Informacyjnych Piotr Mika Uniwersalna forma graficznego zapisu algorytmów Schemat blokowy zbiór bloków, powiązanych ze sobą liniami zorientowanymi. Jest to rodzaj grafu, którego węzły
Obliczenia inteligentne Zadanie 4
Sieci SOM Poniedziałek, 10:15 2007/2008 Krzysztof Szcześniak Cel Celem zadania jest zaimplementowanie neuronowej samoorganizującej się mapy wraz z metodą jej nauczania algorytmem gazu neuronowego. Część
Sztuczne sieci neuronowe
Wydział Zarządzania AGH Katedra Informatyki Stosowanej Sztuczne sieci neuronowe Sztuczne sieci neuronowe Wprowadzenie Trochę historii Podstawy działania Funkcja aktywacji Typy sieci 2 Wprowadzenie Zainteresowanie
Widzenie komputerowe
Widzenie komputerowe Uczenie maszynowe na przykładzie sieci neuronowych (3) źródła informacji: S. Osowski, Sieci neuronowe w ujęciu algorytmicznym, WNT 1996 Zdolność uogólniania sieci neuronowej R oznaczenie
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Systemy Inteligentnego Przetwarzania wykład 7: Sieci RBF
Systemy Inteligentnego Przetwarzania wykład 7: Sieci RBF Dr inż. Jacek Mazurkiewicz Katedra Informatyki Technicznej e-mail: Jacek.Mazurkiewicz@pwr.edu.pl Bazowe funkcje radialne (1) Sieci neuronowe wielowarstwowe
Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 311
Sztuczne sieci neuronowe Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 311 PLAN: Wykład 5 - Metody doboru współczynnika uczenia - Problem inicjalizacji wag - Problem doboru architektury
6. Perceptron Rosenblatta
6. Perceptron Rosenblatta 6-1 Krótka historia perceptronu Rosenblatta 6-2 Binarne klasyfikatory liniowe 6-3 Struktura perceptronu Rosenblatta 6-4 Perceptron Rosenblatta a klasyfikacja 6-5 Perceptron jednowarstwowy:
Uczenie sieci neuronowych i bayesowskich
Wstęp do metod sztucznej inteligencji www.mat.uni.torun.pl/~piersaj 2009-01-22 Co to jest neuron? Komputer, a mózg komputer mózg Jednostki obliczeniowe 1-4 CPU 10 11 neuronów Pojemność 10 9 b RAM, 10 10
Wykład 1: Wprowadzenie do sieci neuronowych
Wykład 1: Wprowadzenie do sieci neuronowych Historia badań nad sieciami neuronowymi. - początki: badanie komórek ośrodkowego układu nerwowego zwierząt i człowieka, czyli neuronów; próby wyjaśnienia i matematycznego
Temat: ANFIS + TS w zadaniach. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE
Temat: ANFIS + TS w zadaniach Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE Dr inż. Barbara Mrzygłód KISiM, WIMiIP, AGH mrzyglod@ agh.edu.pl 1. Systemy neuronowo - rozmyte Systemy
Filtracja obrazu operacje kontekstowe
Filtracja obrazu operacje kontekstowe Podział metod filtracji obrazu Metody przestrzenne i częstotliwościowe Metody liniowe i nieliniowe Główne zadania filtracji Usunięcie niepożądanego szumu z obrazu
KADD Minimalizacja funkcji
Minimalizacja funkcji Poszukiwanie minimum funkcji Foma kwadratowa Metody przybliżania minimum minimalizacja Minimalizacja w n wymiarach Metody poszukiwania minimum Otaczanie minimum Podział obszaru zawierającego
ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL. sin x2 (1)
ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL 1. Problem Rozważmy układ dwóch równań z dwiema niewiadomymi (x 1, x 2 ): 1 x1 sin x2 x2 cos x1 (1) Nie jest
Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I
Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I Wojciech Kotłowski Instytut Informatyki Politechniki Poznańskiej email: imię.nazwisko@cs.put.poznan.pl pok. 2 (CW) tel. (61)665-2936 konsultacje:
Definicja perceptronu wielowarstwowego
1 Sieci neuronowe - wprowadzenie 2 Definicja perceptronu wielowarstwowego 3 Interpretacja znaczenia parametrów sieci 4 Wpływ wag perceptronu na jakość aproksymacji 4.1 Twierdzenie o uniwersalnych właściwościach
Wstęp do sieci neuronowych, wykład 9 Sieci rekurencyjne. Autoasocjator Hopfielda
Wstęp do sieci neuronowych, wykład 9. Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2018-12-10 Projekt pn. Wzmocnienie potencjału dydaktycznego UMK w Toruniu
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
Sieci M. I. Jordana. Sieci rekurencyjne z parametrycznym biasem. Leszek Rybicki. 30 listopada Leszek Rybicki Sieci M. I.
Sieci M. I. Jordana Sieci rekurencyjne z parametrycznym biasem Leszek Rybicki 30 listopada 2007 Leszek Rybicki Sieci M. I. Jordana 1/21 Plan O czym będzie 1 Wstęp do sieci neuronowych Neurony i perceptrony
Sztuczne sieci neuronowe. Uczenie, zastosowania
Wydział Zarządzania AGH Katedra Informatyki Stosowanej Sztuczne sieci neuronowe. Uczenie, zastosowania Inteligencja Sztuczne sieci neuronowe Metody uczenia Budowa modelu Algorytm wstecznej propagacji błędu
Sztuczne Sieci Neuronowe
Sztuczne Sieci Neuronowe Wykład 7 Sieci neuronowe o radialnych funkcjach bazowych wykład przygotowany na podstawie. S. Osowski, Sieci Neuronowe w ujęciu algorytmicznym, Rozdz. 5, PWNT, Warszawa 1996. 26/11/08
METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING
METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING NEURONOWE MAPY SAMOORGANIZUJĄCE SIĘ Self-Organizing Maps SOM Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki,
Wstęp do sieci neuronowych, wykład 07 Uczenie nienadzorowane cd.
Wstęp do sieci neuronowych, wykład 07 Uczenie nienadzorowane cd. M. Czoków, J. Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika w Toruniu 2013-11-26 Projekt pn. Wzmocnienie potencjału
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Cyfrowe przetwarzanie obrazów i sygnałów Wykład 7 AiR III
1 Niniejszy dokument zawiera materiały do wykładu z przedmiotu Cyfrowe Przetwarzanie Obrazów i Sygnałów. Jest on udostępniony pod warunkiem wykorzystania wyłącznie do własnych, prywatnych potrzeb i może
5. Rozwiązywanie układów równań liniowych
5. Rozwiązywanie układów równań liniowych Wprowadzenie (5.1) Układ n równań z n niewiadomymi: a 11 +a 12 x 2 +...+a 1n x n =a 10, a 21 +a 22 x 2 +...+a 2n x n =a 20,..., a n1 +a n2 x 2 +...+a nn x n =a
Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2013/2014
Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner rok akademicki 2013/2014 Sieci neuronowe Sieci neuronowe W XIX wieku sformułowano teorię opisującą podstawowe