Systemy uczące się Lab 4

Podobne dokumenty
Systemy uczące się wykład 2

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

Systemy uczące się wykład 1


Elementy modelowania matematycznego

Projekt Sieci neuronowe

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Wprowadzenie do klasyfikacji

Agnieszka Nowak Brzezińska

Co to jest grupowanie

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć

Metody Sztucznej Inteligencji II

Języki programowania imperatywnego

Sztuczna inteligencja : Zbiory rozmyte cz. 2

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Wstęp do sieci neuronowych, wykład 07 Uczenie nienadzorowane.

METODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI

Adrian Horzyk

Sztuczna inteligencja : Algorytm KNN

Wstęp do sieci neuronowych, wykład 07 Uczenie nienadzorowane.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Agnieszka Nowak Brzezińska Wykład III

Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

8. Neuron z ciągłą funkcją aktywacji.

Agnieszka Nowak Brzezińska Wykład III

Optymalizacja optymalizacji

Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Inżynierii Produkcji Dr Małgorzata Lucińska

Metody klasyfikacji danych - część 1 p.1/24

Optymalizacja systemów

ALGORYTM RANDOM FOREST

Sztuczna inteligencja: zbiory rozmyte

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

Algorytm genetyczny (genetic algorithm)-

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

Wstęp do sieci neuronowych, wykład 04. Skierowane sieci neuronowe. Algorytmy konstrukcyjne dla sieci skierowanych

Podstawy sztucznej inteligencji

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Podstawy Sztucznej Inteligencji (PSZT)

Lekcja 5: Sieć Kohonena i sieć ART

Przykładowa analiza danych

Asocjacyjna reprezentacja danych i wnioskowanie

Inteligentne systemy przeciw atakom sieciowym

PRZEWODNIK PO PRZEDMIOCIE

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

Klasyfikacja LDA + walidacja

KARTA MODUŁU KSZTAŁCENIA

Wprowadzenie do programu RapidMiner Studio 7.6, część 4 Michał Bereta

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Rozdział 8 PROGRAMOWANIE SIECIOWE

METODY INŻYNIERII WIEDZY

SZTUCZNA INTELIGENCJA

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING

Automatyczny dobór parametrów algorytmu genetycznego

Zastosowania sieci neuronowych

Sztuczne sieci neuronowe i sztuczna immunologia jako klasyfikatory danych. Dariusz Badura Letnia Szkoła Instytutu Matematyki 2010

PRZEWODNIK PO PRZEDMIOCIE

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

Wykład 4: Statystyki opisowe (część 1)

Wstęp do sieci neuronowych, wykład 9 Sieci rekurencyjne. Autoasocjator Hopfielda

Obliczenia inteligentne Zadanie 4

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania

Rozkład materiału nauczania

A Zadanie

Uczenie się pojedynczego neuronu. Jeśli zastosowana zostanie funkcja bipolarna s y: y=-1 gdy z<0 y=1 gdy z>=0. Wówczas: W 1 x 1 + w 2 x 2 + = 0

METODY INŻYNIERII WIEDZY

Odniesienie symbol II/III [1] [2] [3] [4] [5] Efekt kształcenia. Wiedza

Plan. Zakres badań teorii optymalizacji. Teoria optymalizacji. Teoria optymalizacji a badania operacyjne. Badania operacyjne i teoria optymalizacji

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

I EKSPLORACJA DANYCH

1. Logika, funkcje logiczne, preceptron.

Automatyczna klasyfikacja zespołów QRS

Rozkład materiału nauczania

RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk

Sieci neuronowe do przetwarzania informacji / Stanisław Osowski. wyd. 3. Warszawa, Spis treści

SYLABUS. Dotyczy cyklu kształcenia Realizacja w roku akademickim 2016/2017. Wydział Matematyczno - Przyrodniczy

Porównanie algorytmów wyszukiwania najkrótszych ścieżek międz. grafu. Daniel Golubiewski. 22 listopada Instytut Informatyki

Podejmowanie decyzji - sztuka dobrego wyboru

Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga;

Temat: ANFIS + TS w zadaniach. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

WYMAGANIA EDUKACYJNE NIEZBĘDNE DO UZYSKANIA POSZCZEGÓLNYCH ŚRÓDROCZNYCH I ROCZNYCH OCEN KLASYFIKACYJNYCH Z MATEMATYKI

Metody przeszukiwania

MIO - LABORATORIUM. Imię i nazwisko Rok ak. Gr. Sem. Komputer Data / EC3 VIII LAB...

Elementy Sztucznej Inteligencji. Sztuczne sieci neuronowe cz. 2

Teraz bajty. Informatyka dla szkół ponadpodstawowych. Zakres rozszerzony. Część 1.

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

Metody eksploracji danych w odkrywaniu wiedzy (MED) projekt, dokumentacja końcowa

Transkrypt:

Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018

Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego trzy aspekty: opracowanie teoretyczne zagadnienia, przygotowanie aplikacji w dowolnym języku, przeprowadzenie eksperymentów i wizuzalizacja wyników.

Projekt zaliczeniowy opracowanie teoretyczne Opracowanie teoretyczne powinno zawierać krótki opis oraz zasadę działania wybranej metody. W szczególności: wskazanie pozycji bibliograficznej / stron internetowych, na podstawie których wykonano opracowanie; podstawowe założenia metody; próbę zapisu formalnego wraz z opisem (całej metody), lub wybranego elementu. Np. dla sieci neuronowej zapis formalny może dotyczyć funkcji aktywacji neuronu; pseudokod wraz z opisem przy czym pseudokod może dotyczyć już bezpośrednio rozwiązywanego zadania (jeżeli celem jest klasyfikacja konkretnego zbioru danych, to pseudokod może dotyczyć właśnie tego zbioru).

Projekt zaliczeniowy opracowanie aplikacji Aplikacja może zostać przygotowana w dowolnym języku. Nie należy jednak stosować żadnych bibliotek wbudowanych pozwalających na realizację całego zadania poprzez wywołanie konkretnej metody przykładowo biblioteka umożliwiająca klasyfikację zbioru danych przy pomocy drzewa decyzyjnego, gdzie wejściem jest zbiór danych, a wyjściem klasyfikator. na podstawie pseudokodu opracowanego w części teoretycznej należy przygotować poszczególne metody i funkcje, które następnie posłużą do budowy wybranego narzędzia (na przykład klasyfikatora); nie jest narzucona żadna metoda w szczególności nie jest konieczne stosowanie paradygmatu obiektowego; celem jest poznanie zasady działania wybranej metody, a nie traktowanie jej jako tzw. black box ; można korzystać z bibliotek wbudowanych, kiedy potrzebne jest wykonanie podstawowych operacji na danych takich jak: sortowanie, wyznaczenie średniej, wyznaczenie mediany; aplikacja może działać w trybie konsolowym, przy czym konieczne jest opracowanie wyników (patrz część trzecia projektu).

Projekt zaliczeniowy część eksperymentalna W części trzeciej należy pokazać, że przygotowana aplikacja opracowana na podstawie pseudokodu z części pierwszej działa. W tym celu należy przeprowadzić przykładowe zadanie klasyfikacji / predykcji (lub inne wskazane w projekcie) na podstawie wybranego zbioru danych. Zbiór danych może być dowolny, spreparowany na potrzeby zadania. Można też skorzystać z repozytorium dostępnego w internecie.

Wymagania ocena dostateczna przedstawiony został podstawowy opis teoretyczny wraz z ogólnym pseudokodem. Pominięto zagadnienie dotyczące zapisu formalnego. Kod jest nieczytelny, brak jest komentarzy (wystarczy komentować metody, nie jest konieczne opisywanie każdej zmiennej), a fragmenty kodu noszą znamiona tak zwanego god object, gdzie szereg funkconajlności przypisanych jest do jednej klasy / jednej metody. W części eksperymentalnej wykorzystano prosty, spreparowany zbiór danych, pominięto zagadnienie preprocessingu danych a wizualizacja części eksperymentalnej nie uwzględnia symulacji krokowej. ocena dobra część teoretyczna uwzględnia krótkie wprowadzenie, próby zapisu formalnego wybranych fragmentów systemu (np. zdefiniowany jest graf, czy też pojedynczy neuron w sieci). Pseudokod jest dokładnie opisany i wyjaśniony. W części praktycznej fragmenty kodu odpowiadające za wybrane elementy systemu są od siebie wyraźnie oddzielone, kod zawiera komentarze. W części eksperymentalnej przeprowadzono prostą symulację krokową.

Wymagania ocena bardzo dobra uwzględnienie wymagań na ocenę dobrą z zapisem formalnym metody, przygotowaniem prostego przykładu (w części teoretycznej). Wykonanie części praktycznej, w której dodatkowo uwzględnione są procedury związane z preprocessingiem: fuzzyfikacją, uzupełnieniem danych niepełnych i dyskretyzacją. Możliwość przeprowadzenia symulacji krokowej. Przedstawienie wybranych wyników w formie wykresów wraz z krótkim komentarzem.

Tematy sieć Kohonena (mapa samoorganizująca się) celem projektu jest opracowanie aplikacji umożliwiającej klasyfikację danych wejściowych. Mechanizm bazuje na uczeniu nienadzorowanym, gdzie początkowy zestaw obiektów opisanych przy pomocy n atrybutów pozwala nauczyć sieć neuronową. Tak przygotowana sieć pozwala klasyfikować kolejne dane przychodzące do systemu w taki sposób, że ich położenie przedstawione jest na płaszczyźnie dwuwymiarowej. Zatem oryginalne obiekty o n atrybutach rzutowane są na płaszczyznę dwuwymiarową. algorytm ID3 celem projektu jest przygotowanie aplikacji umożliwiającej budowę drzewa decyzyjnego (a następnie przetestowanie jego skuteczności jako klasyfikatora) na podstawie algorytmu ID3. Drzewo decyzyjne budowane jest na podstawie atrybutów dających największy przyrost informacji. W celu wyznaczenia kolejnych atrybutów, względem których budowane są kolejne fragmenty drzewa. W każdej iteracji należy wskazać atrybut o najmniejszej entropii. W kolejnej iteracji analizowany jest zbiór pomniejszony o ten atrybut.

Tematy rozmyta sieć kognitywna celem projektu jest przygotowanie aplikacji umożliwiającej (dla zadanego zestawu atrybutów) zbudowanie rozmytej sieci kognitywnej. Dla obiektów opisanych maksymalnie pięcioma atrybutami budowana jest sieć bazująca na grafie pełnym. W przeciwnym wypadku losowo wybierane jest n (n 1) krawędzi pomiędzy wierzchołkami, które uznane będą jako istotne (wskazane przez eksperta). Następnie, na tak zbudowanej sieci kognitywnej na podstawie zestawu danych (po wcześniejszym ewentualnym uzupełnieniu danych niepełnych) należy przeprowadzić proces uczenia adaptacyjnego. Testowanie powinno odbywać się na 10 ostatnich odczytach to znaczy dla zestawu danych zawierających 100 następujących po sobie odczytów uczenie przebiega na 90 pierwszych odczytach. Dla 10 ostatnich odczytów następuje symulacja działania sieci, gdzie wartości pojęć wyznaczane są na podstawie iloczynów pojęć i wag wpływających na te pojęcia. Wreszcie następuje ocena porównanie wartości pojęć uzyskanych na drodze testowania oraz rzeczywistych wartości pojęć z danych.

Tematy klasyfikator k-nn celem projektu jest przygotowanie aplikacji umożliwiającej klasyfikację obiektów opisanych n atrybutami liczbowymi przy pomocy algorytmu k nn dla dowolnego k (w tym dla k = 1). Klasyfikator ma umożliwiać wyznaczenie odległości pomiędzy obiektami na podstawie odległości euklidesowej, manhattan oraz Czebyszewa. Każdy nowy obiekt w systemie klasyfikowany jest na podstawie klasy decyzyjnej przypisanej do jego k najbliższych sąsiadów. algorytm ewolucyjny celem projektu jest przygotowanie aplikacji bazującej na dowolnej wersji algorytmu ewolucyjnego (lub populacyjnego). Populacja ma zawierać n osobników, gdzie każdy osobnik (genotyp osobnika) składa się z dwóch współrzędnych. Funkcja oceny umożliwia wyznaczenie wartości fenotypu osobnika oraz wskazanie rozmieszczenia osobników w przestrzeni. Celem jest wyznaczenie ekstremum funkcji (minimum, lub maksimum). Aplikacja ma działać na trzech dowolnych funkcjach (lub alternatywnie do aplikacji ma zostać dołączony parser umożliwiający wprowadzenie własnej funkcji).