METODY SZTUCZNEJ INTELIGENCJI W PRZEWIDYWANIU WARTOŚCI INDEKSU GIEŁDOWEGO Z WYKORZYSTANIEM ARTYKUŁÓW PRASOWYCH
|
|
- Ludwika Ciesielska
- 9 lat temu
- Przeglądów:
Transkrypt
1 TYTUŁ WYDAWNICTWA ZBIOROWEGO Gdańsk Technologie Informacyjne. Zarządzanie PWNT 2008 ROZDZIAŁ XX METODY SZTUCZNEJ INTELIGENCJI W PRZEWIDYWANIU WARTOŚCI INDEKSU GIEŁDOWEGO Z WYKORZYSTANIEM ARTYKUŁÓW PRASOWYCH Mateusz KOBOS, Jacek MAŃDZIUK 1. Wprowadzenie Zarządzanie wiedzą i informacją w przedsiębiorstwie wymaga łączenia i analizowania danych pochodzących z różnych źródeł. Dąży się do tego, by przeprowadzana analiza danych była wykonywana w miarę możliwości automatycznie. Jednocześnie, wymaga się, by tego typu analiza dawała na tyle wiarygodne wyniki, by można było je wykorzystać do rozwiązywania praktycznych problemów. Przykładem systemów, które starają się realizować powyższe wymagania, są automatyczne systemy przewidujące wartości indeksu giełdowego. Część z tych systemów korzysta z dwóch podstawowych źródeł informacji: numerycznego szeregu czasowego notowań akcji lub indeksu giełdowego oraz danych tekstowych, na które składają się artykuły opublikowane w specjalistycznej prasie. Tego typu systemy predykcyjne, wywodzące się z dziedziny sztucznej inteligencji, zostały omówione w niniejszym rozdziale. W podrozdziale 2 omówiono różne rodzaje systemów predykcyjnych i ich działanie. Następnie, w podrozdziale 3 zaprezentowano wyniki wstępnych badań. Natomiast w podrozdziale 4 zostało przedstawione podsumowanie całego rozdziału. 2. Działanie systemu predykcyjnego Ogólny schemat systemu predykcyjnego korzystającego zarówno z notowań akcji lub indeksu giełdowego jak i artykułów prasowych jest przedstawiony poniżej. Sercem systemu jest algorytm predykcyjny (aproksymator lub klasyfikator) a danymi wejściowymi algorytmu są artykuły prasowe i szereg czasowy notowań. Przed użyciem w systemie, dane te są poddawane wstępnej obróbce (ang. preprocessing) polegającej np. na zamianie szeregu notowań na szereg zwrotów - względnych różnic, usunięciu błędnych czy uzupełnieniu brakujących danych. Dane tekstowe są zamieniane na reprezentację numeryczną, która może Politechnika Warszawska, Wydział Matematyki i Nauk Informacyjnych, M.Kobos@mini.pw.edu.pl, J.Mandziuk@mini.pw.edu.pl
2 2 M. Kobos, J. Mańdziuk być użyta bezpośrednio przez algorytm predykcyjny. Wynikiem działania algorytmu predykcyjnego jest przewidywana wartość akcji/indeksu w przypadku aproksymatora lub kategoria przewidywanej wartości (wzrost, spadek, brak zmiany notowanych aktywó w przypadku klasyfikatora. Taka prognoza może być w dalszej kolejności wykorzystana przez algorytm inwestycyjny wspomagający inwestora lub dokonujący samodzielnie inwestycji na rynku Rodzaje algorytmów predykcyjnych W literaturze występuje wiele rodzajów algorytmów predykcyjnych. Można je zgrubnie podzielić na dwie następujące klasy: 1. algorytmy wykorzystujące metody sztucznej inteligencji, 2. algorytmy oparte na modelach matematycznych. Do najczęściej stosowanych metod sztucznej inteligencji należą: sieci neuronowe (np. perceptron wielowarstwowy, sieć probabilistyczna) [6, 4], Support Vector Machines [7, 8], algorytmy genetyczne [11], drzewa decyzyjne, reguły decyzyjne [9], naiwne modele Bayes a [3], k-nearest Neighbours [8]. Wśród metod należących do drugiej grupy szczególnie popularne są modele przewidywania wartości szeregów czasowych wywodzące się z modeli ARIMA i GARCH [2] oraz Linear Discriminant Analysis [1] Dane wejściowe Jak wspomnieliśmy w części wprowadzającej, dane wejściowe wykorzystywane przez algorytm predykcyjny są dwojakiego rodzaju: 1. dane tekstowe, 2. szeregi czasowe. Najczęściej stosowane dane tekstowe pochodzą z popularnych czasopism finansowych ( The Wall Street Journal, Financial Times ), komunikatów prasowych firm oraz komunikatów prasowych pochodzących z agencji informacyjnych np. Dow Jones Newswire, Reuters czy Bloomberg. Do najpopularniejszych szeregów czasowych należą notowania akcji spółek, notowania indeksów giełdowych, kursy wymiany walut, zwroty z obligacji korporacyjnych Numeryczne reprezentacje tekstu Numeryczne reprezentacje tekstu, za pomocą których są przedstawiane artykuły prasowe, można podzielić na dwie grupy: 1. reprezentacje generowane automatycznie, 2. reprezentacje korzystające z wiedzy a priori. Wśród reprezentacji generowanych automatycznie najpopularniejsza jest reprezentacja bagof-words zwana też vector space. W reprezentacji tej każdemu dokumentowi odpowiada wektor numeryczny. Każda ze współrzędnych wektora odpowiada jednemu słowu występującemu w zbiorze wszystkich dokumentów. Wartość, jaką przyjmuje współrzędna wektora, wskazuje jak ważne jest dane słowo w dokumencie odpowiadającym wektorowi. Mimo swej prostoty, reprezentacja bag-of-words dobrze sprawdza się w praktyce. Reprezentacja ta zostanie dokładniej przedstawiona w dalszej części rozdziału. Wśród reprezentacji korzystających z wiedzy a priori można rozróżnić następujące podejścia: analiza artykułu przez człowieka i zastosowanie predefiniowanych reguł eksperckich dotyczących treści artykułu [6], tworzenie wektora słów kluczowych używanych w reprezentacji bag-of-words z predefiniowanych słów kluczowych [9, 8], wykorzystanie
3 5. Metody sztucznej inteligencji w przewidywaniu wartości indeksu giełdowego 3 wiedzy eksperckiej zapisanej za pomocą tzw. cognitive map [4], rozpoznawanie za pomocą wyrażeń regularnych przynależności do jednej z predefiniowanych kategorii [11] Reprezentacja tekstu typu bag-of-words Poniżej przedstawimy reprezentację tekstu typu bag-of-words, którą zastosowaliśmy w przeprowadzonych eksperymentach wstępnych. Przez a ( D, będziemy oznaczali wartość, jaką przyjmuje współrzędna wektora odpowiadająca słowu w w dokumencie D, przez T będziemy oznaczali zbiór uczący dokumentów, który służy do nauki algorytmu predykcyjnego, czyli do dobrania parametrów algorytmu. Do najpopularniejszych reprezentacji typu bag-of-words można zaliczyć: 1 w D reprezentację binarną: a( D,, 0 w D reprezentację TF: a( D, TF( D,, reprezentację TF-IDF: a( D, TF( D, IDF ( T,, w których TF ( D, - częstość występowania słowa w w dokumencie D, T IDF ( T, log( ) - logarytm z odwrotności częstości występowania dokumentów T w zawierających słowo w wśród dokumentów ze zbioru T, T w - zbiór dokumentów zawierających słowo w (podzbiór T ). Słowo, któremu przypisana jest duża wartość współrzędnej wektora odpowiadającego dokumentowi, można interpretować jako słowo istotne. Natomiast słowo, któremu jest przypisana wartość bliska zeru, można interpretować jako nieistotne. Przy tej interpretacji, reprezentacja TF wskazuje jako ważne te słowa, które często występują w dokumencie. Z kolei reprezentacja TF-IDF jako ważne wskazuje te słowa, które często występują w danym dokumencie, ale jednocześnie rzadko występują w innych dokumentach Słownik w reprezentacji tekstu typu bag-of-words Zbiór słów, którym odpowiadają współrzędne wektorów w reprezentacji bag-of-words, nazywamy słownikiem. Początkowo słownik składa się ze wszystkich słów występujących we wszystkich dokumentach. W trakcie wstępnej obróbki danych część z tych słów jest usuwana. Do usuwania słów uznanych za zbędne stosuje się najczęściej poniższe metody redukcji rozmiaru słownika. Metody związane z cechami lingwistycznymi słów: o odrzucenie stop words (przyimki, zaimki, spójniki), o utożsamienie synonimów, o stemming utożsamienie pokrewnych słowotwórczo słów i sprowadzenie ich do jednego rdzenia. Metody związane z cechami całego zbioru dokumentów: o odrzucenie najrzadziej lub najczęściej występujących słów, o odrzucenie słów występujących w podobnej liczbie w każdej z predefiniowanych klas dokumentów (słowa o dużej entropii informacji), o odrzucenie słów o najmniejszym współczynniku CTF-IDF, który dla danego count( słowa w jest określony za pomocą wzoru: CTF IDF (, gdzie T w
4 4 M. Kobos, J. Mańdziuk 3. Wyniki badań count ( w ) jest liczbą wystąpień słowa w we wszystkich dokumentach. Można zauważyć, że jako słowa istotne (którym odpowiada wysoki współczynnik CTF-IDF) są oznaczane te, które występują często, ale w małej liczbie dokumentów. W niniejszej części zostały opisane wyniki wstępnych eksperymentów przeprowadzonych przez autorów. Badania miały na celu sprawdzenie możliwości przewidywania wartości indeksu giełdowego na podstawie szeregu czasowego notowań wybranego indeksu giełdowego oraz artykułów prasowych Dane wejściowe W badaniach zostały wykorzystane streszczenia artykułów prasowych z przedziału czasowego: oraz szereg czasowy zwrotów z notowań indeksu z tego samego przedziału czasowego. W badaniach wykorzystano łącznie artykuły z czasopisma The Wall Street Journal. Artykuły zostały udostępnione przez wydawcę The Wall Street Journal i dystrybutora czasopisma firmę ProQuest. Podstawowe wskaźniki statystyczne opisujące rozkład liczby dziennie publikowanych artykułów są następujące: minimum = 1; maksimum = 180, średnia = 104; standardowe odchylenie = 48. W badanym przedziale czasowym występuje 5 dni, z którymi związana jest mała (mniejsza niż 6) liczba opublikowanych artykułów (anomalia ta jest obecna w oryginalnym źródle danych). Szereg czasowy zwrotów opisuje zwroty z notowań indeksu S&P500. Dane pochodzą z serwisu Podstawowe wskaźniki statystyczne opisujące rozkład zwrotów są następujące: minimum = -0,038; maksimum = 0,022; średnia = 0; odchylenie standardowe = 0, Algorytm predykcyjny i reprezentacja tekstu Jako algorytm predykcyjny została zastosowana sieć neuronowa typu perceptron wielowarstwowy z zaimplementowanym algorytmem uczenia RProp. Sieć posiadała jedną warstwę ukrytą zawierającą liczbę neuronów równą połowie liczby neuronów znajdujących się w warstwie wejściowej, natomiast w warstwie wyjściowej znajdował się jeden neuron. W trakcie uczenia wykorzystano technikę early stopping, w której zbiór walidacyjny stanowiło 20% losowo wybranych wektorów ze zbioru uczącego. Do reprezentacji tekstu wybrano metodę TF-IDF. Ze słownika wyrzucono stop words i zastosowano algorytm Porter a [10] do wykonania stemming-u. W celu dalszej redukcji rozmiaru słownika, zastosowano metodę polegającą na odrzuceniu słów o małym współczynniku CTF-IDF. Szereg czasowy podzielono w 70% jego długości na dwie części. Pierwsza z nich służyła do nauki algorytmu predykcyjnego, a druga wyłącznie do testowania algorytmu i obliczania błędu predykcji Opis badań W trakcie eksperymentów sprawdzono m.in. zależność między długością pamięci algorytmu predykcyjnego a błędem przewidywania. Przez długość pamięci rozumiemy tu liczbę poprzednich dni, z których udostępniane są algorytmowi predykcyjnemu wcześniej
5 5. Metody sztucznej inteligencji w przewidywaniu wartości indeksu giełdowego 5 wspomniane dane (tekstowe i numeryczne) mające pomóc w przewidzeniu zwrotu ceny akcji z kolejnego dnia. Eksperymenty przeprowadzono dla słowników o różnych rozmiarach. Wyniki porównano z prostą regułą przewidującą, która mówi, że jutrzejsza wartość indeksu będzie taka sama jak dzisiejsza, a więc zwrot będzie zawsze równy zero. Należy zauważyć, że jest to dość silna heurystyka wynikająca z modelu błądzenia losowego (ang. random walk model) związanego z hipotezą rynku efektywnego. Reguła ta jest często stosowana do sprawdzania efektywności przewidywania finansowych szeregów czasowych. Jako miarę błędu przewidywania wykorzystano pierwiastek z błędu średniokwadratowego (RMSE). Rys Zależność między długością pamięci a błędem przewidywania zwrotu z notowania indeksu dzień naprzód. Ciągła linia odpowiada regule mówiącej, że jutrzejsza wartość indeksu będzie taka sama jak dzisiejsza Analiza otrzymanych wyników i możliwe rozszerzenia systemu Na podstawie przeprowadzonych badań otrzymano następujące wnioski. Algorytm predykcyjny osiąga gorsze wyniki, niż heurystyka zakładająca utrzymanie wartości w kolejnym dniu, a wraz z długością pamięci błąd przewidywania rośnie. Główną przyczyną uzyskania niezadowalających wyników jest najprawdopodobniej problem z dobraniem odpowiednich słów do słownika. Zastosowany współczynnik CTF-IDF w przypadku użytych danych sprawia, że do słownika wybierane są głównie słowa mało znaczące ale popularne, które występują we wszystkich dokumentach. Powoduje to, że po zastosowaniu reprezentacji TF-IDF, większość wektorów odpowiadających dokumentom jest zerowa, a w rezultacie, zgodnie z tą reprezentacją, nie ma znaczenia. Przykładem tego typu mało znaczących słów mogą być słowa, które znalazły się w słowniku o rozmiarze 10: in, on, Mr, sai, he, lear, compani, U.S, hi, Nuv. Aby rozwiązać ten problem,
6 6 M. Kobos, J. Mańdziuk planowane są prace nad doborem bardziej adekwatnego współczynnika mierzącego ważność słowa wśród wszystkich dokumentów. Do poprawy wyników może przyczynić się również lepsza wstępna obróbka słów, dzięki której do słownika nie trafią słowa typu: in, on, he. Przyczyną niskiej jakości przewidywania może być też zbyt prosta reprezentacja tekstu. W związku z tym, planuje się badać występowanie całych predefiniowanych zwrotów zamiast pojedynczych słów. Występowanie zwrotów mierzone byłoby w sposób przybliżony, tzn. uznawalibyśmy, że dany zwrot występuje w dokumencie jeśli np. dwa słowa tworzące zwrot występowałyby odpowiednio blisko siebie w tekście. Kolejną przyczyną niepowodzenia jest najprawdopodobniej nieuwzględnienie wydźwięku danego artykułu. Wydaje się, że uwzględnienie informacji o tym czy artykuł ma zabarwienie pozytywne, negatywne czy też jest neutralny mogłaby znacznie zwiększyć skuteczność rozważanego systemu. W związku z tym, planowana jest automatyczna klasyfikacja dokumentu według jego wydźwięku. Aby osiągnąć ten cel, zostanie podjęta próba wyszukiwania w dokumencie wcześniej zdefiniowanych zwrotów świadczących o pozytywnej lub negatywnej opinii zawartej w artykule. Przykładowymi zwrotami tego typu mogą być: investors are anxious, markets values decrease, financial problems, good financial results, bull market, itp. Na polepszenie wyników przewidywania może mieć również wpływ uwzględnienie innych niż streszczenie części artykułów. Planuje się sprawdzenie wydajności przewidywania przy użyciu tytułu i pierwszego akapitu tekstu artykułu. Te części artykułu często zawierają podsumowanie całej publikacji, a więc są szczególnie istotne dla zadania rozumienia zawartości tekstu. W celu polepszenia wyników zostaną również przypisane większe wagi (odpowiadające większej istotności) słowom występującym w tytule niż słowom znajdującym się w streszczeniu i pierwszym akapicie tekstu artykułu. Ponadto planuje się przewidywanie cen akcji danej firmy lub firm pochodzących z określonego segmentu rynku na podstawie artykułów związanych z daną firmą lub firmami z danego segmentu rynku. Wyniki przewidywania dla tego wariantu mogą być potencjalnie lepsze od wyników przewidywania wartości indeksu ze względu na prawdopodobnie większy związek między artykułem na temat danej firmy a ceną akcji firmy. W przypadku przewidywania cen akcji firmy, pozytywny wpływ na jakość predykcji może mieć też uwzględnienie tematyki danego artykułu np. artykuł opisujący sprawozdanie finansowe firmy może mieć większy wpływ na ceny akcji od opisu nowowprowadzonego na rynek produktu tej firmy. Można tu wykorzystać predefiniowaną klasyfikację tematyczną wprowadzoną przez dystrybutora czasopisma lub wyszukiwać w artykule słów kluczowych związanych z daną tematyką. Zbliżone rozwiązanie przy analizie tematycznej artykułów naukowych było wykorzystane w pracy [5]. Ciekawe i warte sprawdzenia wydaje się również porównanie wyników otrzymanych przy użyciu słownika generowanego automatycznie z wynikami otrzymanymi przy użyciu słownika przygotowanego przez człowieka, który zawierałby słowa lub zwroty uznane jako ważne dla oceny znaczenia dokumentu. W przypadku przewidywania zwrotów z akcji firm danej branży można by zastosować słownik słów związanych z daną branżą, np. dla branży komputerowej istotnymi zwrotami mogą być: security flaw, bug, hacker attack i inne. 4. Podsumowanie W niniejszym rozdziale przedstawiono sposób budowy i działania systemów służących do automatycznego przewidywania notowań akcji czy indeksów giełdowych. Przedstawiono popularne rodzaje reprezentacji tekstu typu bag-of-words. Zaprezentowano wyniki wstępnych eksperymentów z tej dziedziny oraz zaproponowano dalsze ścieżki rozwoju przedstawionego systemu.
7 5. Podziękowania 5. Metody sztucznej inteligencji w przewidywaniu wartości indeksu giełdowego 7 Autorzy dziękują firmie ProQuest i wydawcy The Wall Street Journal za udostępnienie danych tekstowych wykorzystanych podczas wstępnych eksperymentów. Bibliografia [1] Aasheim C., Kohler G.J.: Scanning World Wide Web documents with the vector space model, Decision Support Systems, vol. 42, issue 2, pp , [2] Edmonds R.G., Kutan A.M.: Is public information really irrelevant in explaining asset returns?, Economics Letters, vol. 76, issue 2, pp , [3] Gidófalvi G., Elkan. C.: Using News Articles to Predict Stock Price Movements, (Technical Report). Department of Computer Science and Engineering, University of California, San Diego (USA), [4] Hong T., Han I.: Knowledge-based data mining of news information on the Internet using cognitive maps and neural networks, Expert systems with applications, vol. 23, pp. 1-8, [5] Klincewicz K., Miyazaki K.: Software Sectoral Systems of Innovation in Asia. Empirical Analysis of Industry-Academia Relations. Proceeding of the IEEE International Conference on Management of Innovation and Technology, Singapore, 2006, vol. 1, pp , IEEE, Singapore (China), 2006 [6] Kohara K., Ishikawa T., Fukuhara Y., Nakamura Y.: Stock price prediction using prior knowledge and Neural Networks, Intelligent systems in accounting, finance and management, vol. 6, pp , [7] Mittermayer M.-A.: Forecasting Intraday Stock Price Trends with Text Mining Techniques, Proceedings of the 37th Hawaii International Conference on System Sciences (HICSS'04), Hawaii, vol. 3, IEEE Computer Society, Washington, DC (USA), [8] Mittermayer M.-A., Knolmayer G.F.: NewsCATS: A News Categorization And Trading System, Proceedings of the Sixth International Conference on Data Mining (ICDM'06), Hong Kong (China), pp , IEEE Computer Society, Washington, DC (USA), [9] Peramunetilleke D., Wong R.K.: Currency Exchange Rate Forecasting from News Headlines, Proceedings of the 13th Australasian database conference (ADC2002), Melbourne, vol. 5, pp , Australian Computer Society, Melbourne (Australia), [10] Porter M.F.: An algorithm for suffix stripping, Program, vol. 14(3), pp , [11] Thomas D.: News and Trading Rules (Ph.D. thesis). Carnegie Mellon University, [12] Wuthrich B., Cho V., Leung S., Permunetilleke D., Sankaran K., Zhang J., Lam W., Daily Stock Market Forecast from Textual Web Data, Systems, Man, and Cybernetics, IEEE International Conference on, San Diego, CA, (USA), vol. 3, pp , {Odrębna strona streszczeń i adresów} Metody sztucznej inteligencji w przewidywaniu wartości indeksu giełdowego z wykorzystaniem artykułów prasowych M. Kobos*, J. Mańdziuk**
8 8 M. Kobos, J. Mańdziuk *Politechnika Warszawska, Wydział Matematyki i Nauk Informacyjnych, M.Kobos@mini.pw.edu.pl ** Politechnika Warszawska, Wydział Matematyki i Nauk Informacyjnych, J.Mandziuk@mini.pw.edu.pl Rozdział 5. Metody sztucznej inteligencji w przewidywaniu wartości indeksu giełdowego z wykorzystaniem artykułów prasowych. Analiza danych jest ważną częścią zarządzania informacją i wiedzą w przedsiębiorstwie. W niniejszym rozdziale przedstawiamy przegląd literaturowy automatycznych systemów wywodzących się z dziedziny sztucznej inteligencji służących do przewidywania wartości indeksu giełdowego przy wykorzystaniu numerycznych szeregów czasowych oraz artykułów prasowych. Zaprezentowane zostało również wstępne podejście do problemu implementacji tego typu systemu. Artificial Intelligence methods in prediction of stock index values with usage of newspaper articles M. Kobos*, J. Mańdziuk** *Warsaw University of Technology, Faculty of Mathematics and Information Science, M.Kobos@mini.pw.edu.pl **Warsaw University of Technology, Faculty of Mathematics and Information Science, J.Mandziuk@mini.pw.edu.pl Chapter 5. Artificial Intelligence methods in prediction of stock index values with usage of newspaper articles. Analysis of various kinds of data is an important part of information and knowledge management in a company. This chapter contains an overview of literature concerning Artificial Intelligence automatic prediction systems applied to prediction of stock index values with usage of numerical time series and newspaper articles. Moreover, an initial approach to implementation of such a system is proposed.
Przewidywanie cen akcji z wykorzystaniem artykułów prasowych
1/36 Przewidywanie cen akcji z wykorzystaniem artykułów prasowych Mateusz Kobos, 21.03.2007 Seminarium Metody Inteligencji Obliczeniowej Spis treści Przewidywanie cen akcji a Hipoteza Rynku Efektywnego
Przewidywanie cen akcji z wykorzystaniem artykułów prasowych
Przewidywanie cen akcji z wykorzystaniem artykułów prasowych Mateusz Kobos, 05.12.2007 Seminarium Metody Inteligencji Obliczeniowej 1/25 Spis treści Ogólna budowa programu Pobieranie danych Budowa bazy
Analiza zależności między notowaniami akcji firm a artykułami prasowymi
Analiza zależności między notowaniami akcji firm a artykułami prasowymi Mateusz Kobos, 23.04.2008 Seminarium Metody Inteligencji Obliczeniowej 1/29 Spis treści Słowa najczęściej występujące wokół ekstremalnych
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej Adam Żychowski Definicja problemu Każdy z obiektów może należeć do więcej niż jednej kategorii. Alternatywna definicja Zastosowania
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
Podstawy Sztucznej Inteligencji (PSZT)
Podstawy Sztucznej Inteligencji (PSZT) Paweł Wawrzyński Uczenie maszynowe Sztuczne sieci neuronowe Plan na dziś Uczenie maszynowe Problem aproksymacji funkcji Sieci neuronowe PSZT, zima 2013, wykład 12
Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań
Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)
Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego
IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,
Elementy inteligencji obliczeniowej
Elementy inteligencji obliczeniowej Paweł Liskowski Institute of Computing Science, Poznań University of Technology 9 October 2018 1 / 19 Perceptron Perceptron (Rosenblatt, 1957) to najprostsza forma sztucznego
WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH W PROGNOZOWANIU
WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH W PROGNOZOWANIU THE USE OF ARTIFICIAL NEURAL NETWORKS IN FORECASTING Konrad BAJDA, Sebastian PIRÓG Resume Artykuł opisuje wykorzystanie sztucznych sieci neuronowych
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH
InŜynieria Rolnicza 14/2005 Sławomir Francik Katedra InŜynierii Mechanicznej i Agrofizyki Akademia Rolnicza w Krakowie PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH Streszczenie W
Projekt Sieci neuronowe
Projekt Sieci neuronowe Chmielecka Katarzyna Gr. 9 IiE 1. Problem i dane Sieć neuronowa miała za zadanie nauczyć się klasyfikować wnioski kredytowe. W projekcie wykorzystano dane pochodzące z 110 wniosków
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Prof. Stanisław Jankowski
Prof. Stanisław Jankowski Zakład Sztucznej Inteligencji Zespół Statystycznych Systemów Uczących się p. 228 sjank@ise.pw.edu.pl Zakres badań: Sztuczne sieci neuronowe Maszyny wektorów nośnych SVM Maszyny
Event-driven trading. Reaktywność rynku i potencjał inwestycyjny zjawiska
Working paper 1/2014 Event-driven trading. Reaktywność rynku i potencjał inwestycyjny zjawiska autorzy: Dawid Tarłowski Patryk Pagacz Sławomir Śmiarowski INIME Instytut nauk informatycznych i matematycznych
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów Łukasz Piątek, Jerzy W. Grzymała-Busse Katedra Systemów Ekspertowych i Sztucznej Inteligencji, Wydział Informatyki
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
Sztuczna Inteligencja Tematy projektów Sieci Neuronowe
PB, 2009 2010 Sztuczna Inteligencja Tematy projektów Sieci Neuronowe Projekt 1 Stwórz projekt implementujący jednokierunkową sztuczną neuronową złożoną z neuronów typu sigmoidalnego z algorytmem uczenia
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Testowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
DRZEWA REGRESYJNE I LASY LOSOWE JAKO
DRZEWA REGRESYJNE I LASY LOSOWE JAKO NARZĘDZIA PREDYKCJI SZEREGÓW CZASOWYCH Z WAHANIAMI SEZONOWYMI Grzegorz Dudek Instytut Informatyki Wydział Elektryczny Politechnika Częstochowska www.gdudek.el.pcz.pl
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
ALGORYTMY SZTUCZNEJ INTELIGENCJI
ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.
PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"
PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
PLAN STUDIÓW Wydział Elektroniki, Telekomunikacji i Informatyki, Wydział Zarządzania i Ekonomii Inżynieria danych
WYDZIAŁ: KIERUNEK: poziom kształcenia: profil: forma studiów: Lp. O/F kod modułu/ przedmiotu* SEMESTR 1 1 O PG_00045356 Business law 2 O PG_00045290 Basics of computer programming 3 O PG_00045352 Linear
MATLAB Neural Network Toolbox przegląd
MATLAB Neural Network Toolbox przegląd WYKŁAD Piotr Ciskowski Neural Network Toolbox: Neural Network Toolbox - zastosowania: przykłady zastosowań sieci neuronowych: The 1988 DARPA Neural Network Study
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
Sieci neuronowe i algorytmy uczenia Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.
Sieci neuronowe i algorytmy uczenia Czyli co i jak 2016 andrzej.rusiecki@pwr.edu.pl andrzej.rusiecki.staff.iiar.pwr.wroc.pl s. 230/C-3 O co chodzi? Celem przedmiotu jest ogólne zapoznanie się z podstawowymi
Systemy uczące się wykład 1
Systemy uczące się wykład 1 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 5 X 2018 e-mail: przemyslaw.juszczuk@ue.katowice.pl Konsultacje: na stronie katedry + na stronie domowej
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74
3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące
IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ
IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ Celem ćwiczenia jest zapoznanie się ze sposobem działania sieci neuronowych typu MLP (multi-layer perceptron) uczonych nadzorowaną (z nauczycielem,
WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW
Uniwersytet Ekonomiczny we Wrocławiu WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Wprowadzenie Wrażliwość wyników analizy wielokryterialnej na zmiany wag kryteriów, przy
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych Mateusz Kobos, 07.04.2010 Seminarium Metody Inteligencji Obliczeniowej Spis treści Opis algorytmu i zbioru
KLASYFIKACJA. Słownik języka polskiego
KLASYFIKACJA KLASYFIKACJA Słownik języka polskiego Klasyfikacja systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady Klasyfikacja polega na przyporządkowaniu
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Zyskowność i statystyczna istotność reguł analizy technicznej
Katarzyna Sagan nr albumu: 240006 Robert Chyliński nr albumu: 239779 Zyskowność i statystyczna istotność reguł analizy technicznej White's Reality Check Praca zaliczeniowa wykonana w ramach przedmiotu:
mgr inż. Mariusza Podsiadło temat: Forecasting Financial Time Series Movements with Rough Sets and Fuzzy Rough Sets
Politechnika Warszawska Wydział Elektroniki i Technik Informacyjnych Warszawa, 3 stycznia 2017 r. D z i e k a n a t Uprzejmie informuję, że na Wydziale Elektroniki i Technik Informacyjnych Politechniki
Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed
Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Zakres pracy Przegląd stanu wiedzy w dziedzinie biometrii, ze szczególnym naciskiem
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Dokumentacja Końcowa
Metody Sztucznej Inteligencji 2 Projekt Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych. Dokumentacja Końcowa Autorzy: Robert Wojciechowski Michał Denkiewicz Wstęp Celem
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Dyskretyzacja - definicja Dyskretyzacja - zamiana atrybutów
Sieci neuronowe - dokumentacja projektu
Sieci neuronowe - dokumentacja projektu Predykcja finansowa, modelowanie wskaźnika kursu spółki KGHM. Piotr Jakubas Artur Kosztyła Marcin Krzych Kraków 2009 1. Sieci neuronowe - dokumentacja projektu...
Deep Learning na przykładzie Deep Belief Networks
Deep Learning na przykładzie Deep Belief Networks Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział Matematyki i Nauk Informacyjnych PW 20 V 2014 Jan Karwowski (MiNI) Deep Learning
mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.
mgr inż. Magdalena Deckert Poznań, 30.11.2010r. Metody przyrostowego uczenia się ze strumieni danych. Plan prezentacji Wstęp Concept drift i typy zmian Algorytmy przyrostowego uczenia się ze strumieni
Uczenie sieci typu MLP
Uczenie sieci typu MLP Przypomnienie budowa sieci typu MLP Przypomnienie budowy neuronu Neuron ze skokową funkcją aktywacji jest zły!!! Powszechnie stosuje -> modele z sigmoidalną funkcją aktywacji - współczynnik
Wprowadzenie do teorii systemów ekspertowych
Myślące komputery przyszłość czy utopia? Wprowadzenie do teorii systemów ekspertowych Roman Simiński siminski@us.edu.pl Wizja inteligentnych maszyn jest od wielu lat obecna w literaturze oraz filmach z
Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów
Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych, moduł kierunkowy oólny Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Mechatronika Rodzaj przedmiotu: obowiązkowy Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1. Zapoznanie studentów z inteligentnymi
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych sieci neuronowych 4
Wojciech Sikora 1 AGH w Krakowie Grzegorz Wiązania 2 AGH w Krakowie Maksymilian Smolnik 3 AGH w Krakowie Analiza możliwości szacowania parametrów mieszanin rozkładów prawdopodobieństwa za pomocą sztucznych
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Systemy uczące się wykład 2
Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania
ANALIZA JAKOŚCI PREDYKCJI STANU EKONOMICZNO- FINANSOWEGO MAŁYCH I ŚREDNICH PRZEDSIĘBIORSTW PRZY POMOCY ZESPOŁÓW SZTUCZNYCH SIECI NEURONOWYCH
BAROMETR REGIONALNY 109 ANALIZA JAKOŚCI PREDYKCJI STANU EKONOMICZNO FINANSOWEGO MAŁYCH I ŚREDNICH PRZEDSIĘBIORSTW PRZY POMOCY ZESPOŁÓW SZTUCZNYCH SIECI NEURONOWYCH Jednym z ważniejszych aspektów analizy
Turystyka i rekreacja
Wydział Zarządzania Nazwa programu (kierunku) Turystyka i rekreacja Poziom i forma studiów studia I stopnia stacjonarne Specjalność: Ścieżka dyplomowania: Nazwa przedmiotu: Zarządzanie informacją w turystyce
Wprowadzenie do uczenia maszynowego
Wprowadzenie do uczenia maszynowego Agnieszka Ławrynowicz 12 stycznia 2017 Co to jest uczenie maszynowe? dziedzina nauki, która zajmuje się sprawianiem aby komputery mogły uczyć się bez ich zaprogramowania
Systemy uczące się Lab 4
Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego
Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change
Raport 4/2015 Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych
Metody klasyfikacji danych - część 1 p.1/24
Metody klasyfikacji danych - część 1 Inteligentne Usługi Informacyjne Jerzy Dembski Metody klasyfikacji danych - część 1 p.1/24 Plan wykładu - Zadanie klasyfikacji danych - Przeglad problemów klasyfikacji
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta www.michalbereta.pl Sieci radialne zawsze posiadają jedną warstwę ukrytą, która składa się z neuronów radialnych. Warstwa wyjściowa składa
Metody Sztucznej Inteligencji II
17 marca 2013 Neuron biologiczny Neuron Jest podstawowym budulcem układu nerwowego. Jest komórką, która jest w stanie odbierać i przekazywać sygnały elektryczne. Neuron działanie Jeżeli wartość sygnału
1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda
Sieci neuropodobne 1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN Agenda Trochę neurobiologii System nerwowy w organizmach żywych tworzą trzy
Metody klasyfikacji i rozpoznawania wzorców. Najważniejsze rodzaje klasyfikatorów
Metody klasyfikacji i rozpoznawania wzorców www.michalbereta.pl Najważniejsze rodzaje klasyfikatorów Dla określonego problemu klasyfikacyjnego (tzn. dla danego zestawu danych) należy przetestować jak najwięcej
ZASTOSOWANIE AUTORSKIEJ METODY WYZNACZANIA WARTOŚCI PARAMETRÓW NOWOCZESNYCH SYSTEMÓW TECHNICZNYCH DO PŁUGÓW I OPRYSKIWACZY POLOWYCH
Inżynieria Rolnicza 9(118)/2009 ZASTOSOWANIE AUTORSKIEJ METODY WYZNACZANIA WARTOŚCI PARAMETRÓW NOWOCZESNYCH SYSTEMÓW TECHNICZNYCH DO PŁUGÓW I OPRYSKIWACZY POLOWYCH Sławomir Francik Katedra Inżynierii Mechanicznej
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
2. Empiryczna wersja klasyfikatora bayesowskiego
Algorytmy rozpoznawania obrazów 2. Empiryczna wersja klasyfikatora bayesowskiego dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Brak pełnej informacji probabilistycznej Klasyfikator bayesowski
Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,
Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne) Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski Klasyfikacja i predykcja. Odkrywaniem reguł klasyfikacji nazywamy proces znajdowania
SPOTKANIE 2: Wprowadzenie cz. I
Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba Cel zadania Celem zadania jest implementacja klasyfikatorów
UCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji
UCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji Filip Wójcik Wydział Zarządzania, Informatyki i Finansów Instytut Informatyki Ekonomicznej
Streszczenie. Słowa kluczowe: modele neuronowe, parametry ciągników rolniczych
InŜynieria Rolnicza 11/2006 Sławomir Francik Katedra InŜynierii Mechanicznej i Agrofizyki Akademia Rolnicza w Krakowie METODA PROGNOZOWANIA WARTOŚCI PARAMETRÓW TECHNICZNYCH NOWOCZESNYCH MASZYN ROLNICZYCH
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych Mateusz Kobos, 25.11.2009 Seminarium Metody Inteligencji Obliczeniowej 1/25 Spis treści Dolne ograniczenie na wsp.
kierunkowy (podstawowy / kierunkowy / inny HES) nieobowiązkowy (obowiązkowy / nieobowiązkowy) polski drugi semestr letni (semestr zimowy / letni)
Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Algorytmy wspomagania decyzji Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s. 230/C-3
Algorytmy wspomagania decyzji Czyli co i jak 2018 andrzej.rusiecki@pwr.edu.pl andrzej.rusiecki.staff.iiar.pwr.wroc.pl s. 230/C-3 O co chodzi? Celem przedmiotu jest ogólne zapoznanie się z podstawowymi
Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j
Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy
ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)
Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu ID1SII4 Nazwa modułu Systemy inteligentne 1 Nazwa modułu w języku angielskim Intelligent
Rozpoznawanie obrazów
Rozpoznawanie obrazów Laboratorium Python Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba, J. Kaczmar Cel zadania Celem zadania jest implementacja klasyfikatorów
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki
Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych);
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
Zadania laboratoryjne i projektowe - wersja β
Zadania laboratoryjne i projektowe - wersja β 1 Laboratorium Dwa problemy do wyboru (jeden do realizacji). 1. Water Jug Problem, 2. Wieże Hanoi. Water Jug Problem Ograniczenia dla każdej z wersji: pojemniki
W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.
5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń
10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
Zastosowania sieci neuronowych
Zastosowania sieci neuronowych klasyfikacja LABORKA Piotr Ciskowski zadanie 1. klasyfikacja zwierząt sieć jednowarstwowa żródło: Tadeusiewicz. Odkrywanie własności sieci neuronowych, str. 159 Przykład