Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki i Finansów. Krzysztof Drelczuk. Praca magisterska

Wielkość: px
Rozpocząć pokaz od strony:

Download "Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki i Finansów. Krzysztof Drelczuk. Praca magisterska"

Transkrypt

1 Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki i Finansów Krzysztof Drelczuk Wyszukiwanie wzorców kupna-sprzedaży w finansowych szeregach czasowych za pomocą teorii falek i gazów neuronowych Praca magisterska Katedra Teorii Informatyki Promotor: prof. dr hab. Jerzy Korczak Wrocław 2008

2 2 Wrocław University of Economics, Faculty of Management, Informatics and Finance Krzysztof Drelczuk Discovering buy-sell patterns in financial time series using wavelet theory and neural gas algorithm Master thesis Department of Computer Science Supervisor: prof. dr hab. Jerzy Korczak Wrocław 2008

3 3 Oświadczam, że pracę niniejszą przygotowałem samodzielnie. Wszystkie dane, istotne myśli i sformułowania pochodzące z literatury (przytoczone dosłownie lub niedosłownie) są opatrzone odpowiednimi odsyłaczami. Praca ta nie była w całości ani w części, która zawierałaby znaczne fragmenty przedstawione w pracy jako oryginalne (wyniki badań empirycznych, obliczenia, spostrzeżenia, oceny, wnioski, propozycje itp.), przez nikogo przedłożona do żadnej oceny i nie była publikowana. Krzysztof Drelczuk

4 4 PODZIĘKOWANIA Na pierwszych stronach mojej pracy magisterskiej chciałbym bardzo podziękować mojemu promotorowi prof. dr hab. Jerzemu Korczakowi za czas mi poświęcony oraz za bardzo cenne wskazówki, bez których praca ta w takiej formie nigdy by nie powstała. Przede wszystkim jednak jestem wdzięczny za słowa zachęty, wspieranie moich pomysłów oraz za bardzo dużą swobodę pozostawioną mi przy tworzeniu niniejszej pracy. Dziękuję również za wyrozumiałość szczególnie w ostatnim, edycyjnym, etapie tworzenia pracy. Chciałbym również podziękować Katedrze Teorii Informatyki oraz Centrum Inteligentnych Technologii Informacyjnych za udostępnienie mi sali laboratoryjnej, w której mogłem przeprowadzić pierwsze eksperymenty z prototypem systemu. Bez tej pomocy ukończenie badań w terminie byłoby niemożliwe.

5 5 Podziękowania 4 Wstęp 9 Rozdział 1 Wstępna analiza danych Strumienie danych Okna przesuwne Klasyfikacja obserwacji a priori Transformacja falkowa Budowa wektora wejściowego 23 Rozdział 2 Klasteryzacja danych Klasyfikacja a klasteryzacja danych Funkcje podobieństwa Kwantyzacja przestrzeni cech i wieloboki Woronoja Algorytm gazu neuronowego Ekstrakcja wiedzy z skwantyzowanej przestrzeni cech 34 Rozdział 3 Prototyp systemu wspomagającego podejmowanie decyzji Metody podejmowania decyzji finansowych Idea hybrydowego systemu wspomagającego decyzje Formalizacja decyzji inwestycyjnej Budowa systemu wspomagania decyzji Wartości początkowe systemu 42 Rozdział 4 Analiza skuteczności sysemu H-Adviser Metodyka analizy skuteczności Wybór danych do systemu Symulacja zastosowania systemu H-adviser Dyskusja wyników 49 Zakończenie 52 Dodatek A Teoria falek 57 2 A.1 Przestrzeń funkcyjna ( R) L 57 A.2 Definicja falki 58 A.3 Analiza wielorozdzielcza 60 A.4 Falki Daubechies 64 A.5 Dekompozycja sygnału za pomocą falki D4 67 Dodatek B Opis Programu H-Adviser 70 B.1 Ogólna charakterystyka 70

6 6 B.2 Panel wyboru danych i ustawień dla klasteryzacji 71 B.2 Panel klasteryzacji 73 Dodatek C Aneks statystyczny 76 Literatura 81

7 7 Acknowledgements 4 Introduction 8 Chapter 1 Data preprocessing Data streams Sliding windows A priori classification Wavelet transform Construction of input vector 22 Chapter 2 Data clasterization Comparizion of classification and clasterization Similarity function Space quantization and voronoi diagrams Neural gas algorithm Knowledge extraction from quantized space 40 Chapter 3 Prototype of adviser system Stock market trading rules Hydrid adviser system Formality of financial decisions Construction of advising system Default setting 41 Chapter 4 Quality of stock market decisions Methods of quality measure Choice of data for quality expertise Simulation of use H-Adviser in real-life situation Summary 48 Conclusions 50 Appendix A Wavelet theory 55 A.1 Function space 55 A.2 Wavelet definition 56 A.3 Multiresolution analysis 58 A.4 Daubechies wavelets 62 A.5 Signal decompoition with D4 wavelet 65 Appendix B H-Adviser manual 68 B.1 General characteristic 68

8 8 B.2 Data and clustering algorithm parameters 69 B.3 Clustering panel 71 Appendix C Statistical attachment 74 Bibliography 79

9 9 WSTĘP Klasyfikacja szeregów czasowych przyciąga uwagę coraz większej rzeszy naukowców i praktyków. Szczególnie widoczne jest to przy przetwarzaniu długich szeregów czasowych, jakie występują na przykład w bioinformatyce czy też w sferze finansowej. Klasteryzacja jest jedną z najczęściej używanych technik pozyskiwania informacji z dużej ilości danych, o których charakterze ze względu na bardzo dużą wielowymiarowość mamy nie wielkie pojęcie. Podstawowym celem klasteryzacji jest transformacja danych źródłowych do postaci bardziej kompaktowej, która jest w stanie w pełni je odzwierciedlić. Polega na podziale zbioru danych na odpowiednie klasy abstrakcji, czyli mniejsze podgrupy, gdzie elementy danego klastra są podobne do siebie a mocno odmienne od innych. Rozwój technologii informatycznej w ostatnich latach spowodował duży postęp w wykorzystywaniu narzędzi sztucznej inteligencji w metodach pozyskiwania wiedzy z dużych wielowymiarowych struktur danych. Tematem niniejszej pracy jest klasteryzacja szeregów czasowych za pomocą algorytmu gazu neuronowego specyficznej sieci neuronowej, zaliczanej do narzędzi sztucznej inteligencji.

10 10 Klasteryzacja jest dobrze ugruntowaną i opisaną w literaturze tematu metodą analizy struktury populacji, dziale statystyki. Wykładniczy przyrost informacji w czasie, z jakim mamy aktualnie dotyczenia spowodował, iż algorytmy klasteryzacji nabrały jeszcze większego znaczenia. Są one podstawowymi metodami pozyskiwania wiedzy (ang. knowledge discovery) [Fayyad 1996], pozyskiwania danych (ang. data mining) i inteligentnej analizie danych [Liu 2000]. Klasteryzacja jest metodą bardzo często wykorzystywaną w najróżniejszych dziedzinach badań, według [Backer 2000] zastosowanie można podzielić na cztery grupy: 1. Formułowanie hipotez na podstawie pewnych danych źródłowych. Bada zachowanie klastrów na różnych poziomach dokładności (dzieli przestrzeń na coraz mniejsze przestrzenie). Na podstawie obserwacji, w jakich sytuacjach klastry dzielą się na mniejsze lub scalają się możemy stawiać hipotezy, w jaki sposób źródło (na przykład rynek) generuje dane. 2. Tworzenie topologii danych. Zastosowaniem może być na przykład obserwacja zachowania konsumentów. Dzieląc je na reprezentatywne grupy możemy ulepszyć skuteczność działań marketingowych. 3. Prognozowanie danych. Problem predykcji może zostać sprowadzony do identyfikacji wzorców, po których występują stałe zachowania. 4. Optymalizacja procesów. Odpowiednia identyfikacja grup zapytań może zoptymalizować dostęp do danych. Istnieje pięć paradygmatów klasteryzacji. Pierwszy z nich hierarchiczny produkuje drzewiasty opis struktury. Drzewo jest konstruowane rekurencyjnie scalając klastry niższego poziomu (bardzo szczegółowe) w klastry wyższego poziomu (bardziej ogólne). Drzewo jest zakończone jednym głównym klastrem (ang. super-cluster) zawierającym wszystkie elementy populacji. [Bajcsy 1998], [ElSonbaty 1998].

11 11 Drugi paradygmat grafowy prezentuje obiekty jako graf ważony. Jest on bardzo pomocny w analizowaniu struktur dwu-wymiarowych. Waga pomiędzy jednym węzłem a drugim jest odległością pomiędzy obiektami zgodnie z ustaloną metryką [Brito 1997], [Pacheco 1998], [Shapiro 1995]. Kolejnym paradygmatem są modele mieszanin (ang. mixtere models). Klastry są generowane za pomocą kombinacji rozkładów prawdopodobieństw [McLachlan 1998], [Fraley 1998], [Banfield 1993]. W następnym paradygmacie, grupującym (ang. partional) klastry są rozłączne, a każdy obiekt może należeć tylko i wyłącznie do jednego klastra [Lin, Lin 1996], [AlSultan 1996]. Ostatni paradygmat klasteryzacji rozmytej zakłada, iż elementy należą do odpowiednich klastrów w odpowiednim stopniu. Prowadzi to do możliwości przynależności jednego elementu do wielu klastrów [Bezdek, 1981], [Hoppner, 199]. Problem klasteryzacji jest, biorąc pod uwagę złożoność obliczeniową, równoważny z optymalizacją globalną nieliniowych funkcji wielomodalnych tak, więc zalicza się do problemów NP-trudnych [Weigend 1997]. Pomimo tego metody eksploracji danych finansowych mające na celu predykcje czy też klasyfikacje potrafią osiągać bardzo dużą skuteczność mierzoną tak w wskaźnikach statystycznych jak i realnych korzyściach ekonomicznych. Teoria błądzenia losowego rynków finansowych, która przekreślałaby skuteczność powyższej analizy szeregów czasowych również była i jest szeroko dyskutowana w wielu pracach. Jednakże w większości przypadku nie dało się jednoznacznie dowieść hipotezy o słabej efektywności rynku według Famy [Fama 1970]. W szczególności nie udało się tego ustalić dla polskich rynków kapitałowych [Czekaj 2003]. Problem postawiony w danej pracy brzmi: Czy można tak podzielić szeregi czasowe, aby jeden klaster zawierał te, które w przyszłości wykażą tendencje wzrostowe, a drugi tendencje zniżkowe? Aby trafniej klasyfikować wybrane podzbiory szeregów czasowych przynależność do klastrów zostanie

12 12 za pomocą funkcji przynależności zbiorów rozmytych [Rutkowski 2005]. Taka konstrukcja klastrów pozwoli również dać użytkownikowi bardzo czytelną odpowiedź w stylu: Ten szereg czasowy wzrośnie z 78 procentowym prawdopodobieństwem. Komunikat taki umożliwi podjęcie decyzji w zależności od skłonności do ryzyka danego inwestora. Jednym z kluczowych problemów podczas procesu klasteryzacji jest wielowymiarowość danych wejściowych. Przestrzeń rozwiązań, którą system będzie dzielić na klastry ma taką wymiarowość jak wektory do niej wprowadzane. W przypadku, gdy będą brane dane z sześćdziesięciu (dane z jednej minuty w odstępach jednosekundowych) ostatnich obserwacji, przestrzeń, jaką będzie musiał podzielić będzie przestrzenią 60-wymiarową. Klasyfikacja polega na przypisywaniu elementów do odpowiednich klastrów za pomocą z góry założonej normy (na przykład Euklidesowej). Przy dużej liczbie wymiarów różnica pomiędzy najbliższym i najdalszym sąsiadem staje się coraz mniej istotna, co znacznie utrudnia podział przestrzeni na znaczące klastry [Beyen 1999]. W literaturze przedmiotu istnieje bardzo wiele dobrze poznanych i bogato opisanych algorytmów redukcji wymiarów takich jak na przykład: neuronowe sieci autoasocjacyjne, dyskretna transformacja Fouriera, czy też dyskretna transformacja falkowa. Istnieje także wiele innych mniej znanych metod jak na przykład: drzewo regresji [Geurts 2001], nieciągłych reprezentacji (z ang. piecewise representation) [Keogh 1998], nieciągłe zagregowane aproksymacje (z ang. piecewise aggregate approximation) [Keogh 2000], [Yi 2000]. W niniejszej pracy problem klasteryzacji zostanie użyty do analizy, a w konsekwencji do predykcji, szeregów finansowych o dużej częstotliwości. Dane takie często nazywane są w literaturze jako szeregi prawie-losowe (ang. near-random walk). Analiza i predykcja takich danych jest niezmiernie trudna a wyniki skuteczności na poziomie 55-60% są uznawane za duże [Lipiński 2005].

13 13 Istnieje wiele metod, tak teoretycznych jak i obliczeniowych, analizy i predykcji finansowych szeregów czasowych. Często polega ona na zbudowaniu formalnego modelu rynku na podstawie długich obserwacji i wielu zmiennych [Box 1994], [Brockwell 2002], [Karatzas 1998], [Rachev 2004]. Te metody jednakże bywają zawodne w stosunku do danych o wysokiej czy też ultra-wysokiej częstotliwości, czyli o bardzo częstych dyskretnych zmian cen wraz z dużą nieregularnością w domenie czasu [Bień 2005]. Jednym z wielu rozwiązań jest podejście obliczeniowe, które najczęściej polega na narzędziach sztucznej inteligencji takich jak algorytmach genetycznych, sieci neuronowych, stawia sobie na celu, zamiast próby budowania kompletnego modelu, znalezienie pewnych chwilowych własności, które mają istotny wpływ na rynek finansowy [Allen 1999], [Bauer 1994], [Demster 2003], [Kwasnicka 2001], [Tsang 2000]. W niniejszej pracy zostanie zaproponowany system wyszukujący wzorce w szeregach czasowych o wysokiej i ultra-wysokiej częstotliwości. Ich poznanie i identyfikacja pozwoli na przewidywanie przyszłych zachowań szeregów czasowych. Formalnie zostaną teraz sformułowane hipotezy, których prawdziwość zostanie zweryfikowana w niniejszej pracy. 1. Szereg czasowy zawiera pewne wzorce, po których następuje taka sama zmiana wartości tego szeregu. 2. Znalezienie i identyfikacja niniejszych wzorców, jest możliwa do przeprowadzenia w bardzo krótkim czasie za pomocą jednostanowiskowej aplikacji uruchomionej na komputerze domowym. 3. Wykorzystanie znalezionych wzorców w środowisku rynków finansowych pozwoli na osiągnięcie ponadprzeciętnych zysków. Próby weryfikacji powyższych hipotez zastaną przedstawione niniejszym pracy. Do weryfikacji hipotez posłuży autorski program H-Adviser zaimplementowany w C# i działający na platformie uruchomieniowej.net

14 14 szczegółowo opisany w niniejszej pracy z szczególnym uwzględnieniem rozdziału 3 i dodatku C. Struktura pracy i wybór tematyki jest ściśle związana z procesem budowy systemu wspomagającego decyzje (od wstępnej analizy danych, poprzez problem klasteryzacji do konstrukcji samego systemu) lub też w sposób, w jaki system buduje decyzje (od pobrania i wstępnego przetworzenia danych, poprzez klasteryzację do utworzenia decyzji prezentowanej użytkownikowi). W rozdziale pierwszym zostanie przestawiony model strumieni danych za pomocą, których dane zostaną pozyskane a następnie zostanie opisana ich wstępna obróbka. W tym rozdziale zostanie przedstawiona propozycja rozwiązania problemu wielowymiarowości wektora wejściowego za pomocą dyskretnej transformacji falkowej. Zostanie również tutaj przedstawiony sposób opisu klastrów za pomocą liczb rozmytych. Ostatecznie zostanie zaprezentowany wektor w takiej postaci, w jakiej zostanie wprowadzony do systemu klasteruzującego. Rozdział drugi ma charakter teoretyczny. Zostanie w nim szczegółowo i formalnie opisany problem klasteryzacji oraz sposób jej przeprowadzenia za pomocą algorytmu gazu-neuronowego. Zostanie także zaprezentowana metoda ekstrakcji wiedzy z przestrzeni podzielonej na klastry. W rozdziale trzecim zostanie przedstawiona budowa systemy wspomagającego decyzje inwestycyjne zbudowanego na podstawie założeń przedstawionych w rozdziale pierwszym i drugim. Ostatni rozdział, czwarty, zawierać będzie analizę skuteczności decyzji inwestycyjnych opartych na informacjach wygenerowanych poprzez system. W nim też nastąpi weryfikacja hipotez przedstawionych w niniejszym wstępie. Dodatkowo praca zawiera trzy dodatki. Pierwszy poświęcony jest teorii falek. Z większą dokładnością zostanie opisana w nim dyskretna transformacja falkowa oraz opis i budowa falki Daubechies 4, która została wykorzystana w niniejszej pracy. Znajdują się tam także szczegółowo opisany algorytm

15 15 redukcji wymiarów oparty na dyskretnej transformacji falkowej. Ostatni dodatek jest opisem programu wspomagającego decyzje H-Adviser, którego prototyp zastał zaprezentowany na łamach niniejszej pracy. W dodatku ostatnim C, zatytułowanym aneks statystyczny, zestawiono wszystkie szeregi czasowe wybrane do weryfikacji hipotez przy użyciu hybrydowego systemu wspomagania decyzji wraz z ich krótkim opisem statystycznym.

16 16 ROZDZIAŁ 1 WSTĘPNA ANALIZA DANYCH 1.1 Strumienie danych 1.2 Okna przesuwne 1.3 Klasyfikacja obserwacji a priori 1.4 Transformacja falkowa 1.5 Budowa wektora wejściowego W niniejszym rozdziale autor pracy przedstawi w pierwszej kolejności sposób pozyskiwania danych finansowych. Zostaną opisane ograniczenia nałożone na system w związku z traktowaniem wartości szeregów czasowych, jako strumień danych. Następnie zostanie opisany sposób redukcji wymiarów oraz zmniejszania wagi sygnałów odległych za pomocą transformacji falkowej. Na końcu przedstawiona zostanie ostateczna budowa wektora wejściowego, który używany będzie w procesie klasteryzacji jako wektor kodujący odpowiedni wzorzec.

17 Strumienie danych Strumienie danych (ang. data streams) aktualnie przyciągają uwagę wielu specjalistów w najróżniejszych technologiach między innymi takich jak systemy bazodanowe, biometrii lub też systemy rozproszone. Jak sama nazwa wskazuje o strumieniu danych możemy myśleć, jako o uporządkowanej sekwencji tych samych elementów (tak bitów jak i bardziej złożonych obiektów), które oddziela zmienny interwał czasu [Garofalakis 2002], [Golab 2003]. Wykorzystuje się je między innymi w systemach telekomunikacyjnych, sieciach monitorujących jak też w analizie bieżących danych finansowych. Pomijając problem magazynowania danych i ich analizy, przetwarzanie ciągłego strumienia napływających danych rozmieszczonych nieregularnie w czasie i teoretycznie bez żadnych ograniczeń jest wyzwaniem samym w sobie. Przy takiej ilości danych nie ma miejsca na to aby składować je w na przykład w bazach danych i po osiągnięciu ich odpowiedniej ilości poddać obróbce. Oczywiście strumienie muszą być przetwarzane w czasie rzeczywistym. Celem niniejszej pracy jest klasyfikacja strumieni danych w taki sposób aby te podobne do siebie na bieżąco były klasyfikowane do odpowiadających im grup. Oczywiście surowe dane nie nadają się do analizy chociażby z powody szumów i zbyt dużej wielowymiarowości. Analiza taka nie dość, że nie jest wystarczająco skuteczna, to jeszcze jest bardzo czasochłonna. Rysunek 1 Prosty schemat modelu przetwarzania strumieni danych Źródło: [Beringer 2007]

18 18 Model strumieni danych zakłada brak możliwości dostępu do danych w sposób asynchroniczny z dowolnego źródła danych (RAM lub dysk) choć dopuszcza możliwość ich buforowania. Komunikacja z serwerem danych jest jednostronna. Sposób odbierania danych w taki sposób wymusza, co następuje: klient nie wysyła żadnych żądań, działa jak odbiornik i reaguje odpowiednimi zdarzeniami na pojawiające się dane; system nie weryfikuje danych, nie odpowiada serwerowi, gdy dane otrzyma; zakłada się, że długość strumienia danych jest nieskończona; nie ma możliwości, aby pobrać dane już wcześniej dostarczone (choć oczywiście mogą być one buforowane); dopuszcza się możliwość bezpowrotnej utraty danych spowodowaną błędami transmisji. Wszelkie operacje związane z pobieraniem i przetwarzaniem danych będą spełniały wyżej wymienione warunki. 1.2 Okna przesuwne Analiza nieskończenie długich strumieni danych jest niemożliwa do wykonania, dlatego też należy wydzielić z niego mniejsze fragmenty. Wielkość wydzielonego fragmentu powinna być na tyle mała, aby strumienie można było szybko sklasyfikować, ale też na tyle duża, aby analiza była wiarygodna i mogła stanowić podstawę do podejmowania skutecznych decyzji inwestycyjnych. Najpopularniejszym sposobem, aby uzyskać taki rezultat jest wykorzystanie okna przesuwnego (ang. sliding-window). Długość okna może być stała lub też zmieniać się w czasie podczas wykonywania klasyfikacji. Rozważając okna przesuwne o założonej długości w, strumień można w formalnie opisać jako w-wymiarowy wektor X ( x x, x, ) R = 0 1 2, x w 1,. Każdą obserwację x traktujemy jako liczbę rzeczywistą. Tak, więc całkowity

19 strumień X ( x x, x,, ) 19 = 0, 1 2 x dzielimy oknem przesuwnym na wektory składowe w następujący sposób: ( x x, x, x ) 0 = 0, 1 2, w 1 X, X ( x x, x, x ) = X { x } { } 1 = 1 2 3, w 0 0 x w,, ( x x, x, x ) = X { x } { x } X 2 = 2, 3 4, w w+ 1 lub ogólnie zgodnie ze wzorem (1). ( x x, x, x ) = X { x } { x } X n = 0 + n 1+ n 2+ n, w 1+ n n 1 0+ n w 1+ n, (1) Tak skonstruowane wektory za pomocą okien przesuwnych posłużą jako wektory kodowe do wyszukiwania wzorców kupna i sprzedaży Klasyfikacja obserwacji a priori Ustalony tak wektor jest wystarczający do sprawnego działania systemu. Jednakże, aby mógł on się kalibrować ze względu na warunki aktualnie panujące na rynku oraz umożliwić opisanie klastrów w przestrzeni, do każdego wektora zostanie dodana dodatkowa wartość określająca a priori przynależność danego wektora do odpowiedniego klastra. Będzie ona wyrażała procentowo zmianę pierwszej wartości nowego okna przesuwnego względem ostatniej wartości ostatniego okna przesuwnego. Wartość tą będzie wyrażać liczba rzeczywista. Aby zapewnić bardziej precyzyjne opisanie wzorców wartość ta zostanie znormalizowana do przedziału (-1,1). Obserwację taką będzie można uznać wtedy jako matrycę wzorca kupna jeśli wartość ta będzie bliska 1, i odwrotnie jeśli będzie ona bliska -1 będzie wskazywała na wektor który koduje wzorzec sprzedaży. Można potraktować ten przedział jako zbiór rozmyty decyzji inwestycyjnych gdzie na blisko granicy lewostronnej znajdują się decyzje sprzedaży a blisko granicy prawostronnej decyzje kupna.

20 20 Mając na uwadze powyższe funkcja tworząca taki zbiór rozmyty musi spełniać przy tych założeniach następujące warunki: lim f = 1 x f = f (0) = 0 (2) lim f = 1 x Odpowiednią funkcją spełniającą te warunki jest między innymi tangens hiperboliczny. Z punktu widzenia działania systemu ma ona dodatkowo dwie ciekawe własności. Pierwsza z nich to łatwość obliczenia jej wartość przy zadanym argumencie. Dokładną postać funkcji po przestawia wzór (3). x x e e tanh x = (3) x x e + e Aby dokonań obliczenia wystarczy obliczyć wartość funkcji e dla wartość argumentu x i x (rysunek 2). Rysunek 2. Wykres e x Źródło: opracowanie własne przy użyciu programu Derive Druga własność to łatwa skalowalność funkcji. Operując parametrem x można zmieniać kąt nachylenia pomiędzy funkcją, a osiami współrzędnych. Można potraktować ten parametr jako współczynnik ryzyka. W zależności od

21 21 niego sygnały kupna lub sprzedaży będą pojawiały się przy mniejszych zmianach bezwzględnych elementów wektora wejściowego. Ilustruje to rysunek 3. Rysunek 3 Skalowanie funkcji tanh(x) Źródło: opracowanie własne przy użyciu programu Derive Parametrem tym można także dostrajać system do zmienności szeregu czasowego. Przy szeregach czasowych o bardzo wysokiej amplitudzie zmian, zmiana jedno-procentowa może być bardzo znacząca natomiast dla innych o mniejszej częstotliwości może być zmianą nic nieznaczącą. Wtedy wzorzec zakodowany jako wzrostowy dla szeregu o mniejszej amplitudzie zmian może w rzeczywistości oznaczać trend boczny, w którym porusza się klasteryzowany walor i prowadzić do błędnych decyzji inwestycyjnych. Użytkownik będzie miał możliwość wyboru tego parametru, co sprawi, że system będzie bardziej elastyczny i lepiej reagował z danych o różnych amplitudach zmian.

22 Transformacja falkowa Dyskretna transformacja falkowa [Daubechies 1992], [Meyer 1995], [Mallat 1989] jest bardzo częstą techniką wykorzystywaną we wstępnej analizie danych. Dzięki niej można zarówno zredukować ilość wymiarów wektora wejściowego, do docelowego systemu analizującego dane (np. klasyfikującego albo predykcyjnego), jak i usunąć część informacji uznanych przez transformacje jako szum lub redundancje danych, jednakże pozostawiając w sygnale informacje oryginalne (w sensie Shanon a) [Sharon 1948]. Skrótowy opis teorii falek wraz z opisem pozyskania falki Daubechies- 2 (D2), która została wykorzystana w systemie przez autora pracy, oraz kryterium jej wyboru zawiera dodatek A. Istnieje nieskończenie wiele możliwości podziału wektora wejściowego na podciągi. Dodatkowo jest wiele możliwości ustawienia stopnia kompresji danych wejściowych. W niniejszej pracy, przy budowie systemu wspomagania decyzji na drodze eksperymentów został wybrany następujący model: wektor przekazany do systemu zostanie poddany dyskretnej transformacji wejściowej (DTF) za pomocą falki D2 w sposób następujący: 1. pierwsze osiem elementów zostanie zredukowanych do dwóch; 2. kolejne szesnaście elementów zostanie zredukowane do czterech; 3. trzydzieści dwa następne elementy zostanie zredukowane do ośmiu. Uzyskamy w ten sposób redukcję z przestrzeni 56-wymiarowej do 14- wymiarowej: W procesie decyzyjnym najważniejszą wartość mają dane aktualne. Im dalej od ostatniego sygnału tym mniejszą wartość informacyjną przypisujemy danym. Jeśli wektor wejściowy do systemu klasyfikującego ma postać X = x, x, x,..., x ), to największą wagę przypiszemy składowej najmłodszej ( n (czyli x 1), mniejszą kolejnej ( x 2 ), a najmniejszą ostatniej ( x n ). Taki sposób podzielenia na podciągi wektora wejściowe zapewni właśnie taki rezultat.

23 Budowa wektora wejściowego Uzyskany przez transformację falkową wektor ze strumienia danych po redukcji wymiarów i dodaniu wartości opisującej wzorzec a priori jest już prawie gotowy do wprowadzenia do systemu klasteryzującego. Jednakże, jeśli pozostawimy w wektorze wartości rzeczywiste może dojść do sytuacji, kiedy dwa identyczne, pod względem kształtu, wektory kodowe zostaną zaklasyfikowane do dwóch oddzielnych klastrów. Problem przedstawia rysunek 4. Problem ten można rozwiązać stosując normalizację danych do odpowiedniego przedziału. Tak przeskalowane wektory kodowe będą już nie rozróżnialne dla systemu i zostaną umieszczone w tym samych klastrach. Formalnie chcemy uzyskać, aby wartości minimalna i maksymalna danego wektora były, z definicji, równe z góry założonym liczbom. Autor pracy arbitralnie wybrał wartości -1 i 1 (równie często spotykanym rozwiązaniem jest wybór wartości 0 i 1). df a max( ) = 1 =, = min( ) = 1 X n X n df b (4) Taką normalizację nazywamy normalizacją mini-max. Wartości składowych znormalizowanego wektora obliczamy za pomocą wzoru 5. X * X min( X ) X min( X ) = = (5) zakres( X ) max( X ) min( X ) Przy tak znormalizowanych wartościach, wszystkie wektory kodowe, zostaną umieszczone w hiperprzestrzeni ograniczonej przez hipersześcian o środku ciężkości w środku układu współrzędnych.

24 24 Rysunek 4 Nieznormalizowany wektor kodowy w zakresie [3,18] i [30,180] Źródło: Opracowanie własne przy użyciu programu MATLAB

25 25 Tak przygotowany wektor, o zredukowanej transformacją falkową liczbie wymiarów, składający się z znormalizowanych wartości jest już w pełni gotowy do przekazania go do systemu klasteryzującego opisanego w kolejnych rozdziale.

26 26 ROZDZIAŁ 2 KLASTERYZACJA DANYCH 2.1 Klasyfikacja a klasteryzacja danych 2.2 Funkcje podobieństwa 2.3 Kwantyzacja przestrzeni cech i wieloboki Woronoja 2.4 Algorytm gazu neuronowego 2.5 Ekstrakcja wiedzy z skwantyzowanej przestrzeni cech W rozdziale tym zostanie teoretycznie nakreślony problem klasteryzacji oraz zostanie zaproponowana metoda jej wykonania za pomocą algorytmu gazu neuronowego. Opisany szczegółowo zostanie także sam proces dzielenia przestrzeni na klastry, czyli kwantyzacja przestrzeni cech. Na samym końcu zostanie przedstawiony problem wizualizacji przynależności wektora do danego klastra i zostanie zaproponowane rozwiązanie tego problemu w sposób intuicyjny i łatwy dla odczytanie przez końcowego użytkownika. 2.1 Klasyfikacja a klasteryzacja danych Klasyfikacja statystyczna to rodzaj procesu przetwarzania danych, który przydziela obserwacje statystyczne do klas, bazując na atrybutach

27 27 (cechach) tych obserwacji. Formalnie problem ten można przedstawić: dla danego zbioru danych trenujących znaleźć klasyfikator, który przydziela obiektowi klasę [Bobrowski 1986]. W przypadku problemu postawionej w niniejszej pracy x i reprezentować będą wektory kodowe natomiast y określać będą wzorce kupna lub sprzedaży. Klasteryzacja jest natomiast klasyfikacją nie nadzorowaną obiektów na różne podgrupy. Bardziej formalnie jest to partycjonowanie zbioru danych na podzbiory (klastry), takie, że elementy w każdym zbiorze są do siebie podobne (identyczne) ze względu na jakąś cechę, natomiast odmienne od innych elementów zgromadzonych w innych klastrach [Malarska 2005]. Do porównywania elementów używamy z góry zadanej funkcji liczącej odległości od elementów i na jej podstawie ustalamy podobieństwo. Inną bardo ważną cechą klasteryzacji jest to, iż dzielenie elementów, na klastry jest nienadzorowane. Z tego też względu klasteryzacja nie posiada zbioru uczącego. Dane analizowane są dla całego zbioru. Idea polega na tym, ze badamy odległości obiektów od skupisk umieszczonych w przestrzeni metrycznej za pomocą z góry określonej normy. Na potrzeby niniejszej pracy gdzie klasteryzujemy wektory kodowe, które są podciągami szeregu czasowego możemy klasteryzację zdefiniować następująco. Niech V będzie zbiorem wektorów v j gdzie j = 1,2,..., n. Celem klasteryzacji jest przyporządkowanie elementów zbioru V elementom zbioru klastrów K w taki sposób, że zmienne należące go jednego klastra są bardziej do siebie podobne ze względu na z góry założoną miarę (normę). Wynikiem tej procedury jest injekcja (w szczególnych przypadkach bijekcja) V K. Bardzo ważnym elementem przy klasteryzacji jest wybór funkcji podobieństwa, czyli normy mierzącej odległości elementów od siebie. Skrótowe przedstawienie najczęściej wykorzystywanych norm zawiera kolejny podrozdział.

28 Funkcje podobieństwa Istnieje wiele podziałów funkcji mierzących dystans między elementami umieszczonymi w klasteryzowanej przestrzeni. Jedna najbardziej widocznym podziałem są normy symetryczne i niesymetryczne. W normach symetrycznych odległość (podobieństwo) elementu A do elementu B jest równoważne odległości elementu B do elementu A. W niektórych procesach klasteryzacji jest to poważne ograniczenie, dlatego też używane są normy niesymetryczne na przykład sequence-alignment methods [Prinze 2006]. W niniejszej pracy klasteryzacji podlegają wektory umieszczone w wielowymiarowej przestrzeni euklidesowej, która jest symetryczna, dlatego autor pracy ograniczy się do bardziej szczegółowego opisania norm symetrycznych. Najczęściej używaną normą, która jest zarazem najbardziej intuicyjna, jest norma euklidesowa [Rutkowski 2006]. Dla dwóch wektorów P i Q o składowych odpowiednio p i i q i, gdzie i oznacza naturalny indeks składowej wektora, normę euklidesową definiujemy, jako: (6) Jest to po prostu odległość między dwoma punktami taka jaką znamy z świata rzeczywistego. Prawdziwość (6) można udowodnić stosując rekursywnie twierdzenie pitagorasa, dlatego też kiedyś nazywana była metryką Pitagorejską. Inną metodą mierzenia podobieństwa jest metryka Minkowskiego 1, dla wektorów x i y możemy ją zapisać wzorem (7). Jest ona również nazywana metryką Manhattan, miejską lub taksówkową. (7) 1 Nazwana tak na cześć Hermanna Minkowskiego (ur. 22 czerwiec zm. 12 styczeń 1909), niemieckiego pochodzenia matematyka i fizyka ur. w Aleksotas (obecnie Kowno w Rosji).

H-Adviser. Hybrydowy system wspomagania decyzji inwestycyjnych

H-Adviser. Hybrydowy system wspomagania decyzji inwestycyjnych H-Adviser Hybrydowy system wspomagania decyzji inwestycyjnych Projekt H-ADVISER Dokument Autor Cel, założenia oraz obsługa hybrydowego systemu wspomagania decyzji inwestycyjny H-Adviser Krzysztof Drelczuk

Bardziej szczegółowo

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.

Bardziej szczegółowo

Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS

Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Dyskretyzacja - definicja Dyskretyzacja - zamiana atrybutów

Bardziej szczegółowo

System transakcyjny oparty na średnich ruchomych. ś h = + + + + gdzie, C cena danego okresu, n liczba okresów uwzględnianych przy kalkulacji.

System transakcyjny oparty na średnich ruchomych. ś h = + + + + gdzie, C cena danego okresu, n liczba okresów uwzględnianych przy kalkulacji. Średnie ruchome Do jednych z najbardziej znanych oraz powszechnie wykorzystywanych wskaźników analizy technicznej, umożliwiających analizę trendu zaliczyć należy średnie ruchome (ang. moving averages).

Bardziej szczegółowo

Systemy uczące się Lab 4

Systemy uczące się Lab 4 Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego

Bardziej szczegółowo

Co to jest grupowanie

Co to jest grupowanie Grupowanie danych Co to jest grupowanie 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Szukanie grup, obszarów stanowiących lokalne gromady punktów Co to jest grupowanie

Bardziej szczegółowo

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING NEURONOWE MAPY SAMOORGANIZUJĄCE SIĘ Self-Organizing Maps SOM Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki,

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu

Bardziej szczegółowo

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Hierarchiczna analiza skupień

Hierarchiczna analiza skupień Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym

Bardziej szczegółowo

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia

Bardziej szczegółowo

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335 Sztuczne sieci neuronowe Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335 Wykład 10 Mapa cech Kohonena i jej modyfikacje - uczenie sieci samoorganizujących się - kwantowanie wektorowe

Bardziej szczegółowo

Adrian Horzyk

Adrian Horzyk Metody Inteligencji Obliczeniowej Metoda K Najbliższych Sąsiadów (KNN) Adrian Horzyk horzyk@agh.edu.pl AGH Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Opis efektów kształcenia dla programu kształcenia (kierunkowe efekty kształcenia) WIEDZA. rozumie cywilizacyjne znaczenie matematyki i jej zastosowań

Opis efektów kształcenia dla programu kształcenia (kierunkowe efekty kształcenia) WIEDZA. rozumie cywilizacyjne znaczenie matematyki i jej zastosowań TABELA ODNIESIEŃ EFEKTÓW KSZTAŁCENIA OKREŚLONYCH DLA PROGRAMU KSZTAŁCENIA DO EFEKTÓW KSZTAŁCENIA OKREŚLONYCH DLA OBSZARU KSZTAŁCENIA I PROFILU STUDIÓW PROGRAM KSZTAŁCENIA: POZIOM KSZTAŁCENIA: PROFIL KSZTAŁCENIA:

Bardziej szczegółowo

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza Skupień Elementy składowe procesu grupowania obiekt Ekstrakcja cech Sprzężenie zwrotne Grupowanie klastry Reprezentacja

Bardziej szczegółowo

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych ELEMENTY SZTUCZNEJ INTELIGENCJI Laboratorium nr 6 SYSTEMY ROZMYTE TYPU MAMDANIEGO

Bardziej szczegółowo

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L, Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

SZTUCZNA INTELIGENCJA

SZTUCZNA INTELIGENCJA SZTUCZNA INTELIGENCJA SYSTEMY ROZMYTE Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii Biomedycznej Laboratorium

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji

Bardziej szczegółowo

Systemy uczące się wykład 2

Systemy uczące się wykład 2 Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania

Bardziej szczegółowo

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

Testy popularnych wskaźników - RSI

Testy popularnych wskaźników - RSI Testy popularnych wskaźników - RSI Wskaźniki analizy technicznej generują wskazania kupna albo sprzedaży pomagając przy tym inwestorom podjąć odpowiednie decyzje. Chociaż przeważnie patrzy się na co najmniej

Bardziej szczegółowo

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu - metodologia badań

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu - metodologia badań Raport 1/2015 Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu - metodologia badań autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych z zastosowaniem

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Programowanie celowe #1

Programowanie celowe #1 Programowanie celowe #1 Problem programowania celowego (PC) jest przykładem problemu programowania matematycznego nieliniowego, który można skutecznie zlinearyzować, tzn. zapisać (i rozwiązać) jako problem

Bardziej szczegółowo

Za pierwszy niebanalny algorytm uważa się algorytm Euklidesa wyszukiwanie NWD dwóch liczb (400 a 300 rok przed narodzeniem Chrystusa).

Za pierwszy niebanalny algorytm uważa się algorytm Euklidesa wyszukiwanie NWD dwóch liczb (400 a 300 rok przed narodzeniem Chrystusa). Algorytmy definicja, cechy, złożoność. Algorytmy napotykamy wszędzie, gdziekolwiek się zwrócimy. Rządzą one wieloma codziennymi czynnościami, jak np. wymiana przedziurawionej dętki, montowanie szafy z

Bardziej szczegółowo

Obliczenia inteligentne Zadanie 4

Obliczenia inteligentne Zadanie 4 Sieci SOM Poniedziałek, 10:15 2007/2008 Krzysztof Szcześniak Cel Celem zadania jest zaimplementowanie neuronowej samoorganizującej się mapy wraz z metodą jej nauczania algorytmem gazu neuronowego. Część

Bardziej szczegółowo

Zmienność. Co z niej wynika?

Zmienność. Co z niej wynika? Zmienność. Co z niej wynika? Dla inwestora bardzo ważnym aspektem systemu inwestycyjnego jest moment wejścia na rynek (moment dokonania transakcji) oraz moment wyjścia z rynku (moment zamknięcia pozycji).

Bardziej szczegółowo

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2014/2015

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2014/2015 Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner rok akademicki 2014/2015 Sieci Kohonena Sieci Kohonena Sieci Kohonena zostały wprowadzone w 1982 przez fińskiego

Bardziej szczegółowo

Układy równań i nierówności liniowych

Układy równań i nierówności liniowych Układy równań i nierówności liniowych Wiesław Krakowiak 1 grudnia 2010 1 Układy równań liniowych DEFINICJA 11 Układem równań m liniowych o n niewiadomych X 1,, X n, nazywamy układ postaci: a 11 X 1 + +

Bardziej szczegółowo

Algorytm grupowania danych typu kwantyzacji wektorów

Algorytm grupowania danych typu kwantyzacji wektorów Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, problemem często spotykanym w zagadnieniach eksploracji danych (ang. data mining) jest zagadnienie grupowania danych

Bardziej szczegółowo

Sieci Kohonena Grupowanie

Sieci Kohonena Grupowanie Sieci Kohonena Grupowanie http://zajecia.jakubw.pl/nai UCZENIE SIĘ BEZ NADZORU Załóżmy, że mamy za zadanie pogrupować następujące słowa: cup, roulette, unbelievable, cut, put, launderette, loveable Nie

Bardziej szczegółowo

Test wskaźnika C/Z (P/E)

Test wskaźnika C/Z (P/E) % Test wskaźnika C/Z (P/E) W poprzednim materiale przedstawiliśmy Państwu teoretyczny zarys informacji dotyczący wskaźnika Cena/Zysk. W tym artykule zwrócimy uwagę na praktyczne zastosowania tego wskaźnika,

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania

Bardziej szczegółowo

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006 SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

ALGORYTM RANDOM FOREST

ALGORYTM RANDOM FOREST SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Giełda. Podstawy inwestowania SPIS TREŚCI

Giełda. Podstawy inwestowania SPIS TREŚCI Giełda. Podstawy inwestowania SPIS TREŚCI Zaremba Adam Wprowadzenie Część I. Zanim zaczniesz inwestować Rozdział 1. Jak wybrać dom maklerski? Na co zwracać uwagę? Opłaty i prowizje Oferta kredytowa Oferta

Bardziej szczegółowo

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

komputery? Andrzej Skowron, Hung Son Nguyen  Instytut Matematyki, Wydział MIM, UW Czego moga się nauczyć komputery? Andrzej Skowron, Hung Son Nguyen son@mimuw.edu.pl; skowron@mimuw.edu.pl Instytut Matematyki, Wydział MIM, UW colt.tex Czego mogą się nauczyć komputery? Andrzej Skowron,

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski

Bardziej szczegółowo

Strategie VIP. Opis produktu. Tworzymy strategie oparte o systemy transakcyjne wyłącznie dla Ciebie. Strategia stworzona wyłącznie dla Ciebie

Strategie VIP. Opis produktu. Tworzymy strategie oparte o systemy transakcyjne wyłącznie dla Ciebie. Strategia stworzona wyłącznie dla Ciebie Tworzymy strategie oparte o systemy transakcyjne wyłącznie dla Ciebie Strategie VIP Strategia stworzona wyłącznie dla Ciebie Codziennie sygnał inwestycyjny na adres e-mail Konsultacje ze specjalistą Opis

Bardziej szczegółowo

Lekcja 5: Sieć Kohonena i sieć ART

Lekcja 5: Sieć Kohonena i sieć ART Lekcja 5: Sieć Kohonena i sieć ART S. Hoa Nguyen 1 Materiał Sieci Kohonena (Sieć samo-organizująca) Rysunek 1: Sieć Kohonena Charakterystyka sieci: Jednowarstwowa jednokierunkowa sieć. Na ogół neurony

Bardziej szczegółowo

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu Podstawy baz danych PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych

Bardziej szczegółowo

ALGORYTMY SZTUCZNEJ INTELIGENCJI

ALGORYTMY SZTUCZNEJ INTELIGENCJI ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład III

Agnieszka Nowak Brzezińska Wykład III Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe

Bardziej szczegółowo

Zarządzanie Kapitałem

Zarządzanie Kapitałem Zarządzanie kapitałem kluczem do sukcesu W trakcie prac nad tworzeniem profesjonalnego systemu transakcyjnego niezbędne jest, aby uwzględnić w nim odpowiedni model zarządzania kapitałem (ang. money management).

Bardziej szczegółowo

operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.

operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je. Problem porządkowania zwanego również sortowaniem jest jednym z najważniejszych i najpopularniejszych zagadnień informatycznych. Dane: Liczba naturalna n i ciąg n liczb x 1, x 2,, x n. Wynik: Uporządkowanie

Bardziej szczegółowo

Analiza składowych głównych

Analiza składowych głównych Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi

Bardziej szczegółowo

Agnieszka Nowak Brzezińska

Agnieszka Nowak Brzezińska Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia

Bardziej szczegółowo

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe. Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe. zajecia.jakubw.pl/nai Literatura: S. Osowski, Sieci neuronowe w ujęciu algorytmicznym. WNT, Warszawa 997. PODSTAWOWE ZAGADNIENIA TECHNICZNE AI

Bardziej szczegółowo

ROC Rate of Charge. gdzie ROC wskaźnik szybkości zmiany w okresie n, x n - cena akcji na n-tej sesji,

ROC Rate of Charge. gdzie ROC wskaźnik szybkości zmiany w okresie n, x n - cena akcji na n-tej sesji, ROC Rate of Charge Analityk techniczny, który w swej analizie opierałby się wyłącznie na wykresach uzyskiwałby obraz możliwości inwestycyjnych obarczony sporym ryzykiem. Wnioskowanie z wykresów bazuje

Bardziej szczegółowo

znalezienia elementu w zbiorze, gdy w nim jest; dołączenia nowego elementu w odpowiednie miejsce, aby zbiór pozostał nadal uporządkowany.

znalezienia elementu w zbiorze, gdy w nim jest; dołączenia nowego elementu w odpowiednie miejsce, aby zbiór pozostał nadal uporządkowany. Przedstawiamy algorytmy porządkowania dowolnej liczby elementów, którymi mogą być liczby, jak również elementy o bardziej złożonej postaci (takie jak słowa i daty). Porządkowanie, nazywane również często

Bardziej szczegółowo

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18 Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)

Bardziej szczegółowo

METODY INŻYNIERII WIEDZY

METODY INŻYNIERII WIEDZY METODY INŻYNIERII WIEDZY WALIDACJA KRZYŻOWA dla ZAAWANSOWANEGO KLASYFIKATORA KNN ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Bardziej szczegółowo

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Algorytmy metaheurystyczne Wykład 11. Piotr Syga Algorytmy metaheurystyczne Wykład 11 Piotr Syga 22.05.2017 Drzewa decyzyjne Idea Cel Na podstawie przesłanek (typowo zbiory rozmyte) oraz zbioru wartości w danych testowych, w oparciu o wybrane miary,

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Projekt Sieci neuronowe

Projekt Sieci neuronowe Projekt Sieci neuronowe Chmielecka Katarzyna Gr. 9 IiE 1. Problem i dane Sieć neuronowa miała za zadanie nauczyć się klasyfikować wnioski kredytowe. W projekcie wykorzystano dane pochodzące z 110 wniosków

Bardziej szczegółowo

Biostatystyka, # 3 /Weterynaria I/

Biostatystyka, # 3 /Weterynaria I/ Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

Cena do wartości księgowej (C/WK, P/BV)

Cena do wartości księgowej (C/WK, P/BV) Cena do wartości księgowej (C/WK, P/BV) Wskaźnik cenadowartości księgowej (ang. price to book value ratio) jest bardzo popularnym w analizie fundamentalnej. Informuje on jaką cenę trzeba zapład za 1 złotówkę

Bardziej szczegółowo

WYKORZYSTANIE ANALIZY TECHNICZNEJ W PROCESIE PODEJMOWANIA DECYZJI INWESTYCYJNYCH NA PRZYKŁADZIE KGHM POLSKA MIEDŹ S.A.

WYKORZYSTANIE ANALIZY TECHNICZNEJ W PROCESIE PODEJMOWANIA DECYZJI INWESTYCYJNYCH NA PRZYKŁADZIE KGHM POLSKA MIEDŹ S.A. Uniwersytet Wrocławski Wydział Prawa, Administracji i Ekonomii Instytut Nauk Ekonomicznych Zakład Zarządzania Finansami Studia Stacjonarne Ekonomii pierwszego stopnia Krzysztof Maruszczak WYKORZYSTANIE

Bardziej szczegółowo

Day Trading System. Podręcznik Użytkownika

Day Trading System. Podręcznik Użytkownika Day Trading System Podręcznik Użytkownika Aplikacja Day Trading System powstała w ramach projektu z przedmiotu Zastosowania informatyki w gospodarce i została zrealizowana przez studentów Politechniki

Bardziej szczegółowo

Wycena opcji. Dr inż. Bożena Mielczarek

Wycena opcji. Dr inż. Bożena Mielczarek Wycena opcji Dr inż. Bożena Mielczarek Stock Price Wahania ceny akcji Cena jednostki podlega niewielkim wahaniom dziennym (miesięcznym) wykazując jednak stały trend wznoszący. Cena może się doraźnie obniżać,

Bardziej szczegółowo

Metody Sztucznej Inteligencji II

Metody Sztucznej Inteligencji II 17 marca 2013 Neuron biologiczny Neuron Jest podstawowym budulcem układu nerwowego. Jest komórką, która jest w stanie odbierać i przekazywać sygnały elektryczne. Neuron działanie Jeżeli wartość sygnału

Bardziej szczegółowo

WYKAZ KIERUNKOWYCH EFEKTÓW KSZTAŁCENIA KIERUNEK: MATEMATYKA, SPS WIEDZA

WYKAZ KIERUNKOWYCH EFEKTÓW KSZTAŁCENIA KIERUNEK: MATEMATYKA, SPS WIEDZA WYKAZ KIERUNKOWYCH EFEKTÓW KSZTAŁCENIA KIERUNEK: MATEMATYKA, SPS Symbol kierunkowego efektu kształcenia Efekty kształcenia dla programu kształcenia (kierunkowe efekty kształcenia) WIEDZA K1_W01 K1_W02

Bardziej szczegółowo

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta www.michalbereta.pl Sieci radialne zawsze posiadają jedną warstwę ukrytą, która składa się z neuronów radialnych. Warstwa wyjściowa składa

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład III

Agnieszka Nowak Brzezińska Wykład III Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe

Bardziej szczegółowo

Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015

Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015 Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015 1 Metody numeryczne Dział matematyki Metody rozwiązywania problemów matematycznych za pomocą operacji na liczbach. Otrzymywane

Bardziej szczegółowo

Analiza zależności liniowych

Analiza zależności liniowych Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 07 Uczenie nienadzorowane.

Wstęp do sieci neuronowych, wykład 07 Uczenie nienadzorowane. Wstęp do sieci neuronowych, wykład 7. M. Czoków, J. Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika w Toruniu 212-11-28 Projekt pn. Wzmocnienie potencjału dydaktycznego UMK w Toruniu

Bardziej szczegółowo

Testowanie modeli predykcyjnych

Testowanie modeli predykcyjnych Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności

Bardziej szczegółowo

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne

Bardziej szczegółowo

Co oznaczają te poszczególne elementy świecy?

Co oznaczają te poszczególne elementy świecy? Budowa świec Wielu inwestorów od razu porzuca analizę wykresów świecowych, ponieważ na pierwszy rzut oka są one zbyt skomplikowane. Na szczęście tylko na pierwszy rzut oka. Jeśli lepiej im się przyjrzeć

Bardziej szczegółowo

Prace magisterskie 1. Założenia pracy 2. Budowa portfela

Prace magisterskie 1. Założenia pracy 2. Budowa portfela 1. Założenia pracy 1 Założeniem niniejszej pracy jest stworzenie portfela inwestycyjnego przy pomocy modelu W.Sharpe a spełniającego następujące warunki: - wybór akcji 8 spółek + 2 papiery dłużne, - inwestycja

Bardziej szczegółowo

Proces badawczy schemat i zasady realizacji

Proces badawczy schemat i zasady realizacji Proces badawczy schemat i zasady realizacji Agata Górny Zaoczne Studia Doktoranckie z Ekonomii Warszawa, 23 października 2016 Metodologia i metoda naukowa 1 Metodologia Metodologia nauka o metodach nauki

Bardziej szczegółowo

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie

Bardziej szczegółowo

Algorytm. a programowanie -

Algorytm. a programowanie - Algorytm a programowanie - Program komputerowy: Program komputerowy można rozumieć jako: kod źródłowy - program komputerowy zapisany w pewnym języku programowania, zestaw poszczególnych instrukcji, plik

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74 3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15

Bardziej szczegółowo

EV/EBITDA. Dług netto = Zobowiązania oprocentowane (Środki pieniężne + Ekwiwalenty)

EV/EBITDA. Dług netto = Zobowiązania oprocentowane (Środki pieniężne + Ekwiwalenty) EV/EBITDA EV/EBITDA jest wskaźnikiem porównawczym stosowanym przez wielu analityków, w celu znalezienia odpowiedniej spółki pod kątem potencjalnej inwestycji długoterminowej. Jest on trudniejszy do obliczenia

Bardziej szczegółowo

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Paweł Szołtysek 12 czerwca 2008 Streszczenie Planowanie produkcji jest jednym z problemów optymalizacji dyskretnej,

Bardziej szczegółowo

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych. Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą

Bardziej szczegółowo

Proces badawczy schemat i zasady realizacji

Proces badawczy schemat i zasady realizacji Proces badawczy schemat i zasady realizacji Agata Górny Wydział Nauk Ekonomicznych UW Warszawa, 28 października 2014 Najważniejsze rodzaje badań Typy badań Podział wg celu badawczego Kryteria przyczynowości

Bardziej szczegółowo

Interwały. www.efixpolska.com

Interwały. www.efixpolska.com Interwały Dobór odpowiednich ram czasowych na których inwestor zamierza dokonywać transakcji jest podstawowym elementem strategii inwestycyjnej. W żargonie traderów sposób przedstawienia zmian ceny a w

Bardziej szczegółowo

Analiza ilościowa w przetwarzaniu równoległym

Analiza ilościowa w przetwarzaniu równoległym Komputery i Systemy Równoległe Jędrzej Ułasiewicz 1 Analiza ilościowa w przetwarzaniu równoległym 10. Analiza ilościowa w przetwarzaniu równoległym...2 10.1 Kryteria efektywności przetwarzania równoległego...2

Bardziej szczegółowo

Proces badawczy schemat i zasady realizacji

Proces badawczy schemat i zasady realizacji Proces badawczy schemat i zasady realizacji Agata Górny Zaoczne Studia Doktoranckie z Ekonomii Warszawa, 14 grudnia 2014 Metodologia i metoda badawcza Metodologia Zadania metodologii Metodologia nauka

Bardziej szczegółowo

Jeśli X jest przestrzenią o nieskończonej liczbie elementów:

Jeśli X jest przestrzenią o nieskończonej liczbie elementów: Logika rozmyta 2 Zbiór rozmyty może być formalnie zapisany na dwa sposoby w zależności od tego z jakim typem przestrzeni elementów mamy do czynienia: Jeśli X jest przestrzenią o skończonej liczbie elementów

Bardziej szczegółowo

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej KATEDRA MATEMATYKI TEMAT PRACY: ROZKŁAD NORMALNY ROZKŁAD GAUSSA AUTOR: BARBARA MARDOSZ Kraków, styczeń 2008 Spis treści 1 Wprowadzenie 2 2 Definicja

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Eksploracja danych Algorytmy klastujące Problem 3 Mając daną chmurę punktów chcielibyśmy zrozumieć ich

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela

Statystyka w pracy badawczej nauczyciela Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem

Bardziej szczegółowo

Uczenie się pojedynczego neuronu. Jeśli zastosowana zostanie funkcja bipolarna s y: y=-1 gdy z<0 y=1 gdy z>=0. Wówczas: W 1 x 1 + w 2 x 2 + = 0

Uczenie się pojedynczego neuronu. Jeśli zastosowana zostanie funkcja bipolarna s y: y=-1 gdy z<0 y=1 gdy z>=0. Wówczas: W 1 x 1 + w 2 x 2 + = 0 Uczenie się pojedynczego neuronu W0 X0=1 W1 x1 W2 s f y x2 Wp xp p x i w i=x w+wo i=0 Jeśli zastosowana zostanie funkcja bipolarna s y: y=-1 gdy z=0 Wówczas: W 1 x 1 + w 2 x 2 + = 0 Algorytm

Bardziej szczegółowo

Metody sztucznej inteligencji Zadanie 3: (1) klasteryzacja samoorganizująca się mapa Kohonena, (2) aproksymacja sieć RBF.

Metody sztucznej inteligencji Zadanie 3: (1) klasteryzacja samoorganizująca się mapa Kohonena, (2) aproksymacja sieć RBF. Metody sztucznej inteligencji Zadanie 3: ( klasteryzacja samoorganizująca się mapa Kohonena, (2 aproksymacja sieć RBF dr inż Przemysław Klęsk Klasteryzacja za pomocą samoorganizującej się mapy Kohonena

Bardziej szczegółowo

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka Modelowanie jako sposób opisu rzeczywistości Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka 2015 Wprowadzenie: Modelowanie i symulacja PROBLEM: Podstawowy problem z opisem otaczającej

Bardziej szczegółowo