WYKŁAD 1. Wprowadzenie w tematykę kursu

Wielkość: px
Rozpocząć pokaz od strony:

Download "WYKŁAD 1. Wprowadzenie w tematykę kursu"

Transkrypt

1 Wrocław University of Technology WYKŁAD 1 Wprowadzenie w tematykę kursu autor: Maciej Zięba Politechnika Wrocławska

2 Informacje dotyczące zajęć Cykl 8 wykładów. Konsultacje odbywają się w sali 121 w budynku C3 w terminach (proszę o wcześniejsze potwierdzenie mailem): PN, CZ, ND, Kontakt do prowadzącego: Strona prowadzącego: Na ostatnim wykładzie kolokwium zaliczeniowe. 2/34

3 Zawartość merytoryczna (1) 1. Zagadnienia podstawowe: metody pozyskiwania, wykorzystywania i integracji wiedzy; wprowadzenie niezbędnych pojęć związanych z prawdopodobieństwem; typowe rozkłady dyskretne i ciągłe. 2. Modele probabilistyczne: reprezentacja wiedzy w postaci modelu probabilistycznego; wnioskowanie na podstawie modeli probabilistycznych; ekstrakcja wiedzy z modeli probabilistycznych; integracja modeli probabilistycznych; złożone modele probabilistyczne. 3/34

4 Zawartość merytoryczna (2) 3. Modele funkcyjne, reguły i drzewa decyzyjne: metody ekstrakcji wiedzy dla modeli funkcyjnych; metody konstrukcji drzew i reguł decyzyjnych; metody konstrukcji zespołów modeli; metody integracji modeli o różnych reprezentacjach wiedzy. 4. Inne rodzaje reprezentacji wiedzy: zbiory rozmyte; ontologie; 5. Przykłady integracji wiedzy. 4/34

5 Pojęcie wiedzy Pojęcie wiedzy po raz pierwszy wprowadził Platon. Uważał on, że wiedza to prawdziwe i uzasadnione przekonanie. Arystoteles z kolei wyodrębnia wiedzę teoretyczną i praktyczną. Podział wiedzy ze względu na kryterium doświadczenia: Wiedza a priori jest niezależna od zmysłów i dotyczy prawd absolutnych lub uniwersalnych jakimi są prawa logiki, prawa matematyki. Wiedza a posteriori jest wiedzą nabytą poprzez zmysły i jej prawdziwość może być obalona poprzez następne obserwacje. 5/34

6 Pojęcie wiedzy w sztucznej inteligencji Pojęcie wiedzy w sztucznej inteligencji odnosi się do struktur modeli reprezentujących pewne procesy podejmowania decyzji. W zależności od procesu podejmowania decyzji wiedza może być reprezentowana w postaci rozmaitych struktur, takich jak funkcje, drzewa, grafy, reguły, bądź zbiory. Wiedza może mieć charakter: zrozumiały (interpretowalny); niejawny (nieinterpretowalny). Źródła wiedzy: wiedza eksperta; wiedza pozyskana z danych. 6/34

7 Pojęcie wiedzy w sztucznej inteligencji Pojęcie wiedzy w sztucznej inteligencji odnosi się do struktur modeli reprezentujących pewne procesy podejmowania decyzji. W zależności od procesu podejmowania decyzji wiedza może być reprezentowana w postaci rozmaitych struktur, takich jak funkcje, drzewa, grafy, reguły, bądź zbiory. Wiedza może mieć charakter: zrozumiały (interpretowalny); niejawny (nieinterpretowalny). Źródła wiedzy: wiedza eksperta; wiedza pozyskana z danych. 6/34

8 Uczenie maszynowe i eksploracja danych (1) Uczenie maszynowe (ang. machine learning) to proces pozyskiwania wiedzy do rozwiązania pewnego zadania w oparciu o doświadczenie i z wykorzystaniem pewnej miary jakości. Wraz ze wzrostem doświadczenia, następuje przyrost wiedzy potrzebnej do realizacji zadania mierzony z wykorzystaniem miary jakości. Eksploracja (ekstrakcja) danych (ang. data mining) to proces pozyskiwania wiedzy z danych reprezentowanej przez pewne wzorce. ZADANIE Jaka to litera? DOŚWIADCZENIE MIARA JAKOŚCI 7/34

9 Uczenie maszynowe i eksploracja danych (2) Metody uczenia maszynowego: są wykorzystywane jako narzędzia w procesach eksploracji danych. mają wymiar teoretyczny; modelują zjawiska wspomagając się danymi; modelują rzeczywistość w sposób probabilistyczny; zorientowane głownie na modele nieinterpretowalne; Metody eksploracji danych: jako narzędzia wykorzystują metody uczenia maszynowego. mają wymiar praktyczny; koncentrują się na analizie danych; modelują rzeczywistość w sposób deterministyczny; zorientowane głownie na modele interpretowalne. 8/34

10 Dane w uczeniu maszynowym Jeżeli rozważamy problem uczenia nadzorowanego (predykcji), to interesuje nas znalezienie mapowania wartości wejściowych x na wartości wyjściowe y. Mapowanie to odbywa się na podstawie tzn. zbioru uczącego (treningowego), który zawiera pary wejście-wyjście nazywane przykładami: D = {(x n, y n )} N n=1. Każdy element wejściowy x i zawiera zestaw wartości nominalnych i liczbowych, które nazywane są cechami, bądź atrybutami. Każdy element wyjściowy y i reprezentowany jest przez wartość liczbową (regresja), bądź też nominalną (klasyfikacja). Jeżeli rozważamy problem uczenia nienadzorowanego (deskrypcji) to interesuje nas znalezienie ciekawych wzorców w danych: D = {x n } N n=1. 9/34

11 Źródła danych DANE BANKOWE DANE MEDYCZNE DANE DŹWIĘKOWE OBRAZY DANE MAILOWE PORTALE SPOŁECZNOŚCIOWE DANE O KLIENTACH DANE Z CZUJNIKÓW DANE GIEŁDOWE 10/34

12 Problemy uczenia maszynowego Uczenie z nadzorem (ang. supervised learning): klasyfikacja (ang. classification); regresja (ang. regression); Uczenie bez nadzoru (ang. unsupervised learning): grupowanie (klasteryzacja, analiza skupień) (ang. clustering); redukcja wymiarów (ang. dimensionality reduction); uzupełnianie wartości (ang. matrix completion). Uczenie ze wzmocnieniem (ang. reinforcement learning). 11/34

13 Uczenie z nadzorem: Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami ciągłymi. Celem uczenia jest skonstruowanie modelu regresji na podstawie danych. Model konstruowany jest tak, aby możliwe było przewidywanie nowych obserwacji. 12/34

14 Uczenie z nadzorem: Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami ciągłymi. Celem uczenia jest skonstruowanie modelu regresji na podstawie danych. Model konstruowany jest tak, aby możliwe było przewidywanie nowych obserwacji. 12/34

15 Uczenie z nadzorem: Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami ciągłymi. Celem uczenia jest skonstruowanie modelu regresji na podstawie danych. Model konstruowany jest tak, aby możliwe było przewidywanie nowych obserwacji. 12/34

16 Uczenie z nadzorem: Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami ciągłymi. Celem uczenia jest skonstruowanie modelu regresji na podstawie danych. Model konstruowany jest tak, aby możliwe było przewidywanie nowych obserwacji. 12/34

17 Regresja: Śledzenie ruchu Cel: Dane: Wyznaczenie następnego położenia obiektu. Sekwencja obrazów z poruszającymi się obiektami. Na podstawie dotychczas zarejestrowanej sekwencji obrazów wyznaczane jest położenie obiektu. 13/34

18 Regresja: Predykcja notowań giełdowych Cel: Dane: Wycena akcji. Notowania akcji z poprzednich okresów oraz inne czynniki wpływające na cenę akcji. Na podstawie notowań historycznych i innych czynników mających wpływ na cenę akcji budowany jest model predykcyjny. Model aktualizowany jest z wykorzystaniem bieżących notowań. 14/34

19 Regresja: Predykcja przeżywalności pooperacyjnej Cel: Dane: Określenie jaki okres czasu pacjent przeżyje po operacji. Wyniki badań pacjenta przeprowadzonych przed i po operacji, ogólna charakterystyka zdrowia pacjenta. Na podstawie danych o pacjencie należy określić jaki okres czasu przeżyje on po operacji. 15/34

20 Uczenie z nadzorem: Klasyfikacja Klasyfikacja (ang. Classification): Dysponujemy obserwacjami z etykietami (klasami), które przyjmują wartości nominalne. Celem uczenia jest skonstruowanie klasyfikatora separującego obiekty należące do różnych klas. Klasyfikator konstruowany jest tak, aby możliwe było przewidywanie klas nowych, niesklasyfikowanych obserwacji. 16/34

21 Uczenie z nadzorem: Klasyfikacja Klasyfikacja (ang. Classification): Dysponujemy obserwacjami z etykietami (klasami), które przyjmują wartości nominalne. Celem uczenia jest skonstruowanie klasyfikatora separującego obiekty należące do różnych klas. Klasyfikator konstruowany jest tak, aby możliwe było przewidywanie klas nowych, niesklasyfikowanych obserwacji. 16/34

22 Uczenie z nadzorem: Klasyfikacja Klasyfikacja (ang. Classification): Dysponujemy obserwacjami z etykietami (klasami), które przyjmują wartości nominalne. Celem uczenia jest skonstruowanie klasyfikatora separującego obiekty należące do różnych klas. Klasyfikator konstruowany jest tak, aby możliwe było przewidywanie klas nowych, niesklasyfikowanych obserwacji. 16/34

23 Uczenie z nadzorem: Klasyfikacja Klasyfikacja (ang. Classification): Dysponujemy obserwacjami z etykietami (klasami), które przyjmują wartości nominalne. Celem uczenia jest skonstruowanie klasyfikatora separującego obiekty należące do różnych klas. Klasyfikator konstruowany jest tak, aby możliwe było przewidywanie klas nowych, niesklasyfikowanych obserwacji. 16/34

24 Klasyfikacja: Rozpoznawanie znaków Cel: Dane: Określenie, jaki znak (cyfra, litera) znajduje się na obrazku. Zestaw obrazków treningowych reprezentujących różne znaki wraz z korespondującymi etykietami. Wydobywane są cechy obrazka różnicujące reprezentowane znaki. Na podstawie cech i wykorzystując dane treningowe wykonywana jest klasyfikacja obrazka do najbardziej prawdopodobnego znaku. 17/34

25 Klasyfikacja: Detekcja obiektów Cel: Dane: Wykrycie obiektu na obrazie. Obraz na którym bada się wystąpienie obiektu, oraz zestaw obrazów treningowych przedstawiających dany obiekt. Do analizy obrazu wykorzystuje się okno przesuwne. W każdym kroku obraz z okna przesuwnego klasyfikowany jest jako obiekt poszukiwany lub nie. 18/34

26 Klasyfikacja: Detekcja SPAMU Cel: Dane: Zbadać, czy dana wiadomość jest SPAMEM. Zestaw zawierający zaetykietowane wiadomości mailowe. Wydobywane są cechy (występowanie słów) różnicujące SPAM od zwykłej poczty. Klasyfikacja nowej wiadomości odbywa się z wykorzystaniem wydobytych cech. 19/34

27 Klasyfikacja: Credit Scoring Cel: Dane: Zbadać zdolność kredytową klienta bankowego. Charakterystyki klientów bankowych pochodzące z systemów informatycznych i kwestionariuszy. Wydobywane są cechy mające wpływ na decyzje kredytowe. Klasyfikatory do oceny zdolności kredytowej są powszechnie stosowanym narzędziem. 20/34

28 Uczenie bez nadzoru: Klasteryzacja Klasteryzacja (ang. Clustering): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie grup (klastrów), w których skupione są dane. Obserwacje z danej grupy charakteryzują się podobieństwem. Inne nazwy: grupowanie, analiza skupień. 21/34

29 Uczenie bez nadzoru: Klasteryzacja Klasteryzacja (ang. Clustering): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie grup (klastrów), w których skupione są dane. Obserwacje z danej grupy charakteryzują się podobieństwem. Inne nazwy: grupowanie, analiza skupień. 21/34

30 Klateryzacja: Grupowanie osób w sieci społecznej Cel: Dane: Wyodrębnienie grup znajomych w sieci społecznej. Dane o interakcji między osobami. Wyodrębnione grupy znajomych przy pomocy TouchGraph dla Facebook a. Znajomi w tych samych klastrach charakteryzują się wewnętrzną interakcją między sobą. 22/34

31 Uczenie bez nadzoru: Redukcja wymiarów Redukcja wymiarów (ang. Dimensionality reduction): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie niskowymiarowej podprzestrzeni (rozmaitości), na której leżą dane. Obserwacje mogą zostać zakodowane przy pomocy układu współrzędnych związanego z niskowymiarową podprzestrzenią. 23/34

32 Uczenie bez nadzoru: Redukcja wymiarów Redukcja wymiarów (ang. Dimensionality reduction): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie niskowymiarowej podprzestrzeni (rozmaitości), na której leżą dane. Obserwacje mogą zostać zakodowane przy pomocy układu współrzędnych związanego z niskowymiarową podprzestrzenią. 23/34

33 Redukcja wymiarów: Kodowanie i kompresja zdjęć Cel: Znalezienie twarzy bazowych rozpinających niskowymiarową przestrzeń. Dane: Zdjęcia twarzy. Wyróżnione M twarzy bazowych rozpina M-wymiarową podprzestrzeń w przestrzeni twarzy. Twarze mogą być kodowane poprzez położenie na niskowymiarowej przestrzeni. Metoda może służyć, jako automatyczna ekstrakcja cech ze zdjęć. 24/34

34 Uczenie bez nadzoru: Uzupełnianie wartości Uzupełnianie wartości (ang. Matrix completion): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie brakujących wartości dla niekompletnych obserwacji. Obserwacje uzupełniane są poprzez wstawienie najbardziej prawdopodobnych wartości. 25/34

35 Uczenie bez nadzoru: Uzupełnianie wartości Uzupełnianie wartości (ang. Matrix completion): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie brakujących wartości dla niekompletnych obserwacji. Obserwacje uzupełniane są poprzez wstawienie najbardziej prawdopodobnych wartości. 25/34

36 Uczenie bez nadzoru: Uzupełnianie wartości Uzupełnianie wartości (ang. Matrix completion): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie brakujących wartości dla niekompletnych obserwacji. Obserwacje uzupełniane są poprzez wstawienie najbardziej prawdopodobnych wartości. 25/34

37 Uzupełnianie wartości: Rekonstrukcja obrazu Cel: Dane: Odtworzyć zakłócony obraz. Zestaw niezakłóconych zdjęć, oraz zakłócony obraz do rekonstrukcji. W oparciu o niezakłócone zdjęcia i analizowany obraz konstruowany jest rozkład prawdopodobieństwa na brakujące piksele. Na podstawie rozkładu uzupełniane są brakujące wartości pikseli poprzez wstawianie wartości najbardziej prawdopodobnych. 26/34

38 Uzupełnianie wartości: Rekomendacja produktów Cel: Dane: Zaproponować klientowi produkty, które skłonny jest kupić. Produkty do tej pory kupione przez klienta i transakcje zrealizowane przez innych klientów. W oparciu o zakupiony koszyk produktów nabytych przez klienta i zestaw transakcji konstruowany jest rozkład prawdopodobieństwa na produkty. Na podstawie rozkładu wybierane do rekomendacji są produkty charakteryzujące się najwyższym prawdopodobieństwem. 27/34

39 Reprezentacje wiedzy Wiedza w postaci funkcyjnej Wiedza reprezentowania jest w postaci funkcji i jej parametrów. Proces podejmowania decyzji odbywa się poprzez wyznaczenie wartości funkcji dla zadanych wartości argumentów. Uczenie najczęściej odbywa się poprzez estymację parametrów w procesie optymalizacji pewnego kryterium. Przykład: f(w ZROST, W AGA) = 2 W AGA + W ZROST 320. f(176, 85) = 26 > 0; Wniosek: osoba, która ma 176 cm wzrostu i waży 85 kg jest rugbistą. 28/34

40 Reprezentacje wiedzy Wiedza w postaci funkcyjnej Wiedza reprezentowania jest w postaci funkcji i jej parametrów. Proces podejmowania decyzji odbywa się poprzez wyznaczenie wartości funkcji dla zadanych wartości argumentów. Uczenie najczęściej odbywa się poprzez estymację parametrów w procesie optymalizacji pewnego kryterium. Przykład: f(w ZROST, W AGA) = 2 W AGA + W ZROST 320. f(176, 85) = 26 > 0; Wniosek: osoba, która ma 176 cm wzrostu i waży 85 kg jest rugbistą. 28/34

41 Reprezentacje wiedzy Wiedza w postaci funkcyjnej Wiedza reprezentowania jest w postaci funkcji i jej parametrów. Proces podejmowania decyzji odbywa się poprzez wyznaczenie wartości funkcji dla zadanych wartości argumentów. Uczenie najczęściej odbywa się poprzez estymację parametrów w procesie optymalizacji pewnego kryterium. Przykład: f(w ZROST, W AGA) = 2 W AGA + W ZROST 320. f(176, 85) = 26 > 0; Wniosek: osoba, która ma 176 cm wzrostu i waży 85 kg jest rugbistą. 28/34

42 Reprezentacje wiedzy Wiedza w postaci probabilistycznej Wiedza reprezentowania jest w postaci rozkładów prawdopodobieństwa. Proces podejmowania decyzji odbywa się poprzez wybór najbardziej prawdopodobnego wariantu. Uczenie realizowane jest poprzez estymację rozkładów prawdopodobieństwa. Przykład: p(176, 85 rugbista) = 0.17; p(176, 85 skoczek) = Wniosek: bardziej prawdopodobne jest, że jeśli osoba jest rugbistą, to ma 176 cm wzrostu i waży 85 kg. 29/34

43 Reprezentacje wiedzy Wiedza w postaci probabilistycznej Wiedza reprezentowania jest w postaci rozkładów prawdopodobieństwa. Proces podejmowania decyzji odbywa się poprzez wybór najbardziej prawdopodobnego wariantu. Uczenie realizowane jest poprzez estymację rozkładów prawdopodobieństwa. Przykład: p(176, 85 rugbista) = 0.17; p(176, 85 skoczek) = Wniosek: bardziej prawdopodobne jest, że jeśli osoba jest rugbistą, to ma 176 cm wzrostu i waży 85 kg. 29/34

44 Reprezentacje wiedzy Wiedza w postaci reguł decyzyjnych Wiedza reprezentowania jest w postaci reguł decyzyjnych. Każda reguła opisana jest w formie implikacji, na którą składa się koniunkcja wartości atrybutów (lewa strona implikacji), oraz jeden z możliwych wariantów decyzyjnych (prawa strona implikacji). Proces podejmowania decyzji odbywa się poprzez wybór odpowiedniej reguły (bądź reguł) decyzyjnych, która dotyczy (pokrywa) danego zagadnienia i na jej podstawie przeprowadzenie procesu wnioskowania. Uczenie polega na znalezieniu zestawu reguł najlepiej opisujących rzeczywistość. Interpretowalna reprezentacja wiedzy. Przykładowa reguła: (Kwota kredytu > 700) (Dochod < 1100) (status = odmowa)) 30/34

45 Reprezentacje wiedzy Wiedza w postaci drzew decyzyjnych Wiedza reprezentowania jest w strukturze drzewa. Drzewo decyzyjne w wierzchołkach przechowuje atrybuty, krawędzie reprezentują podział wartości dla danego atrybutu, natomiast w liściach przechowywane są możliwe warianty decyzyjne. Proces podejmowania decyzji odbywa się poprzez przejście jedną z możliwych ścieżek w drzewie i odczytaniu wariantu decyzyjnego z liścia. Uczenie odbywa się poprzez wybór najbardziej informacyjnej cechy, umieszczenie jej w danym wierzchołku i wprowadzenie najbardziej informacyjnego podziału jej wartości. Interpretowalna reprezentacja wiedzy. Każda ścieżka reprezentuje odrębną regułę decyzyjną. Zbiór wszystkich ścieżek reprezentuje kompletny i niesprzeczny zestaw reguł. 31/34

46 Reprezentacje wiedzy Przykład drzewa decyzyjnego <0 $ Checking account status >= 0 $ Credit amount Employment status < $ > = $ full-time unemployment Employment status bad good part-time bad full-time unemployment part-time Credit amount good bad < $ > = $ good good Duration of credit <18 months > =18 months good divorced or widowed Personal status married single good good bad 32/34

47 Integracja wiedzy Integracja wiedzy (bądź danych na potrzeby pozyskania wiedzy) odbywa się głównie celem: podejmowania decyzji na podstawie wielu modeli; wydobywanie interpretowalnej wiedzy na podstawie wielu modeli; integracja danych rozłożonych danych w różnych obszarach przestrzeni. 33/34

48 Literatura Należy zapoznać się z treścią książki (Rozdział 1 i 2): Murphy, Kevin P. Machine learning: a probabilistic perspective. MIT Press, /34

ZESPOŁY KLASYFIKATORÓW SVM DLA DANYCH NIEZBALAN-

ZESPOŁY KLASYFIKATORÓW SVM DLA DANYCH NIEZBALAN- Politechnika Wrocławska Wydział Informatyki i Zarządzania Instytut Informatyki Rozprawa doktorska ZESPOŁY KLASYFIKATORÓW SVM DLA DANYCH NIEZBALAN- SOWANYCH Maciej Zięba Promotor: prof. dr hab. inż. Jerzy

Bardziej szczegółowo

Eksploracja danych TADEUSZ MORZY

Eksploracja danych TADEUSZ MORZY NAUKA 3/2007 83-104 TADEUSZ MORZY Eksploracja danych Intensywny rozwój technologii generowania, gromadzenia i przetwarzania danych z jednej strony, z drugiej, upowszechnienie systemów informatycznych,

Bardziej szczegółowo

Implementacja wybranych algorytmów eksploracji danych na Oracle 10g

Implementacja wybranych algorytmów eksploracji danych na Oracle 10g Implementacja wybranych algorytmów eksploracji danych na Oracle 10g Sławomir Skowyra, Michał Rudowski Instytut Informatyki Wydziału Elektroniki i Technik Informacyjnych, Politechnika Warszawska S.Skowyra@stud.elka.pw.edu.pl,

Bardziej szczegółowo

ZASTOSOWANIE METOD ANALIZY STATYSTYCZNEJ ORAZ EKSPLORACJI DANYCH DO KLASYFIKACJI OBRAZÓW HISTOPATOLOGICZNYCH HER2

ZASTOSOWANIE METOD ANALIZY STATYSTYCZNEJ ORAZ EKSPLORACJI DANYCH DO KLASYFIKACJI OBRAZÓW HISTOPATOLOGICZNYCH HER2 Karol Radziszewski, 164708 Krzysztof Sikora, 164814 Marek Skowroński, 164731 Specjalność: Inteligentne systemy informatyczne Prowadząca: prof. dr hab. inż. H. Kwaśnicka SYSTEMY WIZYJNE ZASTOSOWANIE METOD

Bardziej szczegółowo

Modele eksploracji danych - CROSS-SELLING, LTV, EVENT

Modele eksploracji danych - CROSS-SELLING, LTV, EVENT Zakład Zaawansowanych Technik Informacyjnych (Z-6) Modele eksploracji danych - CROSS-SELLING, LTV, EVENT Praca statutowa nr 06.30.003.6 Warszawa, grudzień 2006 Modele eksploracji danych - CROSS-SELLING,

Bardziej szczegółowo

Spis treści. 1.1 Problematyka... 4 1.2 Cele pracy i zakres pracy... 5

Spis treści. 1.1 Problematyka... 4 1.2 Cele pracy i zakres pracy... 5 Spis treści 1 Wstęp 4 1.1 Problematyka.......................... 4 1.2 Cele pracy i zakres pracy...................... 5 2 Analiza zagadnienia 7 2.1 Wprowadzenie.......................... 7 2.2 Eksploracja

Bardziej szczegółowo

Wybrane techniki przygotowywania rekomendacji dla użytkowników serwisu internetowego

Wybrane techniki przygotowywania rekomendacji dla użytkowników serwisu internetowego POLITECHNIKA ŁÓDZKA Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Praca dyplomowa Wybrane techniki przygotowywania rekomendacji dla użytkowników serwisu internetowego Artur Ziółkowski

Bardziej szczegółowo

PRZEGLĄD I KLASYFIKACJA ZASTOSOWAŃ, METOD ORAZ TECHNIK EKSPLORACJI DANYCH

PRZEGLĄD I KLASYFIKACJA ZASTOSOWAŃ, METOD ORAZ TECHNIK EKSPLORACJI DANYCH Studia i Materiały Informatyki Stosowanej, Tom 2, Nr 2, 2010 PRZEGLĄD I KLASYFIKACJA ZASTOSOWAŃ, METOD ORAZ TECHNIK EKSPLORACJI DANYCH Marcin Mirończuk Politechnika Białostocka Wydział Elektryczny ul.wiejska

Bardziej szczegółowo

TECHNIKI POZYSKIWANIA WIEDZY W HURTOWNI DANYCH

TECHNIKI POZYSKIWANIA WIEDZY W HURTOWNI DANYCH TECHNIKI POZYSKIWANIA WIEDZY W HURTOWNI DANYCH Małgorzata NYCZ Streszczenie: Artykuł poświęcony jest pozyskiwaniu wiedzy z hurtowni danych. Składa się z czterech części. Po krótkim wstępie zaprezentowano

Bardziej szczegółowo

Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki i Finansów. Krzysztof Drelczuk. Praca magisterska

Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki i Finansów. Krzysztof Drelczuk. Praca magisterska Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki i Finansów Krzysztof Drelczuk Wyszukiwanie wzorców kupna-sprzedaży w finansowych szeregach czasowych za pomocą teorii falek i gazów

Bardziej szczegółowo

Techniczne systemy informatyki jako narzędzia odkrywania wiedzy i symulacji życia

Techniczne systemy informatyki jako narzędzia odkrywania wiedzy i symulacji życia NAUKA 3/2004 21-56 ROMAN SŁOWIŃSKI Techniczne systemy informatyki jako narzędzia odkrywania wiedzy i symulacji życia Informatyka jest nauką badającą procesy algorytmiczne, które opisują i przetwarzają

Bardziej szczegółowo

InTrees: Modularne podejście do Drzew Decyzyjnych

InTrees: Modularne podejście do Drzew Decyzyjnych Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Gracjan Wilczewski nr albumu: 158162 Praca magisterska na kierunku informatyka InTrees: Modularne podejście do Drzew Decyzyjnych Opiekun

Bardziej szczegółowo

Oracle Data Mining odkrywanie wiedzy w dużych wolumenach danych

Oracle Data Mining odkrywanie wiedzy w dużych wolumenach danych XI Konferencja PLOUG Kościelisko Październik 2005 Oracle Data Mining odkrywanie wiedzy w dużych wolumenach danych Mikołaj Morzy Instytut Informatyki Politechniki Poznańskiej e-mail: Mikolaj.Morzy@cs.put.poznan.pl

Bardziej szczegółowo

Oracle Data Mining odkrywanie wiedzy w dużych wolumenach danych

Oracle Data Mining odkrywanie wiedzy w dużych wolumenach danych Oracle Data Mining odkrywanie wiedzy w dużych wolumenach danych Mikołaj Morzy Instytut Informatyki Politechniki Poznańskiej e-mail: Mikolaj.Morzy@cs.put.poznan.pl Abstrakt. Duże wolumeny danych zawierają

Bardziej szczegółowo

TEXT MINING JAKO NARZĘDZIE POZYSKIWANIA INFORMACJI Z DOKUMENTÓW TEKSTOWYCH

TEXT MINING JAKO NARZĘDZIE POZYSKIWANIA INFORMACJI Z DOKUMENTÓW TEKSTOWYCH TEXT MINING JAKO NARZĘDZIE POZYSKIWANIA INFORMACJI Z DOKUMENTÓW TEKSTOWYCH Paweł Lula Akademia Ekonomiczna w Krakowie, Katedra Informatyki Stale i szybko rosnące zasoby informacyjne są jedną z cech współczesności.

Bardziej szczegółowo

Data mining w wielkich złożonych systemach

Data mining w wielkich złożonych systemach Zakład Zaawansowanych Technik Informacyjnych (Z-6) Data mining w wielkich złożonych systemach Praca statutowa nr 06300018 Warszawa, grudzień 2008 Data mining w wielkich złożonych systemach Praca statutowa

Bardziej szczegółowo

Analiza i eksploracja danych biznesowych

Analiza i eksploracja danych biznesowych Analiza i eksploracja danych biznesowych Business Intelligence systemy wspomagania decyzji Dr inż. Marcin Blachnik Plan zajęć 1. Dane czym są i jak je reprezentować 2. Metody analizy statystycznej (małe

Bardziej szczegółowo

ALGORYTMIZACJA METOD OBLICZANIA PODOBIEŃSTWA STATKÓW DLA WSPOMAGANIA PROJEKTOWANIA WSTĘPNEGO...

ALGORYTMIZACJA METOD OBLICZANIA PODOBIEŃSTWA STATKÓW DLA WSPOMAGANIA PROJEKTOWANIA WSTĘPNEGO... Spis treści 1. WPROWADZENIE... 6 1.1 Przegląd literatury - stan wiedzy... 6 1.1.1 Sztuczna inteligencja i systemy hybrydowe... 6 1.1.2 Opis metodologii CBR... 7 1.1.3 Przykład zastosowania CBR w okrętownictwie...

Bardziej szczegółowo

Podobieństwo i klasyfikacja dźwięku w kontekście rekomendacji muzycznej

Podobieństwo i klasyfikacja dźwięku w kontekście rekomendacji muzycznej PRACA MAGISTERSKA Podobieństwo i klasyfikacja dźwięku w kontekście rekomendacji muzycznej Mariusz Kleć nr albumu: s3547 Kierunek: Informatyka Specjalność: Multimedia Promotor: prof. dr hab. Krzysztof Marasek

Bardziej szczegółowo

Wprowadzenie do technologii informacyjnej.

Wprowadzenie do technologii informacyjnej. Wprowadzenie do technologii informacyjnej. Data mining i jego biznesowe zastosowania dr Tomasz Jach Definicje Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać. Eksploracja

Bardziej szczegółowo

Eksploracja danych Jacek Rumiński

Eksploracja danych Jacek Rumiński Eksploracja danych Jacek Rumiński slajd 1 Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: 3472678, fax: 3461757, e-mail: jwr@eti.pg.gda.pl Źródła, Internet, SQL/MM i inne standardy (dodatkowy

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład 2 z 5

Agnieszka Nowak Brzezińska Wykład 2 z 5 Agnieszka Nowak Brzezińska Wykład 2 z 5 metoda typ Zmienna niezależna Regresja liniowa Regresja Wszystkie ilościowe Zakłada liniową zależność, prosta w implementacji Analiza dyskryminacyjna klasyfikacja

Bardziej szczegółowo

Niepewność w wiedzy. Agnieszka Nowak - Brzezińska

Niepewność w wiedzy. Agnieszka Nowak - Brzezińska Realizacja niepewności wiedzy w systemach ekspertowych Instytut Informatyki, Uniwersytet Śląski, ul. Będzinska 39, Sosnowiec, Polska Tel (32) 2 918 381, Fax (32) 2 918 283 21 czerwca 2010 Table of contents

Bardziej szczegółowo

technologia informacyjna #1

technologia informacyjna #1 technologia informacyjna #1 Tomasz Przechlewski Strona 1 z 91 Wprowadzenie Dane, informacja, wiedza Informacja to jest przyrost wiedzy, który może być uzyskany na podstawie danych. (Tstchizris i Lochovsky)

Bardziej szczegółowo

Algorytmy genetyczne w automatycznym generowaniu gramatyk bezkontekstowych dla potrzeb syntaktycznej interpretacji wzorców

Algorytmy genetyczne w automatycznym generowaniu gramatyk bezkontekstowych dla potrzeb syntaktycznej interpretacji wzorców AKADEMIA GÓRNICZO HUTNICZA im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki mgr Dariusz Pałka Algorytmy genetyczne w automatycznym generowaniu gramatyk

Bardziej szczegółowo

Zdalna generacja sieci bayesowskich z baz danych

Zdalna generacja sieci bayesowskich z baz danych Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych Andrzej Wąsowski andy@prioris.mini.pw.edu.pl Zdalna generacja sieci bayesowskich z baz danych Praca dyplomowa pod kierunkiem dr hab. inż.

Bardziej szczegółowo

INŻYNIERIA OPROGRAMOWANIA W PROCESACH INTEGRACJI SYSTEMÓW INFORMATYCZNYCH Pod redakcją J. Górskiego, C. Orłowskiego, 2010 STRESZCZENIA

INŻYNIERIA OPROGRAMOWANIA W PROCESACH INTEGRACJI SYSTEMÓW INFORMATYCZNYCH Pod redakcją J. Górskiego, C. Orłowskiego, 2010 STRESZCZENIA INŻYNIERIA OPROGRAMOWANIA W PROCESACH INTEGRACJI SYSTEMÓW INFORMATYCZNYCH Pod redakcją J. Górskiego, C. Orłowskiego, 2010 PWNT Gdańsk STRESZCZENIA Rozdział 1. Narzędzia wspomagające generowanie aplikacji

Bardziej szczegółowo

Systemy do dogłębnej analizy danych - porównanie.

Systemy do dogłębnej analizy danych - porównanie. Systemy do dogłębnej analizy danych - porównanie. Tomasz Winiarski Rok akademicki 2000/2001 Praca licencjacka pod kierunkiem prof. dr. hab. W. Ducha Spis treści 1 Wstęp 3 2 Drażenie danych 5 2.1 Pochodzenie

Bardziej szczegółowo

Systemy wspomagania decyzji

Systemy wspomagania decyzji Systemy wspomagania decyzji Andrzej PIECZYŃSKI Wydział Elektrotechniki, Informatyki i Telekomunikacji Systemy wspomagania decyzji 1 270 Plan wykładów 1. Wprowadzenie. Iloraz inteligencji. Proces podejmowania

Bardziej szczegółowo

System informatyczny zdalnego egzaminowania

System informatyczny zdalnego egzaminowania System informatyczny zdalnego egzaminowania - strategia, logika systemu, architektura, ewaluacja (platforma informatyczna e-matura) redakcja Sławomir Wiak Konrad Szumigaj Redakcja: prof. dr hab. inż. Sławomir

Bardziej szczegółowo