EKSPLORACJA DANYCH. Data Mining
|
|
- Tomasz Kania
- 6 lat temu
- Przeglądów:
Transkrypt
1 Data Mining Definicja1: Nietrywialne wydobywanie ukrytej, poprzednio nieznanej i potencjalnie użytecznej informacji z danych (W.Frawley, G. Piatetsky-Shapiro, C. Matheus. Knowledge Discovery in Databases: An Overview. AI Magazine, Jesień 1992) Definicja2: Nauka zajmująca się wydobywaniem informacji z dużych zbiorów danych lub baz danych (D. Hand, H. Mannila, P. Smyt. Principles of Data Mining. MIT Press, Cambridge, MA, 2001)
2 Data Mining Firmy z silnym nastawieniem na klienta (i dużymi bazami danych): Sieci sklepów Firmy finansowe Firmy telekomunikacyjne Firmy marketingowe Pomoc w znalezieniu relacji między czynnikami: wewnętrznymi : i zewnętrznymi
3 Data Mining Zastosowanie inteligentnych metod do wydobycia zależności, wzorców. Popularny przykład (ale czy prawdziwy?): mężczyźni+pieluchy+piątek=piwo Zastosowania (USA): Blockbuster proponuje filmy na podstawie historii wypożyczeń American Express proponuje produkty posiadaczom kart na podstawie analizy miesięcznych wydatków Zastosowania techniczne np.analiza procesu wytwórczego
4 Data Mining Obszary zastosowań Wyszukiwanie asocjacji (pieluchy-piwo) Klasyfikacja(wartości dyskretne), predykcja(wartości ciągłe) Grupowanie (ang. clustering) Eksploracja złożonych typów danych
5 Data Mining Klasyfikacja, predykcja Drzewa decyzyjne Modele Bayes'a Sieci neuronowe Alg. Genetyczne Zbiory rozmyte i przybliżone Statystyczna regresja wielowymiarowa, inne rodzaje regresji (predykcja)
6 Data Mining Przykłady danych produkcyjnych; Przygotowanie danych
7 paleta 1- H paleta 2 - H/B paleta 3 - B Przykłady istniejącej dokumentacji w zakładzie produkcyjnym: ANALIZA BRAKÓW WSTAWEK D wytop RODZAJE WAD Paleta 1 Paleta 2 Paleta 3 Suma ODLEWNICZYCH sztuki % sztuki % sztuki % sztuki % Brak rdzenia i wtopki 0 0,00 4 4,30 0 0,00 4 1,30 Jamy skurczowe 7 5, ,75 7 8, ,82 Niedolew 5 3,88 1 1,08 5 5, ,58 Niespaw 0 0,00 1 1,08 0 0,00 1 0,33 Odklejona wtopka 4 3,10 0 0,00 2 2,35 6 1,95 Pęcherze 26 20,16 1 1,08 1 1, ,12 Porowatość 0 0,00 0 0,00 0 0,00 0 0,00 Przestawienia 0 0,00 0 0,00 0 0,00 0 0,00 Przypalenia 0 0,00 0 0,00 0 0,00 0 0,00 Uszkodzenia mechaniczne 1 0,78 2 2,15 0 0,00 3 0,98 Wady ucha 5 3, , , ,64 Wciągnięcia 2 1,55 3 3,23 4 4,71 9 2,93 Wypchnięcia 0 0,00 0 0,00 0 0,00 0 0,00 Wypłynięcia 0 0,00 0 0,00 0 0,00 0 0,00 Zagazowanie 0 0,00 0 0,00 1 1,18 1 0,33 Zagłębiona wtopka 2 1,55 8 8, , ,79 Zalane dylatacje 9 6,98 2 2,15 6 7, ,54 Zalewki 0 0,00 0 0,00 0 0,00 0 0,00 Zapiaszczenie 35 27,13 8 8,60 1 1, ,33 Zniszczona forma 2 1,55 2 2,15 2 2,35 6 1,95 Zniszczony rdzeń 0 0,00 0 0,00 0 0,00 0 0,00 Zażużlenia 31 24,03 4 4,30 0 0, ,40 Dobre 0 0,00 0 0,00 0 0,00 0 0,00 Suma , , , ,00
8 Przykłady opracowanych formularzy elektronicznych: Karta 1. BIEŻĄCE POMIARY WŁASNOŚCI MASY Z MIESZARKI Data Oznaczenia odlewów Brygada Nr wytopu Asortyment Żródło: b b b C "Żywiec" A DO E DO B DO H DO-380 Nr pomiaru Godzina Nr mieszarki Wilgotność [%] Przepuszczalność [10-8 /Pa*s] Zagęszczalność [%] R c w [kpa] Żródło: a, c a a, c a, c a, c a, c 1 0:15 2 5,00 220,00 54,00 135,00 2 0:15 3 4,60 230,00 55,00 130, :00 1 4,40 220,00 43,00 145, :00 3 4,60 200,00 42,00 155, :00 1 4,40 210,00 41,00 150, :00 3 4,60 195,00 42,00 155, :40 1 4,60 205,00 40,00 150, :40 3 4,40 200,00 38,00 145, :20 1 4,60 210,00 40,00 145, :20 3 4,40 195,00 38,00 140, :20 1 4,00 195,00 37,00 140, :20 3 4,40 190,00 40,00 150, :20 1 4,20 200,00 38,00 150, :20 3 4,20 195,00 38,00 140,00 Uwagi bieżące
9 Przetwarzanie danych Generowanie zbioru uczącego
10 Data Mining Jądrem Data Mining są systemy uczące się W praktyce często występują procesy o niezidentyfikowanej lub bardzo złożonej naturze fizycznej. Modelowanie tego typu problemów sprowadza się do znalezienia zależności między sygnałami wejściowymi a sygnałami wyjściowymi (wynikowymi) w oparciu o pewną liczbę zaobserwowanych przypadków. Tego typu narzędzia matematyczne znajdują zastosowanie przy projektowaniu i realizacji procesów produkcyjnych. Jedną z korzyści, jakie może dać modelowanie procesów produkcyjnych jest wskazanie wielkości odgrywających dominującą czy przynajmniej bardzo znaczącą, albo też znikomą bądź żadną, rolę w procesie (np. w wykrywanie przyczyn awarii urządzeń, zakłóceń procesów technologicznych, określaniu parametrów procesu technologicznego decydujących o jakości wyrobu i w innych tego typu sytuacjach).
11 Analiza danych Systemy uczące się Modelowanie zjawisk bardzo złożonych o niezbadanej naturze fizycznej, a zwłaszcza poszukiwanie prawidłowości w warunkach dużej liczby zmiennych o różnym charakterze. Sztuczne sieci neuronowe Drzewa klasyfikacyjne i regresyjne Naiwny klasyfikator Bayesa Sprawdzenie przydatności do modelowania procesów związanych z wytwarzaniem form i odlewów oraz ich właściwości
12 Neuron biologiczny Sztuczne sieci neuronowe
13 Drzewa decyzyjne Idea Człowiek posiada tę umiejętność, że na podstawie przeszłych doświadczeń potrafi trafnie sklasyfikować nowy przypadek i podjąć wobec niego dobrą decyzję. My więc chcielibyśmy tego samego nauczyć komputer. Dając mu ''bagaż'' doświadczeń, czyli informację o przypadkach określonego typu, chcielibyśmy, aby podejmował racjonalną decyzję. Racjonalną znaczy najbliższą indukowanym regułom, które w jego mniemaniu zostały użyte do podjęcia tych dobrych decyzji i jednocześnie o niskim przewidywalnym poziomie pomyłek.
14 Drzewa decyzyjne Do tych właśnie celów wymyślono drzewa decyzyjne, które na stałe wpisały się w poczet elementów uczenia maszynowego. Na podstawie dostarczonego zbioru faktów i reguł maszyna uczy się jak sklasyfikować nowe przypadki. Zbiór faktów na podstawie, których będziemy wnioskować nazywamy Training Set, natomiast nowe przypadki, które będziemy chcieli zaklasyfikować to Test Set. Klasyfikacja polega na stwierdzeniu w jakiej kategorii umieścić nowy przypadek, zwykle jest to podział binarny na true lub false itp. Training Set jest zbiorem rekordów o tej samej strukturze, na którą składają się pary typu atrybut/wartość atrybutu. Ponadto każdy rekord jest przyporządkowany do odpowiedniej kategorii. Na podstawie wartości tych atrybutów i Training Set próbujemy sklasyfikować nowe przypadki, w których mamy dane jedynie atrybuty i ich wartości.
15 Drzewa Uczenie drzew Założenia: przykłady są reprezentowane przez pary <atrybut, wartość> Każdy przykład jest opisany przez zestaw atrybutów, każdy atrybut może przyjmować różne wartości. Wartości muszą być dyskretne, w przypadku ciągłych dokonuje się dyskretyzacji tej wartości na kilka przedziałów. Oczywiści im mniej wartości może przyjmować atrybut, tym lepiej drzewo będzie mniej rozbudowane. funkcja docelowa musi przyjmować wartości dyskretne ciąg uczący może zawierać błędy ciąg uczący może zawierać atrybuty które nie mają określonej wartości
16 Drzewa Drzewo : Wewnętrzne węzły test na atrybucie Gałęzie wyniki testu Liście klasy Przykładowe drzewo (wskazujące, czy klient kupi komputer, czy nie):
17 Drzewa Przykładowe drzewo
18 Drzewa Przykładowe drzewo z programu komercyjnego
19 Naiwny klasyfiktor Bayesa U podstaw stosowanych mechanizmów wnioskowania wykorzystywanych do uczenia się, leży twierdzenie Bayesa. Ugruntowane teoretycznie i praktyczne zastosowania tego twierdzenia stanowią trzy główne grupy probabilistycznych metod uczenia się, a mianowicie: metody klasyfikacji bayesowskiej, sieci bayesowskie i metody oparte na zasadzie minimalnej długości kodu. Do najczęściej stosowanych metod klasyfikacji bayesowskiej należy naiwny klasyfikator bayesowski, zwany również niezależnym klasyfikatorem bayesowskim, w skrócie NKB. Jest to zdecydowanie najbardziej efektywny obliczeniowo praktyczny algorytm uczenia się pojęć.
20 Naiwny klasyfiktor Bayesa Pojęcia są jedną z postaci naszej wiedzy o świecie, używaną do opisywania i interpretowania zmysłowych obserwacji oraz abstrakcyjnych idei. Pojęcia służą do klasyfikowania pewnych obiektów na grupy, które naiwny klasyfikator bayesowski nazywa kategoriami. Pojęcia są zatem funkcjami przekształcającymi dziedzinę w zbór kategorii, a więc przypisują obiektom etykiety ich kategorii. W podstawowym przypadku pojęcie wyznacza podział zbioru wszystkich rozważanych obiektów, czyli dziedziny, na dwie kategorie: obiektów należących do pojęcia i obiektów nie należących do niego. O pierwszych mówi się, że są przykładami określonego pojęcia, a o drugich, że nie są przykładami tego pojęcia. Dziedziną jest zbiór obiektów, których ma dotyczyć wiedza nabywana przez naiwny klasyfikator bayesowski. Każdy obiekt, element dziedziny dla naiwnego klasyfikatora bayesowskiego jest przykładem.
21 Naiwny klasyfiktor Bayesa Dla naiwnego klasyfikatora bayesowskiego uczenia się ma charakter pewnego rodzaju odwzorowania informacji wejściowej na pewien zbiór wartości wyjściowych. Informacją wejściową są przykłady trenujące pewnej dziedziny, mające postać par złożonych z opisu obiektu i etykiety ich kategorii. Opis obiektu naiwny klasyfikator bayesowki nazywa przykładem nieetykietowanym i utożsamia z samym obiektem, a parę powstającą przez dołączenie do niego kategorii, przykładem etykietowanym. Algorytm otrzymuje wyłącznie opisy przykładów w postaci wartości atrybutów i tylko z nich może korzystać.
22 Naiwny klasyfiktor Bayesa Uczenie się naiwnego klasyfikatora Bayesa polega na znalezieniu hipotezy, która jest zgodna z pojęciem docelowym dla przykładów trenujących i która klasyfikuje również inne przykłady z dziedziny z jak najmniejszym błędem. Ma więc ona możliwie dokładnie przybliżać nieznane pojęcie docelowe.
23 Naiwny klasyfiktor Bayesa Kilka słów o teorii prawdopodobieństwa Rozważania na temat prawdopodobieństwa prowadzi się zakładając, że dana jest pewna przestrzeń zdarzeń elementarnych Ω, będąca zbiorem wszystkich zdarzeń elementarnych, przy czym zdarzeniami elementarnymi są najprostsze możliwe wyniki doświadczenia losowego. Natomiast rodzinę podzbiorów przestrzeni zdarzeń elementarnych, którą zainteresowany jest eksperymentator, nazywa się przestrzenią zdarzeń losowych F. Uporządkowaną trójkę ( Ω, F, gdzie P) P jest prawdopodobieństwem, nazywa się przestrzenią probabilistyczną.
24 Naiwny klasyfiktor Bayesa Kilka (prostych) słów o teorii prawdopodobieństwa W potocznym rozumieniu prawdopodobieństwo zajścia danego zdarzenia jest miarą szansy jego wystąpienia. Prawdopodobieństwem nazywamy funkcję P przyporządkowującą każdemu zdarzeniu losowemu A liczbę P(A), zwaną prawdopodobieństwem zajścia zdarzenia A. Często jest tak, że zajście jednego zdarzenia może wpływać na prawdopodobieństwo zajścia innego zdarzenia. Wówczas mówimy o prawdopodobieństwie warunkowym.
25 Naiwny klasyfiktor Bayesa Kilka (prostych) słów o teorii prawdopodobieństwa Często mamy do czynienia z doświadczeniami wieloetapowymi i wówczas pojawia się pytanie, jak liczyć prawdopodobieństwa zdarzeń, których zajście zależy od innych zdarzeń, które zaszły we wcześniejszych etapach doświadczeń. Do tego posłuży wzór na prawdopodobieństwo całkowite. P( A) = n i = 1 P( A / H ) P( i H i )
26 Naiwny klasyfiktor Bayesa Twierdzenie Bayesa P( A) = n i = 1 P( A/ H ) P( i H i Interpretacja się w kategoriach przyczyna-skutek - jeżeli skutek A może zajść w wyniku jednej z n przyczyn H1,... Hn, to prawdopodobieństwo wystąpienia skutku A wyraża się powyższym wzorem. Jeśli natomiast znany jest wynik drugiego etapu doświadczenia i pytamy o to co stało się w jego pierwszym etapie, to stosujemy wzór Bayesa. Interpretacja się w kategoriach przyczyna-skutek - jeżeli skutek A nastąpi w wyniku zajścia jednej z n przyczyn H1,... Hn, to prawdopodobieństwo tego, że Hk była przyczyną zajścia A wyraża się wzorem Bayesa. )
27 Naiwny klasyfiktor Bayesa Twierdzenie Bayesa W odniesieniu do probabilistycznych metod uczenia się twierdzenie Bayesa można przedstawić w sposób następujący: dla dowolnej hipotezy h H oraz zbioru danych D zachodzi równość = = n i i i k k k k H P H A P H P H A P A P A H P A H P 1 ) ( ) / ( ) ( ) / ( ) ( ) ( ) / ( Niech zdarzenia H 1,... H n F tworzą układ zupełny zdarzeń w przestrzeni probabilistycznej i niech A F będzie dowolnym ustalonym zdarzeniem o dodatnim prawdopodobieństwie. Wówczas prawdziwy jest wzór ( ) P F,, Ω ) ( ) / ( ) ( ) / ( D P h D P h P D h P =
28 Naiwny klasyfiktor Bayesa Twierdzenie Bayesa Dla dowolnej hipotezy h H oraz zbioru danych D zachodzi równość P( h / D) = P( h) P( D / h) P( D) Hipotezy są funkcjami klasyfikującymi przykłady na podstawie wartości ich atrybutów. Algorytm reprezentuje hipotezy za pomocą pewnych oszacowań prawdopodobieństw, tworzonych na podstawie zbioru trenującego. Zbiór trenujący jest jedyną podstawą wyznaczanych przez naiwny klasyfikator bayesowski oszacowań prawdopodobieństw. Przykłady klasyfikowane są poprzez wybranie dla nich kategorii najbardziej prawdopodobnej z punktu widzenia oszacowań.
29 Naiwny klasyfiktor Bayesa Czy pogoda jest dobra do gry w golfa?
30 Naiwny klasyfiktor Bayesa Zastosowanie bardzo popularne Wyszukiwarki internetowe Instalator bieżącej wersji programu Śmieciarek NxG instaluje pliki z podstawową bazą słów, dzięki której już od pierwszego uruchomienia program potrafi automatycznie klasyfikować wiadomości. Baza podstawowych słów jest jednak dość uboga i program powinien być uczony rozpoznawania wiadomości w miarę jak odbierana jest poczta. Z podstawową bazą słów program może się mylić, jednak szybkie reagowanie na te pomyłki i ręczna reklasyfikacja wiadomości pozwoli na coraz lepsze rozróżnianie różnych kategorii wiadomości . O uczeniu programu przeczytasz w pomocy do programu. Jeśli chcesz samodzielnie uczyć program rozpoznawania wiadomości od samego początku, wybierz pustą bazę słów. Jeśli natomiast chcesz, aby już od pierwszej chwili program rozpoznawał wiadomości i klasyfikował je, wybierz podstawową bazę słów.
31 Zagadnienie produkcyjne Dane produkcyjne Przyjęty sposób zapisu umożliwia przetwarzanie i formatowanie danych za pomocą odpowiednio stworzonego oprogramowania. W ten sposób uzyskuje się zbiory danych uczących, wykorzystywane następnie do uczenia. Fragment przykładowego formularza do zbierania informacji o parametrach mas formierskich Wygenerowany zbiór danych uczących
32 Identyfikacja przyczyn powstawania wad w odlewach Produkcja klocków hamulcowych Zestaw danych Konfiguracja 1 Dane wejściowe: Wilgotność Przepuszczalność Dane wyjściowe: Wada zapiaszczenie - % braków Zagęszczalność Wytrzymałość Temperatura Wilgotność masy zwrotnej
33 Wspomaganie decyzji odnośnie dodatków odświeżających do syntetycznych mas formierskich Produkcja klocków hamulcowych Zestaw danych Konfiguracja 2 Dane wejściowe: Dane wyjściowe: Wilgotność Dodatek wody Przepuszczalność Zagęszczalność Wytrzymałość Dodatek pyłu Dodatek bentonitu Dodatek piasku
34 Dyskretyzacja danych Dlaczego stosujemy proces dyskretyzacji danych ciągłych? Większość zmiennych, z którymi mamy do czynienia przy rozwiązywaniu rzeczywistych problemów, jest ciągła. Dlatego, aby ciągły atrybut mógł być użyty, musi zostać poddany procesowi dyskretyzacji. Proces ten polega na podzieleniu całego zbioru wartości (dziedziny atrybutu) na podzbiory (przedziały) o określonych własnościach. Każdy z takich przedziałów, u tworzonych w procesie dyskretyzacji, może być wtedy utożsamiany z jedną wartością dyskretną nowego" atrybutu, równoważnemu.
35 Dyskretyzacja danych Kiedy stosujemy? Dla algorytmów, które nie mają mechanizmów przetwarzania atrybutów ciągłych, dyskretyzacja jest nieodzownym warunkiem stosowalności do dziedzin, w których atrybuty takie występują. Zdecydowana poprawa efektywności obliczeniowej procesu uczenia się dzięki zastąpieniu wielu wartości atrybutu ciągłego niewielką liczbą wartości dyskretyzowanych (obniżenie nakładu obliczeń) Zwiększenie prostoty oraz czytelności hipotez: hipotezy, które bezpośrednio wykorzystują atrybuty ciągłe mogą być zbyt złożone i nieczytelne. Pod wpływem dyskretyzacji hipotezy mogą okazać się prostsze i łatwiejsze do interpretacji.
36 Dyskretyzacja danych Metody Dyskretyzacja wg równej częstości: Zakres wartości atrybutu ciągłego jest dzielony na ustaloną z góry liczbę przedziałów, jednak nie są to przedziały o równej szerokości. Ich końce dobiera się w ten sposób, aby każdemu z nich odpowiadała (możliwie) taka sama liczba przykładów trenujących.
37 Dyskretyzacja danych Metody Dyskretyzacja wg równej szerokości: Jest to najprostsza metoda dyskretyzacji. Zakres wartości dyskretyzowanego atrybutu ciągłego jest dzielony na ustaloną liczbę przedziałów o jednakowej szerokości. Każdemu przedziałowi odpowiada następnie jedna wartość dyskretna.
38 Dyskretyzacja danych Metody Dyskretyzacja zstępująca: Zgodnie z istotą podejścia zstępującego początkowo przyjmuje się cały zakres wartości jako jedyny przedział. Umieszczenie pierwszej wartości progowej dzieli go na dwa podprzedziały, z których każdy może być następnie podzielony na kolejne dwa podprzedziały itd.
39 Dyskretyzacja danych Metody Dyskretyzacja wstępująca: W przypadku dyskretyzacji wstępującej główną rolę pełni operacja mająca na celu łączenie przyległych przedziałów w jeden większy przedział. Zakończenie łączenia przedziałów za pomocą tej metody następuje po ustaleniu kryterium stopu, czyli w momencie gdy albo liczba przedziałów osiągnie wartość minimalną określoną na początku procesu lub gdy wszystkie sąsiadujące ze sobą przedziały będą na tyle różne, że algorytm sam zaprzestanie ich łączenia.
40 Dyskretyzacja danych Metody Dyskretyzacja wstępująca Przykładem metody dyskretyzacji wstępującej jest algorytm ChiMerge. Nazwa algorytmu wskazuje na wykorzystanie statystyki χ 2 (używanej do oceny czy sąsiednie przedziały można połączyć w jeden) oraz przeprowadzenie dyskretyzacji przez łączenie przedziałów. Rozpoczynając od minimalnych przedziałów pokrywających zakres dyskretyzowanego atrybutu, po jednym dla każdej jego wartości występującej w zbiorze trenującym, algorytm wielokrotnie powtarza podstawowy cykl, w którym rozważa połączenie każdej pary przyległych przedziałów (lub w ogólniejszym wariancie ich pewnej liczby k>1) i dokonuje połączenia tych, dla których da to według stosowanej heurystyki najlepsze efekty. W algorytmie ChiMerge funkcję tej heurystyki pełni właśnie statystyka χ 2.
41 Literatura [1] Data Mining. Przegląd metod eksploracji danych.mateusz Kobos [2] Drzewo decyzyjne C4_5, czyli jak nauczyć komputer odróżniać dobro od zła. Nikos Drakos, Ross Moore (The translation was initiated by Przemyslaw Strzelczak ) [3] Metody i techniki pozyskiwania wiedzy z danych oraz komputerowego wspomagania decyzji dla potrzeb administracji państwowej.raport końcowy z realizacji zadania. Politechnika Warszawska.
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym
POLITECHNIKA WARSZAWSKA Instytut Technik Wytwarzania Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym Marcin Perzyk Dlaczego eksploracja danych?
Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
Systemy uczące się wykład 1
Systemy uczące się wykład 1 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 5 X 2018 e-mail: przemyslaw.juszczuk@ue.katowice.pl Konsultacje: na stronie katedry + na stronie domowej
Systemy uczące się wykład 2
Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania
Klasyfikacja metodą Bayesa
Klasyfikacja metodą Bayesa Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski warunkowe i bezwarunkowe 1. Klasyfikacja Bayesowska jest klasyfikacją statystyczną. Pozwala przewidzieć prawdopodobieństwo
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW
Czego moga się nauczyć komputery? Andrzej Skowron, Hung Son Nguyen son@mimuw.edu.pl; skowron@mimuw.edu.pl Instytut Matematyki, Wydział MIM, UW colt.tex Czego mogą się nauczyć komputery? Andrzej Skowron,
Proces odkrywania wiedzy z baz danych
Proces odkrywania wiedzy z baz danych Wydział Informatyki Politechnika Białostocka Marcin Czajkowski email: m.czajkowski@pb.edu.pl Świat pełen danych Świat pełen danych Możliwości analizowania i zrozumienia
Algorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe
PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"
PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 4. UCZENIE SIĘ INDUKCYJNE Częstochowa 24 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska WSTĘP Wiedza pozyskana przez ucznia ma charakter odwzorowania
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania
Przykład eksploracji danych o naturze statystycznej Próba 1 wartości zmiennej losowej odległość
Dwie metody Klasyczna metoda histogramu jako narzędzie do postawienia hipotezy, jaki rozkład prawdopodobieństwa pasuje do danych Indukcja drzewa decyzyjnego jako metoda wykrycia klasyfikatora ukrytego
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych
- Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku 1 - - 2 3 4 5 - The purpose of computing is insight, not numbers Richard Hamming Motywacja - Mamy informację,
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne) Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski Klasyfikacja i predykcja. Odkrywaniem reguł klasyfikacji nazywamy proces znajdowania
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Widzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Metody probabilistyczne klasyfikatory bayesowskie
Konwersatorium Matematyczne Metody Ekonomii narzędzia matematyczne w eksploracji danych First Prev Next Last Go Back Full Screen Close Quit Metody probabilistyczne klasyfikatory bayesowskie Wykład 8 Marcin
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Statystyka i eksploracja danych
Wykład I: Formalizm statystyki matematycznej 17 lutego 2014 Forma zaliczenia przedmiotu Forma zaliczenia Literatura Zagadnienia omawiane na wykładach Forma zaliczenia przedmiotu Forma zaliczenia Literatura
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Dyskretyzacja - definicja Dyskretyzacja - zamiana atrybutów
Wprowadzenie do uczenia maszynowego
Wprowadzenie do uczenia maszynowego Agnieszka Ławrynowicz 12 stycznia 2017 Co to jest uczenie maszynowe? dziedzina nauki, która zajmuje się sprawianiem aby komputery mogły uczyć się bez ich zaprogramowania
ALGORYTMY SZTUCZNEJ INTELIGENCJI
ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Indukowane Reguły Decyzyjne I. Wykład 3
Indukowane Reguły Decyzyjne I Wykład 3 IRD Wykład 3 Plan Powtórka Grafy Drzewa klasyfikacyjne Testy wstęp Klasyfikacja obiektów z wykorzystaniem drzewa Reguły decyzyjne generowane przez drzewo 2 Powtórzenie
6.4 Podstawowe metody statystyczne
156 Wstęp do statystyki matematycznej 6.4 Podstawowe metody statystyczne Spóbujemy teraz w dopuszczalnym uproszczeniu przedstawić istotę analizy statystycznej. W szczególności udzielimy odpowiedzi na postawione
RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 1. L. Kowalski, Statystyka, 2005
RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 1. Literatura: Marek Cieciura, Janusz Zacharski, Metody probabilistyczne w ujęciu praktycznym, L. Kowalski, Statystyka, 2005 R.Leitner, J.Zacharski, "Zarys matematyki
Rachunek prawdopodobieństwa
Rachunek prawdopodobieństwa Sebastian Rymarczyk srymarczyk@afm.edu.pl Tematyka zajęć 1. Elementy kombinatoryki. 2. Definicje prawdopodobieństwa. 3. Własności prawdopodobieństwa. 4. Zmienne losowe, parametry
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
Systemy uczące się Lab 4
Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego
Rachunek prawdopodobieństwa- wykład 2
Rachunek prawdopodobieństwa- wykład 2 Pojęcie dyskretnej przestrzeni probabilistycznej i określenie prawdopodobieństwa w tej przestrzeni dr Marcin Ziółkowski Instytut Matematyki i Informatyki Uniwersytet
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Wprowadzenie do teorii systemów ekspertowych
Myślące komputery przyszłość czy utopia? Wprowadzenie do teorii systemów ekspertowych Roman Simiński siminski@us.edu.pl Wizja inteligentnych maszyn jest od wielu lat obecna w literaturze oraz filmach z
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
IX EKSPLORACJA DANYCH
Zastosowanie drzew decyzyjnych do analizy danych Artur Soroczyński Politechnika Warszawska Instytut Technologii Materiałowych Terminologia Datamining Drzewa decyzyjne Plan wykładu Przykład wykorzystania
Metody klasyfikacji danych - część 1 p.1/24
Metody klasyfikacji danych - część 1 Inteligentne Usługi Informacyjne Jerzy Dembski Metody klasyfikacji danych - część 1 p.1/24 Plan wykładu - Zadanie klasyfikacji danych - Przeglad problemów klasyfikacji
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.
Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe. zajecia.jakubw.pl/nai Literatura: S. Osowski, Sieci neuronowe w ujęciu algorytmicznym. WNT, Warszawa 997. PODSTAWOWE ZAGADNIENIA TECHNICZNE AI
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Prawdopodobieństwo i statystyka
Wykład I: Formalizm teorii prawdopodonieństwa 6 października 2014 Forma zaliczenia przedmiotu Forma zaliczenia Literatura Dostępność treści wykładów 1 Zaliczenie ćwiczeń rachunkowych. 2 Egzamin dwuczęściowy:
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel
według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology
Mail: Pokój 214, II piętro
Wykład 2 Mail: agnieszka.nowak@us.edu.pl Pokój 214, II piętro http://zsi.tech.us.edu.pl/~nowak Predykcja zdolność do wykorzystania wiedzy zgromadzonej w systemie do przewidywania wartości dla nowych danych,
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące
Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów
Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie
4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74
3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15
Spacery losowe generowanie realizacji procesu losowego
Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z
Testowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
Prawdopodobieństwo. Prawdopodobieństwo. Jacek Kłopotowski. Katedra Matematyki i Ekonomii Matematycznej SGH. 16 października 2018
Katedra Matematyki i Ekonomii Matematycznej SGH 16 października 2018 Definicja σ-algebry Definicja Niech Ω oznacza zbiór niepusty. Rodzinę M podzbiorów zbioru Ω nazywamy σ-algebrą (lub σ-ciałem) wtedy
Metody Sztucznej Inteligencji II
17 marca 2013 Neuron biologiczny Neuron Jest podstawowym budulcem układu nerwowego. Jest komórką, która jest w stanie odbierać i przekazywać sygnały elektryczne. Neuron działanie Jeżeli wartość sygnału
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych ELEMENTY SZTUCZNEJ INTELIGENCJI Laboratorium nr 6 SYSTEMY ROZMYTE TYPU MAMDANIEGO
WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU
WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU Nazwa w języku polskim: Eksploracja Danych Nazwa w języku angielskim: Data Mining Kierunek studiów (jeśli dotyczy): MATEMATYKA I STATYSTYKA Stopień studiów i forma:
Elementy inteligencji obliczeniowej
Elementy inteligencji obliczeniowej Paweł Liskowski Institute of Computing Science, Poznań University of Technology 9 October 2018 1 / 19 Perceptron Perceptron (Rosenblatt, 1957) to najprostsza forma sztucznego
Spis treści Przedmowa
Spis treści Przedmowa 1. Wprowadzenie do problematyki konstruowania - Marek Dietrich (p. 1.1, 1.2), Włodzimierz Ozimowski (p. 1.3 -i-1.7), Jacek Stupnicki (p. l.8) 1.1. Proces konstruowania 1.2. Kryteria
Pattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
SYSTEMY UCZĄCE SIĘ WYKŁAD 3. DRZEWA DECYZYJNE. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 3. DRZEWA DECYZYJNE Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska BUDOWA DRZEW DECYZYJNYCH Drzewa decyzyjne są metodą indukcyjnego
Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013 http://www.wilno.uwb.edu.
SYLLABUS na rok akademicki 01/013 Tryb studiów Studia stacjonarne Kierunek studiów Informatyka Poziom studiów Pierwszego stopnia Rok studiów/ semestr /3 Specjalność Bez specjalności Kod katedry/zakładu
1.1 Rachunek prawdopodobieństwa
Spis treści Spis treści 1 Wstęp 1 1.1 Rachunek prawdopodobieństwa.................. 1 1.2 Literatura.............................. 1 1.3 Podstawy.............................. 2 2 Miara prawdopodobieństwa
Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,
Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której
8. Neuron z ciągłą funkcją aktywacji.
8. Neuron z ciągłą funkcją aktywacji. W tym ćwiczeniu zapoznamy się z modelem sztucznego neuronu oraz przykładem jego wykorzystania do rozwiązywanie prostego zadania klasyfikacji. Neuron biologiczny i
Sztuczna inteligencja : Algorytm KNN
Instytut Informatyki Uniwersytetu Śląskiego 23 kwietnia 2012 1 Algorytm 1 NN 2 Algorytm knn 3 Zadania Klasyfikacja obiektów w oparciu o najbliższe obiekty: Algorytm 1-NN - najbliższego sąsiada. Parametr
Wprowadzenie do programu RapidMiner Studio 7.6, część 4 Michał Bereta
Wprowadzenie do programu RapidMiner Studio 7.6, część 4 Michał Bereta www.michalbereta.pl W tej części: Zachowanie wytrenowanego modelu w celu późniejszego użytku Filtrowanie danych (brakujące etykiety
Spis treści. Przedmowa 11
Podstawy konstrukcji maszyn. T. 1 / autorzy: Marek Dietrich, Stanisław Kocańda, Bohdan Korytkowski, Włodzimierz Ozimowski, Jacek Stupnicki, Tadeusz Szopa ; pod redakcją Marka Dietricha. wyd. 3, 2 dodr.
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia
Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2
Data Mining Wykład 2 Odkrywanie asocjacji Plan wykładu Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych Geneza problemu Geneza problemu odkrywania reguł
Teoria systemów uczacych się i wymiar Vapnika-Chervonenkisa
Systemy uczace się 2009 1 / 32 Teoria systemów uczacych się i wymiar Vapnika-Chervonenkisa Hung Son Nguyen Wydział Matematyki, Informatyki i Mechaniki Uniwersytet Warszawski email: son@mimuw.edu.pl Grudzień
Podstawy Sztucznej Inteligencji (PSZT)
Podstawy Sztucznej Inteligencji (PSZT) Paweł Wawrzyński Uczenie maszynowe Sztuczne sieci neuronowe Plan na dziś Uczenie maszynowe Problem aproksymacji funkcji Sieci neuronowe PSZT, zima 2013, wykład 12
Uczenie sieci neuronowych i bayesowskich
Wstęp do metod sztucznej inteligencji www.mat.uni.torun.pl/~piersaj 2009-01-22 Co to jest neuron? Komputer, a mózg komputer mózg Jednostki obliczeniowe 1-4 CPU 10 11 neuronów Pojemność 10 9 b RAM, 10 10
w ekonomii, finansach i towaroznawstwie
w ekonomii, finansach i towaroznawstwie spotykane określenia: zgłębianie danych, eksploracyjna analiza danych, przekopywanie danych, męczenie danych proces wykrywania zależności w zbiorach danych poprzez
technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych.
Informatyka Coraz częściej informatykę utoŝsamia się z pojęciem technologii informacyjnych. Za naukową podstawę informatyki uwaŝa się teorię informacji i jej związki z naukami technicznymi, np. elektroniką,
JAKIEGO RODZAJU NAUKĄ JEST
JAKIEGO RODZAJU NAUKĄ JEST INFORMATYKA? Computer Science czy Informatyka? Computer Science czy Informatyka? RACZEJ COMPUTER SCIENCE bo: dziedzina ta zaistniała na dobre wraz z wynalezieniem komputerów
Wykład 11: Podstawowe pojęcia rachunku prawdopodobieństwa
Wykład : Podstawowe pojęcia rachunku prawdopodobieństwa dr Mariusz Grządziel 3 maja 203 Doświadczenie losowe Doświadczenie nazywamy losowym, jeśli: może być powtarzane (w zasadzie) w tych samych warunkach;
Odkrywanie wiedzy w danych
Inżynieria Wiedzy i Systemy Ekspertowe Odkrywanie wiedzy w danych dr inż. Michał Bereta Politechnika Krakowska http://torus.uck.pk.edu.pl/~beretam/ beretam@torus.uck.pk.edu.pl 1 Data Mining W pewnym teleturnieju
Transformacja wiedzy w budowie i eksploatacji maszyn
Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces
O badaniach nad SZTUCZNĄ INTELIGENCJĄ
O badaniach nad SZTUCZNĄ INTELIGENCJĄ Wykład 7. O badaniach nad sztuczną inteligencją Co nazywamy SZTUCZNĄ INTELIGENCJĄ? szczególny rodzaj programów komputerowych, a niekiedy maszyn. SI szczególną własność
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych
Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki
Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych);
Projekt Sieci neuronowe
Projekt Sieci neuronowe Chmielecka Katarzyna Gr. 9 IiE 1. Problem i dane Sieć neuronowa miała za zadanie nauczyć się klasyfikować wnioski kredytowe. W projekcie wykorzystano dane pochodzące z 110 wniosków
O badaniach nad SZTUCZNĄ INTELIGENCJĄ
O badaniach nad SZTUCZNĄ INTELIGENCJĄ Jak określa się inteligencję naturalną? Jak określa się inteligencję naturalną? Inteligencja wg psychologów to: Przyrodzona, choć rozwijana w toku dojrzewania i uczenia
Programowanie komputerów
Programowanie komputerów Wykład 1-2. Podstawowe pojęcia Plan wykładu Omówienie programu wykładów, laboratoriów oraz egzaminu Etapy rozwiązywania problemów dr Helena Dudycz Katedra Technologii Informacyjnych
prawda symbol WIEDZA DANE komunikat fałsz liczba INFORMACJA (nie tyko w informatyce) kod znak wiadomość ENTROPIA forma przekaz
WIEDZA prawda komunikat symbol DANE fałsz kod INFORMACJA (nie tyko w informatyce) liczba znak forma ENTROPIA przekaz wiadomość Czy żyjemy w erze informacji? TAK Bo używamy nowego rodzaju maszyn maszyn
Zdarzenia losowe i prawdopodobieństwo
Rozdział 1 Zdarzenia losowe i prawdopodobieństwo 1.1 Klasyfikacja zdarzeń Zdarzenie elementarne pojęcie aprioryczne, które nie może być zdefiniowane. Odpowiednik pojęcia punkt w geometrii. Zdarzenie elementarne
Modelowanie motywów łańcuchami Markowa wyższego rzędu
Modelowanie motywów łańcuchami Markowa wyższego rzędu Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki 23 października 2008 roku Plan prezentacji 1 Źródła 2 Motywy i ich znaczenie Łańcuchy
WYKŁAD 11 Uczenie maszynowe drzewa decyzyjne
WYKŁAD 11 Uczenie maszynowe drzewa decyzyjne Reprezentacja wiedzy w postaci drzew decyzyjnych entropia, przyrost informacji algorytmy ID3, C4.5 problem przeuczenia wyznaczanie reguł rzykładowe drzewo decyzyjne
Statystyka w pracy badawczej nauczyciela
Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem
Uczenie się maszyn. Dariusz Banasiak. Katedra Informatyki Technicznej Wydział Elektroniki
Dariusz Banasiak Katedra Informatyki Technicznej Wydział Elektroniki Machine Learning (uczenie maszynowe, uczenie się maszyn, systemy uczące się) interdyscyplinarna nauka, której celem jest stworzenie
Systemy liczbowe. 1. Przedstawić w postaci sumy wag poszczególnych cyfr liczbę rzeczywistą R = (10).
Wprowadzenie do inżynierii przetwarzania informacji. Ćwiczenie 1. Systemy liczbowe Cel dydaktyczny: Poznanie zasad reprezentacji liczb w systemach pozycyjnych o różnych podstawach. Kodowanie liczb dziesiętnych
KIERUNKOWE EFEKTY KSZTAŁCENIA
KIERUNKOWE EFEKTY KSZTAŁCENIA Wydział: Matematyki Kierunek studiów: Matematyka i Statystyka (MiS) Studia w j. polskim Stopień studiów: Pierwszy (1) Profil: Ogólnoakademicki (A) Umiejscowienie kierunku
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Jeśli X jest przestrzenią o nieskończonej liczbie elementów:
Logika rozmyta 2 Zbiór rozmyty może być formalnie zapisany na dwa sposoby w zależności od tego z jakim typem przestrzeni elementów mamy do czynienia: Jeśli X jest przestrzenią o skończonej liczbie elementów
2
1 2 3 4 5 Dużo pisze się i słyszy o projektach wdrożeń systemów zarządzania wiedzą, które nie przyniosły oczekiwanych rezultatów, bo mało kto korzystał z tych systemów. Technologia nie jest bowiem lekarstwem