Eksploracja danych: problemy i rozwiązania
|
|
- Włodzimierz Piasecki
- 9 lat temu
- Przeglądów:
Transkrypt
1 V Konferencja PLOUG Zakopane Październik 1999 Eksploracja danych: problemy i rozwiązania Tadeusz Morzy morzy@put.poznan.pl Instytut Informatyki Politechnika Poznańska Streszczenie Artykuł zawiera krótką genezę i opis aktualnego stanu rozwoju ważnej i bardzo intensywnie rozwijanej w ostatnim czasie dziedziny eksploracji danych. Artykuł zawiera krótki przegląd metod eksploracji danych, związków eksploracji danych z magazynami i systemami baz danych, oraz prezentuje możliwe dziedziny zastosowań technik eksploracji danych.
2 1. Wstęp Eksploracja danych (ang. data mining), nazywana często potocznie odkrywaniem wiedzy w bazach danych (ang. knowledge discovery in databases), jest jedną z najdynamiczniej i najintensywniej rozwijanych dziedzin informatyki w ostatnim czasie. Integruje wiele dyscyplin takich jak: statystyka, systemy baz danych, sztuczna inteligencja, optymalizacja, obliczenia równoległe. Olbrzymie zainteresowanie eksploracją danych wynika z faktu, że szereg przedsiębiorstw, instytucji administracji publicznej czy wreszcie ośrodków naukowych nagromadziło w ostatnim czasie bardzo wiele danych przechowywanych w zakładowych bazach danych i stanęło przed problemem, w jaki sposób efektywnie i racjonalnie wykorzystać nagromadzoną w tych bazach wiedzę dla celów wspomagania swojej działalności biznesowej. Tradycyjny sposób korzystania z baz danych sprowadza się, najczęściej, do realizacji zapytań poprzez aplikacje lub raporty. Sposób w jaki użytkownik korzysta z bazy danych (w jaki realizuje do niej dostęp) nazywamy modelem przetwarzania. Tradycyjny model przetwarzania przetwarzanie transakcji w trybie on-line (ang. on line transaction processing OLTP) jest w pełni satysfakcjonujący w przypadku bieżącej obsługi działalności danej firmy, dla dobrze zdefiniowanych procesów (obsługa klienta w banku, rejestracja zamówień, obsługa sprzedaży, itp.). Niestety, ten klasyczny model przetwarzania danych nie wspomaga procesów analizy danych oraz aplikacji wspomagających podejmowanie decyzji. Szereg przedsiębiorstw dysponuje olbrzymimi bazami danych. Dysponując danymi w bazie danych opisującymi działalność dużego supermarketu w dłuższym przedziale czasu (sprzedaż produktów, zamówienia, stan rezerw) możemy postawić szereg pytań: W jaki sposób wykorzystać przechowywane dane do usprawnienia funkcjonowania firmy? Jakie czynniki kształtują taki a nie inny popyt na produkty? Czym różnią się klienci supermarketu w Poznaniu i Warszawie? Jakie produkty kupują klienci supermarketu najczęściej wraz z winem? Jakie oddziały supermarketu miały anormalną sprzedaż w pierwszym kwartale 1999 r? Czy można przewidzieć przyszłe zachowania klientów? Dane przechowywane w bazie danych zawierają w sobie potencjalnie olbrzymią wiedzę o otaczającym świecie. Niestety, ciągle jeszcze niedostatecznie umiemy dokonać analizy tych danych i uzyskać dostęp do zawartej w nich wiedzy. Istniejące interfejsy pomiędzy użytkownikami baz danych a bazami danych ciągle jeszcze nie wspomagają w dostatecznym stopniu nawigowania, podsumowywania, analizy czy modelowania bardzo dużych baz danych. Opracowanie i dostarczenie użytkownikom nowych interfejsów wspomagających wymienione wyżej funkcje jest zadaniem i celem badań prowadzonych w zakresie systemów magazynów i eksploracji danych. 2. OLAP weryfikacja hipotez Komercyjnie dostępne systemy transakcyjne (systemy zarządzania bazami danych SZBD) dostarczają efektywnych rozwiązań dla takich problemów jak: efektywne i bezpieczne przechowywanie danych, transakcyjne odtwarzanie danych, dostępność danych, optymalizacja dostępu do danych, zarządzanie współbieżnością. W znacznie mniejszym stopniu systemy te wspomagają operacje agregacji danych, wykonywania pewnych podsumowań czy też optymalizacji złożonych zapytań formułowanych ad hoc. W ostatnim czasie prace badawcze i rozwojowe prowadzone nad rozszerzeniem funkcjonalności systemów baz danych doprowadziły do opracowania nowego modelu przetwarzania danych, którego podstawowym celem jest wspomaganie procesów podejmowania decyzji, oraz opracowania nowego typu relacyjnej bazy danych nazwanego magazynem danych (ang. data warehouse). 2
3 Nowy model przetwarzania danych, nazwany przetwarzaniem analitycznym on-line (ang. On Line Analytical Processing OLAP), ma za zadanie wspieranie procesów analizy magazynów danych dostarczając narzędzi umożliwiających analizę magazynu w wielu wymiarach definiowanych przez użytkowników (czas, miejsce, klasyfikacja produktów, itp.). Analiza magazynu polega na obliczaniu agregatów dla zadanych wymiarów magazynu. Należy podkreślić, że proces analizy jest całkowicie sterowany przez użytkownika. Mówimy czasami o analizie danych sterowanej zapytaniami (ang. query-driven exploration). Typowym przykładem takiej analizy jest zapytanie o sprzedaż produktów w supermarkecie w kolejnych kwartałach, miesiącach, tygodniach, itp., zapytanie o sprzedaż produktów z podziałem na rodzaje produktów (AGD, produkty spożywcze, kosmetyki, itp.), czy wreszcie zapytanie o sprzedaż produktów z podziałem na oddziały supermarketu. Odpowiedzi na powyższe zapytania umożliwiają decydentom określenie wąskich gardeł sprzedaży, produktów przynoszących deficyt, itp., oraz podjęcie odpowiednich działań poprawiających sytuację. 3. Eksploracja danych odkrywanie hipotez Analiza danych w magazynie danych, zgodnie z modelem OLAP, jest sterowana całkowicie przez analityka. Analityk formułuje zapytania i dokonuje analizy danych zawartych w magazynie. Z tego punktu widzenia, OLAP można interpretować jako rozszerzenie standardu SQL o możliwości efektywnego przetwarzania złożonych zapytań zawierających agregaty. W przeciwieństwie do technologii OLAP, technologia eksploracji danych umożliwia automatyczną analizę i eksploracje danych. Problem eksploracji danych polega na efektywnym znajdowaniu nieznanych dotychczas zależności i związków pomiędzy danymi. Automatyczna eksploracja danych otwiera nowe możliwości w zakresie interakcji użytkownika z systemem bazy danych (lub magazynem danych). Przede wszystkim umożliwia formułowanie zapytań na znacznie wyższym poziomie abstrakcji aniżeli pozwala na to standard SQL. Analiza danych sterowana zapytaniami, charakterystyczna dla technologii OLAP, zakłada, że użytkownik, po pierwsze, posiada pełną wiedzę o przedmiocie analizy, i, po drugie, potrafi sterować tym procesem. Eksploracja danych umożliwia analizę danych dla problemów, które ze względu na swój rozmiar są trudne do przeprowadzenia przez człowieka oraz tych problemów, dla których nie dysponujemy pełną wiedzą tę wiedzę chcemy wydobyć z danych. To drugie zagadnienie wiąże się bezpośrednio z problemem formułowania zapytań: w jaki sposób uzyskać dostęp do danych w przypadku kiedy nie potrafimy sformułować zapytania w terminach języka dostępu do bazy danych? Jest to typowa sytuacja w systemach wspomagania podejmowania decyzji. Przykładowo, w jaki sposób zidentyfikować rekordy w bazie danych firmy telekomunikacyjnej, które odpowiadają fałszywym połączeniom? Podobnie, w przypadku kart kredytowych interesuje nas wykrycie kradzieży tych kart i ich niestandardowe wykorzystanie. W przypadku analizy danych naukowych uzyskanych z dużej liczby eksperymentów interesuje nas wykrycie ciekawych przypadków. Oczywiście, można analizować rekord po rekordzie w bazie danych rozpatrując oddzielnie każdy przypadek; podejście takie jest jednak mało realistyczne w przypadku giga i tera bajtowych baz danych. Z drugiej strony, bardzo trudno sformułować zapytanie w języku SQL, lub nawet zdefiniować procedurę składowaną, które umożliwiłoby przeprowadzenie takiej analizy. 4. Metody eksploracji danych Jak już wspomnieliśmy na wstępie termin eksploracja danych jest często używany jako synonim procesu odkrywania wiedzy w bazach danych. W literaturze czasami jednak rozróżnia się te dwa pojęcia. Zgodnie z definicją [2] termin odkrywanie wiedzy odnosi się do całego procesu, natomiast eksploracja danych stanowi tylko jeden z etapów tego procesu odnoszący się do generowania reguł. 3
4 Pozostałe etapy procesu odnoszą się do przygotowania danych, wyboru danych do eksploracji, czyszczenia danych, definiowania dodatkowej wiedzy przedmiotowej, interpretacji wyników eksploracji i ich wizualizacji. Metody eksploracji danych można podzielić, bardzo ogólnie, na 6 zasadniczych klas. Odkrywanie asocjacji Najszersza klasa metod obejmująca, najogólniej, odkrywanie różnego rodzaju nieznanych zależności w bazie danych. Metody te obejmują głównie odkrywanie asocjacji pomiędzy obiektami. Generalnie, odkrywane zależności posiadają pewne miary statystyczne określające ich wsparcie i ufność. Klastrowanie Celem tych metod jest znajdowanie skończonego zbioru klas obiektów (klastrów) w bazie danych posiadających podobne cechy. Liczba klastrów jest nieznana, stąd, proces klastrowania przebiega, najczęściej, w dwóch cyklach: cykl zewnętrzny przebiega po liczbie możliwych klastrów, cykl wewnętrzny próbuje znaleźć optymalny podział obiektów pomiędzy klastry. Odkrywanie wzorców sekwencji Odkrywanie czasowych wzorców zachowań, np. znajdowanie sekwencji notowań giełdowych, zachowań klientów ubezpieczalni, klientów supermarketów. Odkrywanie klasyfikacji Celem tych metod jest znajdowanie zależności pomiędzy klasyfikacją obiektów (klasyfikacja naturalna bądź wprowadzona przez eksperta) a ich charakterystyką. Zastosowanie: charakterystyka pacjentów, klientów kart kredytowych, pożyczkobiorców. Odkrywanie podobieństw w przebiegach czasowych Znajdowanie podobieństw w przebiegach czasowych opisujących określone procesy. Wykrywanie zmian i odchyleń Znajdowanie różnic pomiędzy aktualnymi a oczekiwanymi wartościami danych: znajdowanie anomalnych zachowań klientów ubezpieczalni, klientów kart kredytowych, klientów firm telekomunikacyjnych. 5. Odkrywanie asocjacji Dane: I={i1, i2,..., in} zbiór obiektów Transakcja T: zbiór obiektów takich, że T I Baza danych D: zbiór transakcji Transakcja T zawiera X, gdzie X I, jeżeli X T Reguła asocjacyjna: implikacja postaci X Y, gdzie X, Y I Reguła X Y posiada zaufanie c% w bazie danych D jeżeli c% transakcji, należących do D i zawierających X zawiera również Y. Reguła X Y posiada wsparcie s w bazie danych D jeżeli s% transakcji należących do D zawiera X Y. Sformułowanie problemu: Znajdź wszystkie reguły asocjacyjne w D, których wsparcie s > minsup, i zaufanie c > minconf, gdzie minsup i minconf wartości zadane przez użytkownika. 4
5 Przykład: Transakcja Obiekty 100 A, B, C 200 A, C 300 A, D 400 B, E, F Dla minsup=50% i minconf=50% następujące reguły asocjacyjne są prawdziwe: A C, reguła posiada 50% wsparcie i 66.6% zaufanie C A, reguła posiada 50% wsparcie i 100% zaufanie Zastosowania: analiza koszyka zakupów, bezpośredni marketing, Obiekty mogą tworzyć hierarchie: produkty AGD Produkty spoż Odzież spodnie buty Reguły asocjacyjne uwzględniające hierarchie obiektów nazywamy uogólnionymi regułami asocjacyjnymi: spodnie AGD Reguły asocjacyjne odkrywane z danych zarówno numerycznych jak i symbolicznych nazywamy ilościowymi regułami asocjacyjnymi. ID Wiek Zarobek Status małż. Ilość samoch Żonaty Żonaty 3 Przykład ilościowej reguły asocjacyjnej: 10% żonatych mężczyzn w wieku posiada co najmniej dwa samochody w rodzinie 6. Odkrywanie wzorców sekwencji Dane: I={i1, i2,..., in} zbiór obiektów Transakcja T: zbiór obiektów takich, że T I Sekwencja: lista transakcji pojedynczego klienta Baza danych sekwencji D: zbiór sekwencji 5
6 Sformułowanie problemu: Dana jest baza danych sekwencji D. Znajdź wszystkie maksymalne podsekwencje w D, których wsparcie s > minsup, gdzie minsup wartość zadana przez użytkownika. Znalezione podsekwencje nazywamy wzorcami sekwencji. Przykład: ID klienta Data Obiekty maja A maja A maja A maja B września C, E kwietnia A, E maja A czerwca C, D, E września A września A Dla minsup=40% następujące wzorce sekwencji są spełnione: A poprzedza A, wzorzec posiada wsparcie 40% A poprzedza C i E, wzorzec posiada wsparcie 40% Zastosowania: analiza dostępów do stron w Web, analiza koszyka zakupów, bezpośredni marketing, medycyna, ubezpieczenia, telekomunikacja Użytkownik może być zainteresowany wzorcami sekwencji spełniającymi zadane ograniczenia. Ograniczenia mogą mieć charakter ograniczeń nałożonych na dane (ang. item constraints), na przykład - znajdź wszystkie produkty, które poprzedzają najczęściej kupno pralki, lub ograniczeń czasowych (ang. time constraints), na przykład jakie produkty klienci kupują najczęściej w przeciągu miesiąca. Podobnie jak w przypadku reguł asocjacyjnych, produkty mogą tworzyć mogą hierarchie. Wzorce sekwencji uwzględniające hierarchie obiektów nazywamy uogólnionymi wzorcami sekwencji: Kupno telewizora poprzedza kupno produktu AGD 7. Odkrywanie klasyfikacji Sformułowanie problemu: Dana jest baza danych rekordów. Każdy rekord posiada etykietę klasy, do której należy. Znajdź model każdej klasy, tj. opis rekordów dla każdej z klas. Przykład: Wiek Typ samochodu Ryzyko wypadku 20 Kombi duże 18 Sportowy duże 40 Sportowy duże 50 Kombi małe 35 Minivan małe 30 Kombi duże 6
7 Wynik klasyfikacji można przedstawić w postaci tzw. drzewa decyzyjnego. Dla powyższego zbioru rekordów drzewo decyzyjne ma następującą postać: Wiek < 31 duże Typ samochodu (sportowy) duże małe Odkrywanie klasyfikacji znajduje zastosowanie w takich dziedzinach jak: klasyfikacja pacjentów, analiza wiarygodności kredytobiorców, lokalizacja sklepów, marketing celowy, itp. Problem klasyfikacji jest problemem znanym i analizowanym od wielu lat, szczególnie, w dziedzinie sztucznej inteligencji i uczenia maszynowego. Na gruncie tych dziedzin opracowano szereg metod odkrywania klasyfikacji takich jak: drzewa decyzyjne, sieci neuronowe, algorytmy kombinatoryczne (szczególnie - algorytmy genetyczne), algorytmy statystyczne. Niestety, algorytmy te charakteryzują się słabą skalowalnością. W przeciwieństwie do nich, algorytmy odkrywania klasyfikacji opracowane w ramach eksploracji danych nie mają tej wady; są skalowalne i nie wprowadzają ograniczeń na liczbę rekordów, atrybutów czy też klas. Zastosowania: klasyfikacja pacjentów, weryfikacja kredytobiorców, lokalizacja sklepów, marketing bezpośredni. 8. Klastrowanie Problem klastrowania wiąże się z zagadnieniem klasyfikacji. W przypadku klasyfikacji, obiekty (rekordy) są przypisane do klas. W przypadku klastrowania poszukujemy klas obiektów o zbliżonych cechach. Sformułowanie problemu: Dana jest baza danych rekordów. Przypisz rekordy do klastrów. Czym jest klaster rekordów? Klaster jest podzbiorem podobnych rekordów. Można przytoczyć również inne definicje klastrów. Klaster jest podzbiorem rekordów takich, że odległość pomiędzy dwoma dowolnymi rekordami w klastrze jest mniejsza aniżeli odległość pomiędzy dowolnym rekordem w klastrze a rekordem z innego klastra. Inna definicja: klastrem nazywamy spójny obszar w wielowymiarowej przestrzeni o dużej gęstości rekordów. C1 C2 7
8 Problem klastrowania danych, czasami nazywany taksonomią danych, jest analizowany już od wielu lat w ramach sztucznej inteligencji i uczenia maszynowego. Istnieje wiele algorytmów klastrowania danych. Różnice pomiędzy algorytmami wynikają z charakteru danych: dane ciągłe, numeryczne czy też symboliczne. Wyróżnia się dwa zasadnicze typy algorytmów klastrowania danych: algorytmy podziału i algorytmy hierarchiczne. Podobnie jak w przypadku algorytmów odkrywania klasyfikacji, zasadniczym problemem w przypadku stosowania algorytmów opracowanych na gruncie uczenia maszynowego jest ich niewielka skalowalność w zakresie rozmiaru przestrzeni. Zastosowania: segmentacja rynku klientów(telekomunikacja, ubezpieczenia), segmentacja obrazów, biologia, medycyna. 9. Odkrywanie podobieństw w przebiegach czasowych Dane: Baza danych przebiegów czasowych Sformułowanie problemu: Dana jest baza danych przebiegów czasowych. Pogrupuj wszystkie podobne przebiegi czasowe czas czas Zyski z funduszu ALFA Zyski z funduszu BETA Przedstawione przebiegi czasowe różnią się wartościami i są wzajemnie przesunięte w czasie, mają jednak podobną charakterystykę. Do znajdowania podobieństw czasowych wykorzystuje się transformaty: Fouriera i falkową. Zastosowania: znajdowanie klientów o podobnej konsumpcji energii elektrycznej, identyfikacja firm na giełdzie o podobnej dynamice wzrostu cen akcji, identyfikacja surowców o podobnej charakterystyce sprzedaży. 8
9 10. Wykrywanie zmian i odchyleń Użytkownicy są zainteresowani w takim samym stopniu odkrywaniem zależności i prawidłowości w bazach danych jak i odkrywaniem odchyleń, anomalii od normalnych zachowań czy też wyjątków. Odchyleniem nazywamy różnicę pomiędzy aktualną a oczekiwaną wartością. Nazwa Styczeń Luty Marzec Kwiecień AIX NT HP SUN Nazwa Styczeń Luty Marzec Kwiecień AIX NT HP SUN Wykrywanie zmian i odchyleń jest stosowane obecnie głównie do analizy dużych wolumenów wielowymiarowych danych. Analizując dane staramy się zrozumieć trendy i zmiany zachodzące w procesach generujących te dane. Dotyczy to, na przykład, danych pochodzących z ubezpieczalni, dużych supermarketów, danych opisujących zachowania posiadaczy kart kredytowych, klientów banku. 11. Wnioski i uwagi końcowe Ostatnie lata pokazały olbrzymią przydatność praktyczną aplikacji eksploracji danych [1,2,3,4]. Znajdują one zastosowanie w takich dziedzinach jak: ubezpieczenia, telekomunikacja, marketing, badania naukowe, medycyna, kryminalistyka. Zasadnicza dyskusja, która się toczy obecnie w środowisku osób zajmujących się eksploracją danych dotyczy odpowiedzi na pytanie, czy eksploracja danych jest, czy powinna być, naturalnym rozszerzeniem funkcjonalności systemów baz danych, czy jest raczej dziedziną aplikacji rozwijanych dla poszczególnych zastosowań. Wydaje się, że obecnie zaczyna przeważać pogląd, iż eksploracja danych, przynajmniej w zakresie związanym z definiowaniem zapytań i generacją reguł, powinna stanowić rozszerzenie funkcjonalności systemów zarządzania bazami danych, czy raczej systemów zarządzania bazami wiedzy. W ostatnim czasie zaproponowano szereg rozszerzeń standardu SQL umożliwiających wyszukiwanie reguł asocjacyjnych i klasyfikacyjnych, zaproponowano nowe struktury danych ułatwiających przechowywanie i wyszukiwanie reguł, nowe typy indeksów, itd., [5,6,7,8]. Są to elementy systemowe rozszerzające funkcjonalność SZBD. Eksploracja danych jest dziedziną interdyscyplinarną. Jej dalszy rozwój wymaga połączenia technik i metod wypracowanych w różnych dziedzinach nauki: statystyce, grafice komputerowej, technologii baz danych, systemów równoległych, teorii optymalizacji, programowania matematycznego, uczenia maszynowego, itd. Część osób porównuje aktualny stan rozwoju tej dziedziny do stanu, w jakim systemy baz danych znajdowały się na początku swojej drogi. Brakuje nam standardu języka, w którym użytkownicy mogliby definiować swoje zapytania, mechanizmów optymalizacji wykonywania takich zapytań, zarządzania efektywnym, współbieżnym wykonywaniem zapytań, narzędzi do budowy aplikacji, itd. Olbrzymie bazy danych przypominają dzisiaj czasami wielkie grobowce pełne danych, ale bez życia. Eksploracja danych jest próbą, być może kolejną, wniesienia do tych grobowców trochę światła. 9
10 Literatura. [1] R. Brachman, T. Khabaza, W. Kloesgen, G. Piatetsky-Shapiro, E. Simoudis, Industrial applications of data mining and knowledge discovery, Communicatiosn of ACM, 39, 11, [2] U. Fayyad, G. Piatetsky-Shapiro, [eds.], Advances in Knowledge Discovery and Data Mining, MIT Press, 1996 [3] U. Fayyad, D. Haussler, P. Stolorz, Mining science data, Communications of ACM, 39, 11, [4] T. Imieliński, H. Manilla, A Database Perspective on Knowledge Discovery, Communications of ACM, 39, 11, [5] R. Meo, G. Psaila, S. Ceri, A new SQL-like operator for mining association rules, Proc. of 22nd Int. Conf. VLDB, [6] T. Morzy, M. Zakrzewicz, SQL-like languages for database mining, Proc. Int. Conf. on Advances in Databases and Information Systems, [7] T. Morzy, M. Zakrzewicz, Group Bitmap Index; A Strucure for Association Rules retrieval, Proc. Of 4th Int. Conf. On Knowledge Discovery and Data Mining, AAAI Press, [8] T. Imieliński, A. Virmani, Association rules, and what s next? Towards second generation data mining systems, Proc. Int. Conf. On Advances in Databases and Information Systems, [9] R. Agrawal, T. Imieliński, A. Swami, Mining Associations between Sets of Items in Massive Databases, SIGMOD-93, Washington, [10] R. Agrawal, R. Srikant, Fast Algorithms for Mining Association Rules in Large Databases, Proc. of 20th Int. Conf. VLDB, [11] R. Agrawal, H. Mannila, R. Srikant, H. Toivonen, A. I. Verkamo, Fast Discovery of Association Rules, in [2]. [12] R. Srikant, R. Agrawal, Mining Generalized Association Rules, Proc. of 21st Int. Conf. VLDB, [13] J. Han, Y. Fu, Doscovery of Multiple-Level Association Rules from Large Databases, Proc. of 21st Int. Conf. VLDB, [14] R. Srikant, R. Agrawal, Mining Quantitative Association Rules in Large Relational Tables, SIGMOD-96, Montreal, [15] R. J. Miller, Y. Yang, Association Rules over Interval Data, SIGMOD-97, Tucson, [16] R. Agrawal, R. Srikant, Mining Sequential Patterns, Proc. of 11th Int. Conf. on Data Engineering, Taipei, [17] R. Srikant, R. Agrawal, Mining Sequential Patterns: Generalization and performance Improvements, EDBT-96, Avignon, [18] H. Mannila, H. Toivonen, A. I. Verkamo, Discovering Frequent Episodes in Sequences, KDD- 95, Montreal, [19] R. Agrawal, C. Faloutsos, A. Swami, Efficient Similarity Search in Sequence Databases, FODO-93, Chicago, [20] C. Faloutsos, M. Ranganthan, Y. Manolopoulos, Fast Subsequence Matching in Time-Series Databases, SIGMOD-94, [21] M. Mehta, R. Agrawal, J. Rissanen, SLIQ: A Fast Scalable Classifier for data Mining, EDBT- 96, Avignon, [22] S. M. Weiss, C. A. Kulikowski, Computer Systems that Learn: Classification and Prediction Methods from Statistics, Neural Nets, Machine Learning, and Expwert systems, Morgan Kaufman, [23] A. K. Jain, R. C. Dubes, Algorithms for Clustering Data, Prentice Hall, [24] T. Zhang, R. Ramakrishan, M. Livny, BIRCH: An Efficient Data Clustering Method For Very Large Databases, SIGMOD-96, Montreal, [25] T. Morzy, M. Zakrzewicz, M. Wojciechowski, Pattern-Oriented Hierarchical Clustering, Proc. 3rd Int. Conf. on Advances in Databases and Information Systems,
Ewelina Dziura Krzysztof Maryański
Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład
Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski
Data Mining Wykład 1 Wprowadzenie do Eksploracji Danych Prowadzący Dr inż. Jacek Lewandowski Katedra Genetyki Wydział Biologii i Hodowli Zwierząt Uniwersytet Przyrodniczy we Wrocławiu ul. Kożuchowska 7,
Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel
według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology
Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2
Data Mining Wykład 2 Odkrywanie asocjacji Plan wykładu Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych Geneza problemu Geneza problemu odkrywania reguł
HURTOWNIE DANYCH I BUSINESS INTELLIGENCE
BAZY DANYCH HURTOWNIE DANYCH I BUSINESS INTELLIGENCE Akademia Górniczo-Hutnicza w Krakowie Adrian Horzyk horzyk@agh.edu.pl Google: Horzyk HURTOWNIE DANYCH Hurtownia danych (Data Warehouse) to najczęściej
data mining machine learning data science
data mining machine learning data science deep learning, AI, statistics, IoT, operations research, applied mathematics KISIM, WIMiIP, AGH 1 Machine Learning / Data mining / Data science Uczenie maszynowe
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych
PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"
PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych
Wprowadzenie do technologii informacyjnej.
Wprowadzenie do technologii informacyjnej. Data mining i jego biznesowe zastosowania dr Tomasz Jach Definicje Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać. Eksploracja
Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH
Wstęp. Architektura hurtowni. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH B. Inmon, 1996: Hurtownia to zbiór zintegrowanych, nieulotnych, ukierunkowanych
Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych
Temat: Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych Autorzy: Tomasz Małyszko, Edyta Łukasik 1. Definicja eksploracji danych Eksploracja
Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu
i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę
Analiza danych i data mining.
Analiza danych i data mining. mgr Katarzyna Racka Wykładowca WNEI PWSZ w Płocku Przedsiębiorczy student 2016 15 XI 2016 r. Cel warsztatu Przekazanie wiedzy na temat: analizy i zarządzania danymi (data
w ekonomii, finansach i towaroznawstwie
w ekonomii, finansach i towaroznawstwie spotykane określenia: zgłębianie danych, eksploracyjna analiza danych, przekopywanie danych, męczenie danych proces wykrywania zależności w zbiorach danych poprzez
Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu
i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę
dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych
- Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku 1 - - 2 3 4 5 - The purpose of computing is insight, not numbers Richard Hamming Motywacja - Mamy informację,
Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na
Techniki indeksowania w eksploracji danych Maciej Zakrzewicz Instytut Informatyki Politechnika Poznańska Plan prezentacji Zastosowania indeksów w systemach baz danych Wprowadzenie do metod eksploracji
Plan prezentacji 0 Wprowadzenie 0 Zastosowania 0 Przykładowe metody 0 Zagadnienia poboczne 0 Przyszłość 0 Podsumowanie 7 Jak powstaje wiedza? Dane Informacje Wiedza Zrozumienie 8 Przykład Teleskop Hubble
Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL
Podstawy baz danych: Rysunek 1. Tradycyjne systemy danych 1- Obsługa wejścia 2- Przechowywanie danych 3- Funkcje użytkowe 4- Obsługa wyjścia Ewolucja baz danych: Fragment świata rzeczywistego System przetwarzania
Transformacja wiedzy w budowie i eksploatacji maszyn
Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces
Eksploracja danych (data mining)
Eksploracja (data mining) Tadeusz Pankowski www.put.poznan.pl/~pankowsk Czym jest eksploracja? Eksploracja oznacza wydobywanie wiedzy z dużych zbiorów. Eksploracja badanie, przeszukiwanie; np. dziewiczych
Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,
Bazy Danych Bazy Danych i SQL Podstawowe informacje o bazach danych Krzysztof Regulski WIMiIP, KISiM, regulski@metal.agh.edu.pl Oczekiwania? 2 3 Bazy danych Jak przechowywać informacje? Jak opisać rzeczywistość?
Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence
Hurtownie danych Wprowadzenie do systemów typu Business Intelligence Krzysztof Goczyła Teresa Zawadzka Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika
Metody eksploracji danych. Reguły asocjacyjne
Metody eksploracji danych Reguły asocjacyjne Analiza podobieństw i koszyka sklepowego Analiza podobieństw jest badaniem atrybutów lub cech, które są powiązane ze sobą. Metody analizy podobieństw, znane
Pojęcie bazy danych. Funkcje i możliwości.
Pojęcie bazy danych. Funkcje i możliwości. Pojęcie bazy danych Baza danych to: zbiór informacji zapisanych według ściśle określonych reguł, w strukturach odpowiadających założonemu modelowi danych, zbiór
Proces odkrywania wiedzy z baz danych
Proces odkrywania wiedzy z baz danych Wydział Informatyki Politechnika Białostocka Marcin Czajkowski email: m.czajkowski@pb.edu.pl Świat pełen danych Świat pełen danych Możliwości analizowania i zrozumienia
METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. EKSPLORACJA DANYCH Ćwiczenia. Adrian Horzyk. Akademia Górniczo-Hutnicza
METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING EKSPLORACJA DANYCH Ćwiczenia Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017
dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017 KONTAKT Z PROWADZĄCYM dr inż. Paweł Morawski e-mail: pmorawski@spoleczna.pl www: http://pmorawski.spoleczna.pl
dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019
dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019 KONTAKT Z PROWADZĄCYM dr inż. Paweł Morawski e-mail: pmorawski@spoleczna.pl www: http://pmorawski.spoleczna.pl
Business Intelligence
Business Intelligence Paweł Mielczarek Microsoft Certified Trainer (MCT) MCP,MCSA, MCTS, MCTS SQL 2005, MCTS SQL 2008, MCTS DYNAMICS, MBSS, MBSP, MCITP DYNAMICS. Geneza Prowadzenie firmy wymaga podejmowania
Data Mining Kopalnie Wiedzy
Data Mining Kopalnie Wiedzy Janusz z Będzina Instytut Informatyki i Nauki o Materiałach Sosnowiec, 30 listopada 2006 Kopalnie złota XIX Wiek. Odkrycie pokładów złota spowodowało napływ poszukiwaczy. Przeczesywali
MECHANIZM PERSPEKTYW MATERIALIZOWANYCH W EKSPLORACJI DANYCH
MECHANIZM PERSPEKTYW MATERIALIZOWANYCH W EKSPLORACJI DANYCH Mikołaj MORZY, Marek WOJCIECHOWSKI Streszczenie: Eksploracja danych to proces interaktywny i iteracyjny. Użytkownik definiuje zbiór interesujących
Odkrywanie asocjacji
Odkrywanie asocjacji Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Odkrywanie asocjacji wykład 1 Wykład jest poświęcony wprowadzeniu i zaznajomieniu się z problemem odkrywania reguł asocjacyjnych.
ODKRYWANIE WZORCÓW ZACHOWAŃ UŻYTKOWNIKÓW WWW. Marek Wojciechowski
ODKRYWANIE WZORCÓW ZACHOWAŃ UŻYTKOWNIKÓW WWW Marek Wojciechowski Instytut Informatyki Politechnika Poznańska ul. Piotrowo 3a, 60-965 Poznań Marek.Wojciechowski@cs.put.poznan.pl Streszczenie Niniejszy artykuł
Specjalizacja magisterska Bazy danych
Specjalizacja magisterska Bazy danych Strona Katedry http://bd.pjwstk.edu.pl/katedra/ Prezentacja dostępna pod adresem: http://www.bd.pjwstk.edu.pl/bazydanych.pdf Wymagania wstępne Znajomość podstaw języka
Inżynieria biomedyczna
Inżynieria biomedyczna Projekt Przygotowanie i realizacja kierunku inżynieria biomedyczna studia międzywydziałowe współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego.
Wprowadzenie do technologii Business Intelligence i hurtowni danych
Wprowadzenie do technologii Business Intelligence i hurtowni danych 1 Plan rozdziału 2 Wprowadzenie do Business Intelligence Hurtownie danych Produkty Oracle dla Business Intelligence Business Intelligence
Algorytmy i bazy danych (wykład obowiązkowy dla wszystkich)
MATEMATYKA I EKONOMIA PROGRAM STUDIÓW DLA II STOPNIA Data: 2010-11-07 Opracowali: Krzysztof Rykaczewski Paweł Umiński Streszczenie: Poniższe opracowanie przedstawia projekt planu studiów II stopnia na
On-Line Data Mining. Maciej Zakrzewicz. Politechnika Poznańska Instytut Informatyki ul. Piotrowo 3a, 60-965 Poznań mzakrz@cs.put.poznan.
On-Line Data Mining Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki ul. Piotrowo a, 60-965 Poznań mzakrz@cs.put.poznan.pl Streszczenie Celem eksploracji danych (Data Mining) jest zautomatyzowane
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów Łukasz Piątek, Jerzy W. Grzymała-Busse Katedra Systemów Ekspertowych i Sztucznej Inteligencji, Wydział Informatyki
Efekt kształcenia. Ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną w zakresie algorytmów i ich złożoności obliczeniowej.
Efekty dla studiów pierwszego stopnia profil ogólnoakademicki na kierunku Informatyka w języku polskim i w języku angielskim (Computer Science) na Wydziale Matematyki i Nauk Informacyjnych, gdzie: * Odniesienie-
Ćwiczenie 5. Metody eksploracji danych
Ćwiczenie 5. Metody eksploracji danych Reguły asocjacyjne (association rules) Badaniem atrybutów lub cech, które są powiązane ze sobą, zajmuje się analiza podobieństw (ang. affinity analysis). Metody analizy
Hurtownie danych. 31 stycznia 2017
31 stycznia 2017 Definicja hurtowni danych Hurtownia danych wg Williama Inmona zbiór danych wyróżniający się następującymi cechami uporządkowany tematycznie zintegrowany zawierający wymiar czasowy nieulotny
Eksploracja Danych. podstawy
Eksploracja Danych podstawy Bazy danych (1) Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 2/633 Bazy danych (2) Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 3/633
2
1 2 3 4 5 Dużo pisze się i słyszy o projektach wdrożeń systemów zarządzania wiedzą, które nie przyniosły oczekiwanych rezultatów, bo mało kto korzystał z tych systemów. Technologia nie jest bowiem lekarstwem
KIERUNKOWE EFEKTY KSZTAŁCENIA
WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA II STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA NAUK TECHNICZNYCH Dyscyplina
KIERUNKOWE EFEKTY KSZTAŁCENIA
KIERUNKOWE EFEKTY KSZTAŁCENIA WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA II STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA
Alicja Marszałek Różne rodzaje baz danych
Alicja Marszałek Różne rodzaje baz danych Rodzaje baz danych Bazy danych można podzielić wg struktur organizacji danych, których używają. Można podzielić je na: Bazy proste Bazy złożone Bazy proste Bazy
Technologia informacyjna (IT - Information Technology) dziedzina wiedzy obejmująca:
1.1. Podstawowe pojęcia Technologia informacyjna (IT - Information Technology) dziedzina wiedzy obejmująca: informatykę (włącznie ze sprzętem komputerowym oraz oprogramowaniem używanym do tworzenia, przesyłania,
Eksploracja danych TADEUSZ MORZY
NAUKA 3/2007 83-104 TADEUSZ MORZY Eksploracja danych Intensywny rozwój technologii generowania, gromadzenia i przetwarzania danych z jednej strony, z drugiej, upowszechnienie systemów informatycznych,
Typy systemów informacyjnych
Typy systemów informacyjnych Information Systems Systemy Informacyjne Operations Support Systems Systemy Wsparcia Operacyjnego Management Support Systems Systemy Wspomagania Zarzadzania Transaction Processing
Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska
Systemy OLAP I Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania Semestr zimowy 2008/09 Studia
Michał Kozielski Łukasz Warchał. Instytut Informatyki, Politechnika Śląska
Michał Kozielski Łukasz Warchał Instytut Informatyki, Politechnika Śląska Algorytm DBSCAN Algorytm OPTICS Analiza gęstego sąsiedztwa w grafie Wstępne eksperymenty Podsumowanie Algorytm DBSCAN Analiza gęstości
KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Metody drążenia danych D1.3
KARTA PRZEDMIOTU 1. Informacje ogólne Nazwa przedmiotu i kod (wg planu studiów): Nazwa przedmiotu (j. ang.): Kierunek studiów: Specjalność/specjalizacja: Poziom kształcenia: Profil kształcenia: Forma studiów:
Usługi analityczne budowa kostki analitycznej Część pierwsza.
Usługi analityczne budowa kostki analitycznej Część pierwsza. Wprowadzenie W wielu dziedzinach działalności człowieka analiza zebranych danych jest jednym z najważniejszych mechanizmów podejmowania decyzji.
Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym
POLITECHNIKA WARSZAWSKA Instytut Technik Wytwarzania Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym Marcin Perzyk Dlaczego eksploracja danych?
Eksploracja danych - wykład VIII
I Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 2 grudnia 2016 1/31 1 2 2/31 (ang. affinity analysis) polega na badaniu atrybutów lub cech, które są ze sobą powiązane. Metody
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
WIEDZA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza
METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING WIEDZA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki
KIERUNKOWE EFEKTY KSZTAŁCENIA
Zał. nr 1 do Programu kształcenia KIERUNKOWE EFEKTY KSZTAŁCENIA WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INŻYNIERIA SYSTEMÓW Stopień studiów: STUDIA II STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR
Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów
Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie
Analiza i eksploracja danych
Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Inteligentne Systemy Wspomagania Decyzji Studia magisterskie, semestr I Semestr letni
Opis efektów kształcenia dla modułu zajęć
Nazwa modułu: Eksploracja danych Rok akademicki: 2030/2031 Kod: MIS-2-105-MT-s Punkty ECTS: 5 Wydział: Inżynierii Metali i Informatyki Przemysłowej Kierunek: Informatyka Stosowana Specjalność: Modelowanie
Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl
Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Plan wykładów Wprowadzenie - integracja
Hurtownie danych - przegląd technologii
Hurtownie danych - przegląd technologii Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Biznesowe słowniki pojęć biznesowych odwzorowania pojęć
Hurtownie danych - przegląd technologii
Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Plan wykład adów Wprowadzenie - integracja
Wykład I. Wprowadzenie do baz danych
Wykład I Wprowadzenie do baz danych Trochę historii Pierwsze znane użycie terminu baza danych miało miejsce w listopadzie w 1963 roku. W latach sześcdziesątych XX wieku został opracowany przez Charles
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
Hurtownie danych. Przetwarzanie zapytań. http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU
Hurtownie danych Przetwarzanie zapytań. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU Magazyny danych operacyjnych, źródła Centralna hurtownia danych Hurtownie
Badania operacyjne. Michał Kulej. semestr letni, Michał Kulej () Badania operacyjne semestr letni, / 13
Badania operacyjne Michał Kulej semestr letni, 2012 Michał Kulej () Badania operacyjne semestr letni, 2012 1/ 13 Literatura podstawowa Wykłady na stronie: www.ioz.pwr.wroc.pl/pracownicy/kulej Trzaskalik
EFEKTY UCZENIA SIĘ DLA KIERUNKU INŻYNIERIA DANYCH W ODNIESIENIU DO EFEKTÓW UCZENIA SIĘ PRK POZIOM 6
EFEKTY UCZENIA SIĘ DLA KIERUNKU INŻYNIERIA DANYCH W ODNIESIENIU DO EFEKTÓW UCZENIA SIĘ PRK POZIOM 6 studia pierwszego stopnia o profilu ogólnoakademickim Symbol K_W01 Po ukończeniu studiów pierwszego stopnia
Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE
Modele danych - wykład V Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Zagadnienia 1. Wprowadzenie 2. MOLAP modele danych 3. modele danych 4. Podsumowanie 5. Zadanie fajne
HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego
HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego http://www.jakubw.pl/zajecia/hur/bi.pdf http://www.jakubw.pl/zajecia/hur/dw.pdf http://www.jakubw.pl/zajecia/hur/dm.pdf http://www.jakubw.pl/zajecia/hur/
SPIS TREŚCI WSTĘP... 10
SPIS TREŚCI WSTĘP... 10 Wykład 1. GENEZA, ROZWÓJ, WSPÓŁCZESNE WYZWANIA PRALOGISTYKI WOJSKOWEJ 1. Historyczne źródła logistyki wojskowej... 15 2. Logistyka według poglądów teoretyków amerykańskich... 17
Eksploracja Danych. Wprowadzenie. Co to jest eksploracja danych? Metody Zastosowania. Eksploracja danych. Wprowadzenie
Eksploracja Danych Wprowadzenie Co to jest eksploracja danych? Metody Zastosowania Wprowadzenie Celem wykładu jest wprowadzenie do tematyki eksploracji danych. Odpowiemy sobie na pytanie Czym jest eksploracja
Efekty kształcenia dla kierunku studiów INFORMATYKA, Absolwent studiów I stopnia kierunku Informatyka WIEDZA
Symbol Efekty kształcenia dla kierunku studiów INFORMATYKA, specjalność: 1) Sieciowe systemy informatyczne. 2) Bazy danych Absolwent studiów I stopnia kierunku Informatyka WIEDZA Ma wiedzę z matematyki
Analiza i wizualizacja danych Data analysis and visualization
KARTA MODUŁU / KARTA PRZEDMIOTU Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013
Modele danych - wykład V
Modele danych - wykład V Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Zagadnienia 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie
KIERUNKOWE EFEKTY KSZTAŁCENIA
KIERUNKOWE EFEKTY KSZTAŁCENIA WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA II STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA
Data Mining i odkrywanie wiedzy w bazach danych
Data Mining i odkrywanie wiedzy w bazach danych Maciej Zakrzewicz Instytut Informatyki Politechniki Poznańskiej mzakrz@cs.put.poznan.pl Streszczenie Intensywnie rozwijająca się dziedzina odkrywania wiedzy
Hurtownie danych wykład 3
Hurtownie danych wykład 3 dr Sebastian Zając SGH Warszawa 7 lutego 2017 Architektura relacyjna i wielowymiarowa Ze względu na przechowywanie danych na serwerze możemy zdecydować się na relacyjną bazę danych
a) Szczegółowe efekty kształcenia i ich odniesienie do opisu efektów
1. PROGRAM KSZTAŁCENIA 1) OPIS EFEKTÓW KSZTAŁCENIA a) Szczegółowe efekty kształcenia i ich odniesienie do opisu efektów kształcenia dla obszaru nauk społecznych i technicznych Objaśnienie oznaczeń: I efekty
SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie
SZKOLENIA SAS ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie DANIEL KUBIK ŁUKASZ LESZEWSKI ROLE ROLE UŻYTKOWNIKÓW MODUŁU
Monitoring procesów z wykorzystaniem systemu ADONIS
Monitoring procesów z wykorzystaniem systemu ADONIS BOC Information Technologies Consulting Sp. z o.o. e-mail: boc@boc-pl.com Tel.: (+48 22) 628 00 15, 696 69 26 Fax: (+48 22) 621 66 88 BOC Management
Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com
XI Konferencja PLOUG Kościelisko Październik 2005 Zastosowanie reguł asocjacyjnych, pakietu Oracle Data Mining for Java do analizy koszyka zakupów w aplikacjach e-commerce. Integracja ze środowiskiem Oracle
Techniki i algorytmy eksploracji danych. Geneza (1) Geneza (2)
Techniki i algorytmy eksploracji danych Tadeusz Morzy Instytut Informatyki Politechnika Poznańska str. 1 Geneza (1) Dostępność danych Rozwój nowoczesnych technologii przechowywania i przetwarzania danych
Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining
Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining 0LNRáDM0RU]\ Marek Wojciechowski Instytut Informatyki PP Eksploracja danych 2GNU\ZDQLHZ]RUFyZZGX*\FK
Prof. Stanisław Jankowski
Prof. Stanisław Jankowski Zakład Sztucznej Inteligencji Zespół Statystycznych Systemów Uczących się p. 228 sjank@ise.pw.edu.pl Zakres badań: Sztuczne sieci neuronowe Maszyny wektorów nośnych SVM Maszyny
METODY EKSPLORACJI DANYCH I ICH ZASTOSOWANIE
Zeszyty Naukowe PWSZ w Płocku Nauki Ekonomiczne, t. XXI, 2015. Państwowa Wyższa Szkoła Zawodowa w Płocku METODY EKSPLORACJI DANYCH I ICH ZASTOSOWANIE Wprowadzenie Współczesne firmy przechowują i przetwarzają
A C T A UNIVERSITATIS LODZIENSIS FOLIA OECONOMICA 183,2004. Sebastian Szamański, Ryszard Budziński
A C T A UNIVERSITATIS LODZIENSIS FOLIA OECONOMICA 183,2004 Sebastian Szamański, Ryszard Budziński METODY EKSPLORACJI REGUŁ ASOCJACYJNYCH I ICH ZASTOSOWANIE Wprowadzenie Ogromny postęp technologiczny ostatnich
Co to jest Business Intelligence?
Cykl: Cykl: Czwartki z Business Intelligence Sesja: Co Co to jest Business Intelligence? Bartłomiej Graczyk 2010-05-06 1 Prelegenci cyklu... mariusz@ssas.pl lukasz@ssas.pl grzegorz@ssas.pl bartek@ssas.pl
Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence
Hurtownie danych Rola hurtowni danych w systemach typu Business Intelligence Krzysztof Goczyła Teresa Zawadzka Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Uchwała Nr 34/2012/V Senatu Politechniki Lubelskiej z dnia 21 czerwca 2012 r.
Uchwała Nr 34/2012/V Senatu Politechniki Lubelskiej z dnia 21 czerwca 2012 r. w sprawie określenia efektów kształcenia dla studiów drugiego stopnia na kierunku mechatronika, prowadzonych wspólnie przez
Od e-materiałów do e-tutorów
Od e-materiałów do e-tutorów Lech Banachowski, Elżbieta Mrówka-Matejewska, Agnieszka Chądzyńska-Krasowska, Jerzy Paweł Nowacki, Wydział Informatyki, Polsko-Japońska Akademia Technik Komputerowych Plan
Informatyczne fundamenty
Informatyczne fundamenty Informatyka to szeroka dziedzina wiedzy i praktycznych umiejętności. Na naszych studiach zapewniamy solidną podstawę kształcenia dla profesjonalnego inżyniera IT. Bez względu na
STATYSTYKA EKONOMICZNA
STATYSTYKA EKONOMICZNA Analiza statystyczna w ocenie działalności przedsiębiorstwa Opracowano na podstawie : E. Nowak, Metody statystyczne w analizie działalności przedsiębiorstwa, PWN, Warszawa 2001 Dr
STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna
STUDIA PODYPLOMOWE Analiza i Eksploracja Danych Rynkowych i Marketingowych Rodzaj studiów: doskonalące Liczba godzin: 250 Liczba semestrów: dwa semestry Kierownik studiów: dr Paweł Kaczmarczyk Koszt studiów
Sylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia.
Załącznik nr 4 do zarządzenia nr 12 Rektora UJ z 15 lutego 2012 r. Sylabus modułu kształcenia na studiach wyższych Nazwa Wydziału Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia Wydział Matematyki