On-Line Data Mining. Maciej Zakrzewicz. Politechnika Poznańska Instytut Informatyki ul. Piotrowo 3a, Poznań
|
|
- Jolanta Urban
- 10 lat temu
- Przeglądów:
Transkrypt
1 On-Line Data Mining Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki ul. Piotrowo a, Poznań Streszczenie Celem eksploracji danych (Data Mining) jest zautomatyzowane odkrywanie statystycznych zależności i schematów w bardzo dużych bazach danych, a następnie ich reprezentacja w formie reguł logicznych, drzew decyzyjnych lub sieci neuronowych. Mimo, iż stosowane do tych celów algorytmy są bardzo obliczeniochłonne i zwykle wykonywane w trybie wsadowym, to jednak dynamiczny rozwój technologii sprzętowych pozwolił na postęp w kierunku bieżącej eksploracji danych (On-Line Data Mining). Bieżąca eksploracja danych rozszerza funkcjonalność klasycznych systemów baz danych i umożliwia implementację nowej generacji aplikacji dla analizy danych i wspomagania podejmowania decyzji. W artykule przedstawiono system RD, który jest prototypowym środowiskiem dla bieżącej eksploracji danych, rozbudowującym własności RDBMS Oracle7. Scharakteryzowano kluczowe technologie wykorzystane podczas budowy modułów oprogramowania: sieciowego, analizy językowej, dostępu do bazy danych, eksploracji danych. Zilustrowane zostały także zastosowania prezentowanego środowiska w dziedzinach marketingu, zarządzania i bankowości. Czym jest data mining? Data mining, czyli eksploracja danych, jest nowoczesną technologią, służącą do zautomatyzowanego odkrywania statystycznych zależności i schematów w bardzo dużych bazach danych [AIS9], [FPS96], [Zak97]. Odkrywane, wcześniej nieznane zależności i schematy, przedstawiane najczęściej w formie reguł logicznych, drzew decyzyjnych lub sieci neuronowych mogą posiadać dużą wartość ekonomiczną i mogą być użyte do wspomagania podejmowania decyzji finansowych i marketingowych w przedsiębiorstwie. Często żartobliwie charakteryzuje się eksplorację danych nie jako "poszukiwanie reguł w bazach danych", ale jako "poszukiwanie pieniędzy w bazach danych" (ang. "mining for dollars"). Mimo, iż eksploracja danych wyrosła na gruncie sztucznej inteligencji i uczenia maszynowego, to jednak rozmiary stawianych przed nią problemów powodują konieczność opracowania zupełnie nowych, wyrafinowanych algorytmów, metod i architektur. Na rynku pojawia się coraz więcej produktów noszących etykietę "Data Mining", które potrafią współpracować z popularnymi systemami baz danych w celu rozwiązania specyficznego problemu decyzyjnego. Ze względu na dość luźną integrację takich systemów z systemami baz danych (klient/serwer) osiągana efektywność jest zwykle niesatysfakcjonująca dla aplikacji, które powinny szybko reagować na zmieniającą się rzeczywistość (np. decyzje o zakupach na rynkach kapitałowych). Najczęściej przedstawianym i najbardziej chyba udanym przykładem zastosowania eksploracji danych jest problem analizy koszyka zakupów (ang. market basket analysis) [AIS9], [MZ97], [SA95], [SA96]. Analiza koszyka zakupów dotyczy bazy danych gromadzącej zapisy o zakupach dokonywanych przez kolejnych klientów supermarketu: dla każdej transakcji zakupu odnotowywane są wszystkie zakupione produkty (koszyk zakupów). Celem analizy koszyka zakupów jest odkrycie w bazie danych tych zbiorów produktów, które są najczęściej kupowane wspólnie, np. zbioru {"szklanka", "karafka", ""}. Taka wiedza o zależnościach zachodzących pomiędzy sprzedawanymi produktami może być następnie użyta do planowania
2 skutecznych kampanii promocyjnych, rozmieszczania produktów na półkach, projektowania katalogów wysyłkowych itp.. Najczęściej wyniki analizy koszyka zakupów przedstawiane są w formie tzw. reguł asocjacyjnych, np.: IF produkt="szklanka" AND produkt="karafka" THEN produkt="" Powyższa reguła orzeka, że kiedy klient kupuje (albo będzie kupować) produkty "szklanka" i "karafka", to jest wysoce prawdopodobne, że kupuje (albo kupi) on również produkt "". Co data mining ma wspólnego z bazami danych? OLAM. Coraz bardziej powszechne są opinie, że eksploracja danych uzupełnia obecną funkcjonalność systemów baz danych [IM96]. Z punktu widzenia użytkownika optymalna byłaby pełna integracja obu technologii i traktowanie odkrywania zależności i schematów na równi z wykonywaniem zapytań do bazy danych. Integracja taka dotyczyłaby wspólnego deklaratywnego języka dla zapytań i eksploracji, unifikacji logicznej reprezentacji danych relacyjnych i regułowych, współpracy na poziomie wewnętrznych mechanizmów transakcyjności, współbieżności, ograniczeń integralnościowych, indeksowania, itp.. Niewątpliwa poprawa efektywności eksploracji danych byłaby efektem umiejscowienia algorytmów jak najbliżej danych, na których te algorytmy operują. Ponadto, w nieskomplikowany sposób, obecne aplikacje biznesowe mogłyby zostać rozszerzone o funkcje eksploracji dodane na poziomie systemu bazy danych, co wpłynęłoby na relatywnie niski koszt takiego skoku technologicznego. W efekcie, użytkownicy mogliby posługiwać się eksploracją danych tak, jak dziś posługują się bieżącą analizą OLAP (ang. On-Line Analytical Processing) - szybko i skutecznie [CD97], [Wid95]. Tę generację systemów eksploracji danych, szybkich, wielodostępnych i zintegrowanych z systemami baz danych nazywa się często OLAM (ang. On-Line Analytical Mining). OLAM w praktyce: system RD System RD jest prototypowym rozszerzeniem serwera Oracle7 o funkcje eksploracji danych, realizującym idee przetwarzania OLAM [ZJJ+98]. Powstał on i jest rozwijany na Politechnice Poznańskiej, a stanowi głównie platformę dla implementacji wyników prowadzonych badań naukowych [MZ97], [MZ97b], [MZ98], [WZ98]. Dzięki skalowalności przyjętych rozwiązań możliwe jest jego wykorzystanie w połączeniu z komercyjnymi bazami i hurtowniami danych, a przez to rozwijanie aplikacji dynamicznego wspomagania podejmowania decyzji Z punktu widzenia użytkownika, system RD jest transparentnym dodatkiem do serwera Oracle7, poszerzającym język SQL o kilka dodatkowych poleceń, przy użyciu których możliwe jest odkrywanie reguł logicznych zachodzących w tabelach bazy danych, ich przetwarzanie, składowanie i późniejsze wykorzystywanie. Z punktu widzenia programisty, RD dostarcza uniwersalnego interfejsu API, służącego do łatwej budowy aplikacji analitycznych posiadających pełen dostęp zarówno do funkcji eksploracji danych, jak i do danych relacyjnych, których ta eksploracja dotyczy. Wreszcie z punktu widzenia technologii informatycznej, RD jest sieciowym oprogramowaniem klient/serwer, współpracującym z serwerem Oracle7, wykorzystującym tak odległe od siebie rozwiązania jak analiza leksykalna i składniowa, odkrywanie logicznych reguł asocjacyjnych, komunikacja sieciowa TCP/IP czy niskopoziomowy dostęp do bazy danych. RD dla użytkownika Korzystając z systemu RD/Oracle7, użytkownik dysponuje rozszerzonym w składni językiem SQL [MZ97b]. Podczas tworzenia nowych tabel może definiować atrybuty, służące do późniejszego przechowywania reguł asocjacyjnych, np. atrybuty typu RULE OF VARCHAR (reguły, których elementy są ciągami znaków), RULE OF NUMBER (reguły, których elementy są liczbami), RULE OF DATE (reguły, których elementy są datami). Tabele przechowujące reguły asocjacyjne mogą być wypełniane regułami wprowadzanymi przez użytkownika (rozszerzone polecenie INSERT), jak też regułami automatycznie odkrywanymi w innych tabelach. Nowe polecenie MINE pozwala na formułowanie szczegółowych żądań odkrywania reguł asocjacyjnych spełniających zadane, złożone kryteria dotyczące parametrów statystycznych reguły, jej zawartości, długości, itp. Poniżej, na rysunku 1, przedstawione zostało przykładowe polecenie MINE, odkrywające w tabeli SALES wszystkie reguły asocjacyjne potwierdzane (ang. support) przez co najmniej 0% wszystkich transakcji zakupu i zawierające produkt "szklanka" w części warunkowej (ang. body). Każda transakcja zakupu zapisana jest w atrybucie ITEM w rekordach zgrupowanych według atrybutu TRANS_ID.
3 jabłka szklanka karafka koszyk zakupów tabela SALES trans_id item szklanka karafka jabłka szklanka karafka jabłka szklanka karafka pomarańcze polecenie MINE MINE rule FOR item FROM sales WHERE support(rule)>=0. AND (item='szklanka' IN body(rule)) GROUP BY trans_id; odkryte reguły item='szklanka' -> item='karafka' item='jabłka' & item='' -> item='karafka'... Rys. 1. Polecenie MINE: odkrywanie specyficznych reguł asocjacyjnych Podstawowym narzędziem komunikacji użytkownika z systemem RD/Oracle7 przy użyciu rozszerzonego języka SQL jest program RD FrontEnd. Koncepcyjnie zbliżony do Oracle SQL Plus, cechuje się bardziej funkcjonalnym interfejsem, pracuje w środowisku Microsoft Windows 95/NT i pozwala na pracę w trybie klient/serwer w sieci TCP/IP. Okno programu RD FrontEnd zostało przedstawione na rysunku. Rys.. Program RD FrontEnd: narzędzie komunikacji użytkownika z RD RD dla programisty Funkcje systemu RD mogą być wykorzystywane przez aplikacje użytkowe współpracujące ze specjalizowanym interfejsem RD API (ang. Application Programmer's Interface). Operacje dostępne na poziomie interfejsu obejmują: nawiązanie i zamknięcie zdalnego połączenia sieciowego, otwarcie i zamknięcie rozszerzonego kursora (kursora opartego dowolnym poleceniu rozszerzonego SQL, w tym również MINE), pobranie rezultatów polecenia rozszerzonego SQL, itp.. Interfejs RD API dostarczony został w postaci biblioteki DLL systemu Microsoft Windows i w związku z tym może być obsługiwany przez dowolne kompilatory pracujące w tym systemie. W efekcie programista uzyskuje możliwość tworzenia aplikacji dla eksploracji danych w językach takich jak: Visual Basic, Borland Delphi, Borland C++/Builder, Oracle Developer/000 itd.. Poniżej, na rysunku, przedstawiono fragment przykładowego kodu źródłowego aplikacji
4 dla eksploracji danych, która odkrywa reguły asocjacyjne zgodnie z założeniami z rysunku 1, a ich treść wyświetla na standardowym urządzeniu wyjściowym. Na rysunku 4 pokazano okno prostej przykładowej aplikacji użytkowej zbudowanej na platformie RD. Aby z niej efektywnie korzystać, użytkownik nie musi posiadać żadnych doświadczeń ani w zakresie eksploracji danych, ani w zakresie formułowania poleceń w języku SQL. /* nawiązanie połączenia z systemem RD */ session_id = SessionOpen("scott", "tiger", "ora7.pl", "cactus.db.com.pl"); /* wysłanie do RD treści polecenia MINE dla odkrywania reguł asocjacyjnych - otwarcie kursora */ cursor_id = QueryOpen(session_id,"mine rule for item from sales... group by trans_id); /* pobieranie kolejnych pozycji wyniku polecenia aż do ich wyczerpania*/ while not QueryEOD(session_id, cursor_id) { /* pobranie kolejnej pozycji wyniku z kursora */ QueryNext(session_id, cursor_id); /* wyświetlenie pierwszej wartości bieżącej pozycji wyniku polecenia */ printf("%s\n", FieldValue(session_id, cursor_id, 1); } /* zamknięcie wykorzystanego kursora */ QueryClose(session_id, cursor_id); /* zakończenie połączenia z systemem RD */ SessionClose(session_id); Rys.. Przykładowy kod aplikacji dla eksploracji danych zbudowanej w oparciu o RD API Rys. 4. Demonstracyjna aplikacja użytkowa zbudowana na platformie RD Architektura wewnętrzna RD System RD posiada budowę modularną, pozwalając na łatwą podmianę wyraźnie wyróżnionych komponentów w celu nieskomplikowanej adaptacji do np. odmiennego protokołu sieciowego, czy współpracy z innym systemem bazy danych. Oprogramowanie zostało przygotowane w języku C++, z użyciem kompilatorów Borland C i Borland C++ Builder.0, a funkcjonuje w konfiguracji klient/serwer, na platformie Microsoft Windows 95/NT. Schemat poglądowy architektury wewnętrznej RD został zamieszczony na rysunku 5. Aplikacje użytkowe przekazują treści poleceń rozszerzonego języka SQL przez interfejs RD API (1), którego funkcje są odwzorowywane w funkcje warstwy komunikacji sieciowej (). Po przesłaniu przez sieć komunikacyjną, polecenia rozszerzonego SQL są rozpoznawane przez moduł parsera () (analizatora leksykalnoskładniowego). Następnie, w zależności od charakteru analizowanego polecenia, do jego wykonania angażowany jest moduł eksploracji danych (4) lub wyłącznie interfejs bazy danych Oracle (5). Dla każdej sesji użytkownika tworzony jest niezależny proces serwera RD (++4+5), a koordynacją nawiązywania połączeń zajmuje się niewielki moduł demona RD.
5 1 aplikacja końcowa RD API warstwa sieciowa TCP/IP WinSockets demon RD OCI warstwa sieciowa 4 parser SQL data mining interfejs Oracle RDBMS Oracle7 5 Rys. 5. Wewnętrzna architektura systemu RD Technologie RD: jak rozwiązać komunikację sieciową? Windows Sockets. Ze względu na konieczność zachowania niezależności od wykorzystywanego systemu bazy danych oraz podniesienia wydajności transmisji, system RD nie wykorzystuje oprogramowania sieciowego Oracle SQL*Net V. Dla przesyłania treści poleceń SQL, ich wyników oraz komunikatów sterujących (opracowany protokół RD Net) zastosowano sieciowy interfejs programowy Windows Sockets, który bazuje na popularnym modelu gniazd BSD (ang. BSD sockets) [HTA+9]. Dla pobieżnego zilustrowania zasad programowania z użyciem Windows Sockets, na rysunku 6 zamieszczono fragment kodu przykładowego programu, przesyłającego krótki komunikat tekstowy do komputera cactus.db.com.pl, na port o numerze int sockfd; struct sockaddr_in serv_addr; /* ustalenie adresu odbiorcy, numeru portu i typu transmisji */ serv_addr.sin_family = AF_INET; serv_addr.sin_addr.s_addr = inet_addr("cactus.db.com.pl"); serv_addr.sin_port = htons(9999); sockfd = socket(af_inet, SOCK_STREAM, 0)); /* nawiązanie połączenia z odbiorcą */ connect(sockfd, (struct sockaddr *) &serv_addr, sizeof(serv_addr)); /* przesłanie pakietu sieciowego z przykładowym komunikatem */ send(sockfd, "Tekst do wysłania", MSG_SIZE, 0); /* zamknięcie połączenia */ closesocket(sockfd); Rys. 6. Fragment przykładowego kodu programu komunikacji sieciowej z Windows Sockets Technologie RD: jak wykonać analizę leksykalną i składniową? Lex i Yacc. Ponieważ system RD realizuje żądania wyrażone w rozszerzonym języku SQL, dlatego konieczne jest posiadanie oprogramowania parsera rozpoznającego dodatkowe polecenia (np. MINE) i dokonującego ich rozkładu leksykalnego i składniowego. Dla przygotowania kodu źródłowego parsera dla RD wykorzystano znane z systemu UNIX narzędzia Lex i Yacc (rysunek 7). Lex jest programem narzędziowym, który na podstawie przygotowanej przez programistę specyfikacji automatycznie generuje kod źródłowy tzw. analizatora leksykalnego, czyli programu rozpoznającego słowa kluczowe języka. Analogicznie, Yacc jest programem narzędziowym, który na podstawie dostarczonej gramatyki języka automatycznie generuje kod źródłowy tzw. analizatora składniowego, czyli programu, który rozpoznaje całe polecenia języka. Użycie narzędzi Lex i Yacc pozwoliło na elastyczność modyfikacji składni rozszerzeń języka SQL już w czasie realizacji projektu. Nie bez
6 znaczenia jest również łatwość dodawania poleceń o nowej składni bez konieczności dokonywania globalnych zmian kodu źródłowego. specyfikacja leksykalna LEX YACC gramatyka języka kod źródłowy analizatora leksykalnego kod źródłowy analizatora składniowego kompilator + linker parser Rys. 7. Budowa parsera przy użyciu narzędzi Lex i Yacc Technologie RD: jak C komunikuje się z Oracle? OCI. Eksploracja danych wymaga sprawnego i intensywnego dostępu do dużych wolumenów danych składowanych w bazie danych. Aby zapewnić dostęp do bazy danych na najniższym poziomie logicznym, funkcje RD korzystają z programowego interfejsu OCI (Oracle Call Interface). OCI pozwala programiście na manipulację danymi zgromadzonymi w bazie danych Oracle z poziomu programu napisanego w języku wysokiego poziomu. Programista realizuje każde polecenie SQL za pomocą kolejno wywoływanych funkcji OCI, realizujących następujące zadania: analizę leksykalną i składniową, wiązanie zmiennych wejściowych, wiązanie zmiennych wyjściowych, wykonanie polecenia i pobranie rekordów wyniku. Przykładowy fragment kodu programu wykorzystującego OCI zamieszczono na rysunku 8. /* treść bloku PL/SQL do wykonania */ char stmt[] = "begin my_procedure(:x, :y); end;"; int x; float y; /* analiza leksykalna i składniowa bloku PL/SQL */ if (oparse(&cda, stmt, -1, 1, )) oci_error(&cda); /* wiązanie i podstawienie parametrów wywołania procedury my_procedure */ if (obndrv(&cda, ":x", -1, &xnum, sizeof (int),, -1, 0, 0, -1, -1)) oci_error(&cda); if (obndrv(&cda, ":y", -1, &ynum, sizeof (float), 4, -1, 0, 0, -1, -1)) oci_error(&cda); xnum = 10; ynum = 5.5; /* wykonanie bloku PL/SQL */ if (oexec(&cda)) oci_error(&cda); /* zatwierdzenie transakcji */ if (ocom(&lda)) oci_error(&cda); Rys. 8. Fragment przykładowego wykorzystania interfejsu OCI dla wykonania bloku PL/SQL Technologie RD: jak odkrywać reguły asocjacyjne? Znanych jest wiele algorytmów odkrywania reguł asocjacyjnych, różniących się efektywnością i klasą zastosowań [AIS9], [AS94], MTV94], [SA95], [SA96]. RD wykorzystuje zoptymalizowaną wersję najpopularniejszego algorytmu, nazywanego Apriori [AS94], [MZ97]. Ogólna zasada działania algorytmu Apriori polega na znajdowaniu najczęściej występujących zbiorów - tzw. zbiorów częstych, a następnie generowaniu reguł asocjacyjnych na podstawie każdego ze znalezionych zbiorów częstych. Z punktu widzenia złożoności czasowej kluczowym podproblemem jest tutaj znajdowanie zbiorów częstych - wymaga ono wykonania N lub N+1 pełnych odczytów całej bazy danych, gdzie N jest rozmiarem największego znalezionego zbioru częstego. Zastosowana w RD optymalizacja algorytmu Apriori pozwala częściowo ograniczyć zakres
7 przeszukiwań bazy danych oraz liczbę iteracji. W efekcie, ograniczenia narzucane przez użytkownika na odkrywane reguły asocjacyjne są skutecznie wykorzystywane do poprawy czasu odpowiedzi systemu, co pozwala na wysoce interaktywną pracę całego środowiska. Wachlarz zastosowań RD: kredyty, ubezpieczenia, marketing. Lista możliwych zastosowań eksploracji danych, a tym samym zastosowań systemu RD jest bardzo długa i jest systematycznie poszerzana. Poniżej przedstawiono kilka "sztandarowych" przykładów z dziedzin bankowości, ubezpieczeń i marketingu. Banki gromadzą wiele szczegółowych informacji dotyczących swoich kredytobiorców: dochody, zawód, miejsce pracy, wiek, miejsce zamieszkania, wydatki itp. Gdy klient banku ubiega się o przyznanie kredytu, wtedy informacje te mogą być użyteczne dla podjęcia właściwej decyzji: czy przyznać kredyt, osiągać z tego tytułu zyski, ale ryzykować bankructwo klienta, czy też nie przyznawać kredytu, a przez to pomniejszyć swoje potencjalne zyski z odsetek. Praktyka dowodzi, że to właśnie eksploracja danych może zostać wykorzystana dla znalezienia quasi-optymalnego rozwiązania powyższego problemu. W wyniku analizy baz danych o kredytach przyznawanych w przeszłości generowane są reguły asocjacyjne uzależniające regularną spłatę kredytów od pewnych cech osobowych klienta. Następnie, znalezione reguły są aplikowane do nowych kredytobiorców, pozwalając na predykcję przyszłego postępowania kredytobiorcy wobec banku przyznającego kredyt. Firmy ubezpieczeniowe są zainteresowane takim ustalaniem składek ubezpieczeniowych OC/AC, aby były one proporcjonalne do prawdopodobieństwa spowodowania wypadku przez ubezpieczonego. Również tutaj eksploracja danych może być wysoce użyteczna dla znalezienia prostych zależności pomiędzy np. marką pojazdu, mocą silnika, wiekiem kierowcy, miejscem zamieszkania, itp. a szkodliwością wyrażaną przez kwotę wypłaconych odszkodowań. Reguły asocjacyjne odkrywane w bazie danych o wypłacanych odszkodowaniach stanowią wiarygodną podstawę dla opracowania nowych taryf ubezpieczeniowych. Coraz powszechniej spotykamy się z różnymi formami zdalnej promocji, polegającej na wysyłaniu potencjalnym klientom propozycji zakupu określonych towarów. Aby taki mechanizm cechował się wysoką skutecznością, klienci, na których kierowana jest promocja, muszą podlegać specjalnej selekcji. Taka selekcja może być dokonywana na podstawie zapisów o dotychczasowych efektach prowadzonych akcji promocyjnych (eksploracja danych!), a efektem będzie wysoki odsetek klientów, którzy odpowiadają na wysyłane propozycje. Na rysunku 9 przedstawiono przykłady reguł asocjacyjnych, które obrazują opisane powyżej klasy zastosowań. Każda z reguł reprezentuje zależności odkryte w posiadanych bazach danych i każda może być wykorzystana do predykcji przyszłych wartości i zachowań. Komu przyznać kredyt? dochod='50k-100k' & miasto='poznań' & stan_c='żonaty/zamężna' -> czy_splata_regularna='t' dochod='0-10k' & miasto='brak zameldowania' -> czy_splata_regularna='n' NIE Jakie stawki ubezpieczeniowe? TAK marka='bmw' & moc='150-00' & k_wiek='18-5' & miasto='warszawa' -> szkodliwosc='70-80%' marka='toyota' & miasto='poznań' & zawod='informatyk' -> szkodliwosc='0-10%' Do kogo wysyłać oferty? wiek='65-70' & miasto=' k' -> produkt='ksiązki' zawod='student/uczeń' -> produkt='-' Podwyżka składek dla młodych warszawskich kierowców BMW z dużymi silnikami! Oferty zakupu książek wysyłać tylko do starszych mieszkańców dużych miast Rys. 9. Reguły asocjacyjne w różnych zastosowaniach Podsumowanie W artykule przedstawiono systemowe środowisko RD dla bieżącej eksploracji danych, które rozszerza funkcjonalność systemu zarządzania bazą danych Oracle. Pomimo, iż RD stanowi prototyp badawczy wykorzystywany do oceny efektywności rozwijanych technik i algorytmów, to jednak jego własności mogą być
8 komercyjnie wykorzystywanie do budowy aplikacji dla eksploracji danych. Jego ścisła, lecz nie nierozłączna integracja z systemem zarządzania bazą danych Oracle7 gwarantuje szerokie możliwości wykorzystania w systemach wspomagania podejmowania decyzji bazujących na popularnych hurtowniach danych lub bazach danych. Do budowy RD wykorzystano szereg różnorodnych zaawansowanych technologii informatycznych, co przy jego modularnej architekturze umożliwia łatwe rozszerzanie lub migrację. System powstał w Instytucie Informatyki Politechniki Poznańskiej. Referencje [AIS9] R. Agrawal, T. Imielinski, A. Swami, Mining Association Rules Between Sets of Items in Large Databases, Proc. ACM SIGMOD Conference, pp , Washington DC, USA, May 199 [AMS+96] R. Agrawal, M. Mehta, J. Shafer, R. Srikant, A. Arning, T. Bollinger, "The Quest Data Mining System", Proc. of the nd Int'l Conference on Knowledge Discovery in Databases and Data Mining, Portland, Oregon, August 1996 [AS94] R. Agrawal, R. Srikant, Fast Algorithms for Mining Association Rules, Proc. 0 th Int l Conf. Very Large Data Bases, pp , Santiago, Chile, 1994 [CD97] S. Chaudhuri, U. Dayal, "An Overview of Data Warehousing and OLAP Technology", SIGMOD Record, Vol. 6, No. 1, March 1997 [FPS96] U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, The KDD Process for Extracting Useful Knowledge from Volumes of Data, Comm. of the ACM, Vol. 9, No. 11, November 1996 [HTA+9] M. Hall, M. Towfiq, G. Arnold, D. Treadwell, H. Sanders Windows Sockets - An Open Interface for [IM96] [MTV94] [MZ97] [MZ97b] [MZ98] [SA95] [SA96] [Wid95] [WZ98] [Zak97] [ZJJ+98] Network Programming under Microsoft Windows version 1.1, 199 T. Imielinski T., Manilla H., A Database Perspective on Knowledge Discovery, Comm. of the ACM, Vol. 9, No. 11, November 1996 H. Manilla, H. Toivonen, A. Inkeri Verkamo, Efficient Algorithms for Discovering Association Rules, Proc. AAAI Workshop Knowledge Discovery in Databases, pp , July 1994 T. Morzy, M. Zakrzewicz, "Constraints-Driven Algorithm for Mining Association Rules On Demand", Technical Report RA-004/97, Poznań University of Technology, 1997 T. Morzy, M. Zakrzewicz, "SQL-Like Language For Database Mining", 1 st International Conference on Advances in Databases and Information Systems, pp , St. Petersburg, Sept T. Morzy, M. Zakrzewicz, "Group Bitmap Index: A Structure for Association Rules Retrieval", Proc. of 4th International Conference on Knowledge Discovery and Data Mining, AAAI Press, New York, August 1998 R. Srikant, R. Agrawal, Mining Generalized Association Rules, Proc. 1th Int l Conf. Very Large Data Bases, pp , Zurich, Switzerland, Sept R. Srikant, R. Agrawal, Mining Quantitative Association Rules in Large Relational Tables, Proc ACM SIGMOD Conference, Montreal, Canada, June 1996 J. Widom, "Research Problems in Data Warehousing", Proc. 4th International CIKM Conference, 1995 M. Wojciechowski, M. Zakrzewicz, "Itemset Materializing for Fast Mining of Association Rules", Proc. of nd International Conference on Advances in Databases and Information Systems, Lecture Notes in Computer Science, vol. 1575, pp , Poznań, 1998 M. Zakrzewicz, "Data Mining i odkrywanie wiedzy w bazach danych", Materialy konf. Polish Oracle Users Group PLOUG'97, str , Zakopane, 1997 M. Zakrzewicz, T. Januszewski, T. Jańczuk, Ł. Józefowski, W. Kaczmarek, W. Szczęsny, "RD: Prototypowy system odkrywania reguł asocjacyjnych w relacyjnych bazach danych", Raport techniczny, Politechnika Poznańska, 1998
Usługi analityczne budowa kostki analitycznej Część pierwsza.
Usługi analityczne budowa kostki analitycznej Część pierwsza. Wprowadzenie W wielu dziedzinach działalności człowieka analiza zebranych danych jest jednym z najważniejszych mechanizmów podejmowania decyzji.
Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH
Wstęp. Architektura hurtowni. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH B. Inmon, 1996: Hurtownia to zbiór zintegrowanych, nieulotnych, ukierunkowanych
Podyplomowe Studium Informatyki w Bizniesie Wydział Matematyki i Informatyki, Uniwersytet Łódzki specjalność: Tworzenie aplikacji w środowisku Oracle
Podyplomowe Studium Informatyki w Bizniesie Wydział Matematyki i Informatyki, Uniwersytet Łódzki specjalność: Tworzenie aplikacji w środowisku Oracle EFEKTY KSZTAŁCENIA Wiedza Absolwent tej specjalności
Bazy danych 2. Wykład 1
Bazy danych 2 Wykład 1 Sprawy organizacyjne Materiały i listy zadań zamieszczane będą na stronie www.math.uni.opole.pl/~ajasi E-mail: standardowy ajasi@math.uni.opole.pl Sprawy organizacyjne Program wykładu
Wykład I. Wprowadzenie do baz danych
Wykład I Wprowadzenie do baz danych Trochę historii Pierwsze znane użycie terminu baza danych miało miejsce w listopadzie w 1963 roku. W latach sześcdziesątych XX wieku został opracowany przez Charles
15. Funkcje i procedury składowane PL/SQL
15. Funkcje i procedury składowane PLSQL 15.1. SQL i PLSQL (Structured Query Language - SQL) Język zapytań strukturalnych SQL jest zbiorem poleceń, za pomocą których programy i uŝytkownicy uzyskują dostęp
Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na
Techniki indeksowania w eksploracji danych Maciej Zakrzewicz Instytut Informatyki Politechnika Poznańska Plan prezentacji Zastosowania indeksów w systemach baz danych Wprowadzenie do metod eksploracji
Wprowadzenie do technologii Business Intelligence i hurtowni danych
Wprowadzenie do technologii Business Intelligence i hurtowni danych 1 Plan rozdziału 2 Wprowadzenie do Business Intelligence Hurtownie danych Produkty Oracle dla Business Intelligence Business Intelligence
INFORMATYKA Pytania ogólne na egzamin dyplomowy
INFORMATYKA Pytania ogólne na egzamin dyplomowy 1. Wyjaśnić pojęcia problem, algorytm. 2. Podać definicję złożoności czasowej. 3. Podać definicję złożoności pamięciowej. 4. Typy danych w języku C. 5. Instrukcja
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych
Plan. Wprowadzenie. Co to jest APEX? Wprowadzenie. Administracja obszarem roboczym
1 Wprowadzenie do środowiska Oracle APEX, obszary robocze, użytkownicy Wprowadzenie Plan Administracja obszarem roboczym 2 Wprowadzenie Co to jest APEX? Co to jest APEX? Architektura Środowisko Oracle
Systemy GIS Systemy baz danych
Systemy GIS Systemy baz danych Wykład nr 5 System baz danych Skomputeryzowany system przechowywania danych/informacji zorganizowanych w pliki Użytkownik ma do dyspozycji narzędzia do wykonywania różnych
1 Wprowadzenie do J2EE
Wprowadzenie do J2EE 1 Plan prezentacji 2 Wprowadzenie do Java 2 Enterprise Edition Aplikacje J2EE Serwer aplikacji J2EE Główne cele V Szkoły PLOUG - nowe podejścia do konstrukcji aplikacji J2EE Java 2
PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"
PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych
Hurtownie danych. 31 stycznia 2017
31 stycznia 2017 Definicja hurtowni danych Hurtownia danych wg Williama Inmona zbiór danych wyróżniający się następującymi cechami uporządkowany tematycznie zintegrowany zawierający wymiar czasowy nieulotny
Eksploracja danych: problemy i rozwiązania
V Konferencja PLOUG Zakopane Październik 1999 Eksploracja danych: problemy i rozwiązania Tadeusz Morzy morzy@put.poznan.pl Instytut Informatyki Politechnika Poznańska Streszczenie Artykuł zawiera krótką
Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL
Podstawy baz danych: Rysunek 1. Tradycyjne systemy danych 1- Obsługa wejścia 2- Przechowywanie danych 3- Funkcje użytkowe 4- Obsługa wyjścia Ewolucja baz danych: Fragment świata rzeczywistego System przetwarzania
AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7
AUREA BPM Oracle TECNA Sp. z o.o. Strona 1 z 7 ORACLE DATABASE System zarządzania bazą danych firmy Oracle jest jednym z najlepszych i najpopularniejszych rozwiązań tego typu na rynku. Oracle Database
Informatyka I. Standard JDBC Programowanie aplikacji bazodanowych w języku Java
Informatyka I Standard JDBC Programowanie aplikacji bazodanowych w języku Java dr inż. Andrzej Czerepicki Politechnika Warszawska Wydział Transportu 2017 Standard JDBC Java DataBase Connectivity uniwersalny
Projektowanie architektury systemu rozproszonego. Jarosław Kuchta Projektowanie Aplikacji Internetowych
Projektowanie architektury systemu rozproszonego Jarosław Kuchta Zagadnienia Typy architektury systemu Rozproszone przetwarzanie obiektowe Problemy globalizacji Problemy ochrony Projektowanie architektury
Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu
i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę
SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści
SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop. 2016 Spis treści O autorach 11 Podziękowania 12 Część I Wprowadzenie do języka SQL 13 Godzina 1. Witamy w świecie języka SQL 15
Bazy danych - wykład wstępny
Bazy danych - wykład wstępny Wykład: baza danych, modele, hierarchiczny, sieciowy, relacyjny, obiektowy, schemat logiczny, tabela, kwerenda, SQL, rekord, krotka, pole, atrybut, klucz podstawowy, relacja,
Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu
i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę
ActiveXperts SMS Messaging Server
ActiveXperts SMS Messaging Server ActiveXperts SMS Messaging Server to oprogramowanie typu framework dedykowane wysyłaniu, odbieraniu oraz przetwarzaniu wiadomości SMS i e-mail, a także tworzeniu własnych
Tworzenie aplikacji bazodanowych
Wydział Informatyki Politechnika Białostocka Studia stacjonarne Tworzenie aplikacji bazodanowych Prowadzący: pokój: E-mail: WWW: Małgorzata Krętowska, Agnieszka Oniśko 206 (Małgorzata Krętowska), 207 (Agnieszka
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów Łukasz Piątek, Jerzy W. Grzymała-Busse Katedra Systemów Ekspertowych i Sztucznej Inteligencji, Wydział Informatyki
Bazy danych Wykład zerowy. P. F. Góra
Bazy danych Wykład zerowy P. F. Góra http://th-www.if.uj.edu.pl/zfs/gora/ 2012 Patron? Św. Izydor z Sewilli (VI wiek), biskup, patron Internetu (sic!), stworzył pierwszy katalog Copyright c 2011-12 P.
SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD
Dr inż. Jacek WARCHULSKI Dr inż. Marcin WARCHULSKI Mgr inż. Witold BUŻANTOWICZ Wojskowa Akademia Techniczna SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Streszczenie: W referacie przedstawiono możliwości
Instalacja SQL Server Express. Logowanie na stronie Microsoftu
Instalacja SQL Server Express Logowanie na stronie Microsoftu Wybór wersji do pobrania Pobieranie startuje, przechodzimy do strony z poradami. Wypakowujemy pobrany plik. Otwiera się okno instalacji. Wybieramy
INFORMATYKA TECHNICZNA Badanie możliwości wykorzystania języka AutoLISP i środowiska VisualLISP w systemie CAx
INFORMATYKA TECHNICZNA Badanie możliwości wykorzystania języka AutoLISP i środowiska VisualLISP w systemie CAx 1. WPROWADZENIE Program AutoCAD ma wielu użytkowników i zajmuje znaczące miejsce w graficznym
Zdalne monitorowanie i zarządzanie urządzeniami sieciowymi
Uniwersytet Mikołaja Kopernika w Toruniu Wydział Matematyki i Informatyki Wydział Fizyki, Astronomii i Infomatyki Stosowanej Piotr Benetkiewicz Nr albumu: 168455 Praca magisterska na kierunku Informatyka
Wybrane działy Informatyki Stosowanej
Wybrane działy Informatyki Stosowanej Java Enterprise Edition WebServices Serwer aplikacji GlassFish Dr hab. inż. Andrzej Czerepicki a.czerepicki@wt.pw.edu.pl http://www2.wt.pw.edu.pl/~a.czerepicki Aplikacje
Diagramy związków encji. Laboratorium. Akademia Morska w Gdyni
Akademia Morska w Gdyni Gdynia 2004 1. Podstawowe definicje Baza danych to uporządkowany zbiór danych umożliwiający łatwe przeszukiwanie i aktualizację. System zarządzania bazą danych (DBMS) to oprogramowanie
Dokumentacja wstępna TIN. Rozproszone repozytorium oparte o WebDAV
Piotr Jarosik, Kamil Jaworski, Dominik Olędzki, Anna Stępień Dokumentacja wstępna TIN Rozproszone repozytorium oparte o WebDAV 1. Wstęp Celem projektu jest zaimplementowanie rozproszonego repozytorium
TRX API opis funkcji interfejsu
TRX Krzysztof Kryński Cyfrowe rejestratory rozmów seria KSRC TRX API opis funkcji interfejsu Kwiecień 2013 Copyright TRX TRX ul. Garibaldiego 4 04-078 Warszawa Tel. 22 871 33 33 Fax 22 871 57 30 www.trx.com.pl
Multi-wyszukiwarki. Mediacyjne Systemy Zapytań wprowadzenie. Architektury i technologie integracji danych Systemy Mediacyjne
Architektury i technologie integracji danych Systemy Mediacyjne Multi-wyszukiwarki Wprowadzenie do Mediacyjnych Systemów Zapytań (MQS) Architektura MQS Cechy funkcjonalne MQS Cechy implementacyjne MQS
InPro BMS InPro BMS SIEMENS
InPro Siemens OPC InPro BMS Produkt InPro BMS jest w sprzedaży od 2000 roku. W ostatnich kilku latach staliśmy się liderem wśród dostawców informatycznych rozwiązań dla systemów bezpieczeństwa. Oferowane
Informatyka I. Programowanie aplikacji bazodanowych w języku Java. Standard JDBC.
Informatyka I Programowanie aplikacji bazodanowych w języku Java. Standard JDBC. dr hab. inż. Andrzej Czerepicki Politechnika Warszawska Wydział Transportu 2019 Standard JDBC Java DataBase Connectivity
Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi
Systemy baz danych w zarządzaniu przedsiębiorstwem W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Proces zarządzania danymi Zarządzanie danymi obejmuje czynności: gromadzenie
DLA SEKTORA INFORMATYCZNEGO W POLSCE
DLA SEKTORA INFORMATYCZNEGO W POLSCE SRK IT obejmuje kompetencje najważniejsze i specyficzne dla samego IT są: programowanie i zarządzanie systemami informatycznymi. Z rozwiązań IT korzysta się w każdej
Praca Magisterska "System zdalnego składania ofert kupna i sprzedaży za pośrednictwem Internetu" AUTOR PROMOTOR
System Oferta Praca Magisterska Niniejszy system powstał w ramach pracy magisterskiej "System zdalnego składania ofert kupna i sprzedaży za pośrednictwem Internetu". Politechnika Poznańska Wydział Informatyki
dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych
- Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku 1 - - 2 3 4 5 - The purpose of computing is insight, not numbers Richard Hamming Motywacja - Mamy informację,
HURTOWNIE DANYCH I BUSINESS INTELLIGENCE
BAZY DANYCH HURTOWNIE DANYCH I BUSINESS INTELLIGENCE Akademia Górniczo-Hutnicza w Krakowie Adrian Horzyk horzyk@agh.edu.pl Google: Horzyk HURTOWNIE DANYCH Hurtownia danych (Data Warehouse) to najczęściej
Oracle11g: Wprowadzenie do SQL
Oracle11g: Wprowadzenie do SQL OPIS: Kurs ten oferuje uczestnikom wprowadzenie do technologii bazy Oracle11g, koncepcji bazy relacyjnej i efektywnego języka programowania o nazwie SQL. Kurs dostarczy twórcom
INŻYNIERIA OPROGRAMOWANIA
INSTYTUT INFORMATYKI STOSOWANEJ 2013 INŻYNIERIA OPROGRAMOWANIA Inżynieria Oprogramowania Proces ukierunkowany na wytworzenie oprogramowania Jak? Kto? Kiedy? Co? W jaki sposób? Metodyka Zespół Narzędzia
Ewelina Dziura Krzysztof Maryański
Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład
Efekt kształcenia. Ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną w zakresie algorytmów i ich złożoności obliczeniowej.
Efekty dla studiów pierwszego stopnia profil ogólnoakademicki na kierunku Informatyka w języku polskim i w języku angielskim (Computer Science) na Wydziale Matematyki i Nauk Informacyjnych, gdzie: * Odniesienie-
Dokument Detaliczny Projektu Temat: Księgarnia On-line Bukstor
Koszalin, 15.06.2012 r. Dokument Detaliczny Projektu Temat: Księgarnia On-line Bukstor Zespół projektowy: Daniel Czyczyn-Egird Wojciech Gołuchowski Michał Durkowski Kamil Gawroński Prowadzący: Dr inż.
Oferta szkoleniowa Yosi.pl 2012/2013
Oferta szkoleniowa Yosi.pl 2012/2013 "Podróżnik nie posiadający wiedzy, jest jak ptak bez skrzydeł" Sa'Di, Gulistan (1258 rok) Szanowni Państwo, Yosi.pl to dynamicznie rozwijająca się firma z Krakowa.
Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik
Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik Technologia Przykłady praktycznych zastosowań wyzwalaczy będą omawiane na bazie systemu MS SQL Server 2005 Wprowadzenie
PRZESTRZENNE BAZY DANYCH WYKŁAD 2
PRZESTRZENNE BAZY DANYCH WYKŁAD 2 Baza danych to zbiór plików, które fizycznie przechowują dane oraz system, który nimi zarządza (DBMS, ang. Database Management System). Zadaniem DBMS jest prawidłowe przechowywanie
INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X
Wrocław 2006 INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X Paweł Skrobanek C-3, pok. 323 e-mail: pawel.skrobanek@pwr.wroc.pl INTERNETOWE BAZY DANYCH PLAN NA DZIŚ zajęcia 1: 2. Procedury składowane
ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia
ZP/ITS/11/2012 Załącznik nr 1a do SIWZ ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia Przedmiotem zamówienia jest: Przygotowanie zajęć dydaktycznych w postaci kursów e-learningowych przeznaczonych
Spis treści. Przedmowa
Spis treści Przedmowa V 1 SQL - podstawowe konstrukcje 1 Streszczenie 1 1.1 Bazy danych 1 1.2 Relacyjny model danych 2 1.3 Historia języka SQL 5 1.4 Definiowanie danych 7 1.5 Wprowadzanie zmian w tabelach
Model semistrukturalny
Model semistrukturalny standaryzacja danych z różnych źródeł realizacja złożonej struktury zależności, wielokrotne zagnieżdżania zobrazowane przez grafy skierowane model samoopisujący się wielkości i typy
Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2013/2014
Politechnika Krakowska im. Tadeusza Kościuszki Karta przedmiotu Wydział Mechaniczny obowiązuje studentów rozpoczynających studia w roku akademickim 2013/2014 Kierunek studiów: Informatyka Stosowana Forma
Organizacja zajęć BAZY DANYCH II WYKŁAD 1. Plan wykładu. SZBD Oracle 2010-10-21
Organizacja zajęć BAZY DANYCH II WYKŁAD 1 Wykładowca dr inż. Agnieszka Bołtuć, pokój 304, e-mail: aboltuc@ii.uwb.edu.pl Liczba godzin i forma zajęć: 15 godzin wykładu oraz 30 godzin laboratorium Konsultacje:
Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski
Data Mining Wykład 1 Wprowadzenie do Eksploracji Danych Prowadzący Dr inż. Jacek Lewandowski Katedra Genetyki Wydział Biologii i Hodowli Zwierząt Uniwersytet Przyrodniczy we Wrocławiu ul. Kożuchowska 7,
Bazy danych i strony WWW
Bazy danych i strony WWW Obsługa baz danych poprzez strony WWW Niezbędne narzędzia: serwer baz danych np. MySQL serwer stron WWW np. Apache przeglądarka stron WWW interpretująca język HTML język skryptowy
Włodzimierz Dąbrowski, Przemysław Kowalczuk, Konrad Markowski. Bazy danych ITA-101. Wersja 1
Włodzimierz Dąbrowski, Przemysław Kowalczuk, Konrad Markowski Bazy danych ITA-101 Wersja 1 Warszawa, wrzesień 2009 Wprowadzenie Informacje o kursie Opis kursu We współczesnej informatyce coraz większą
Zadanie nr 4.5: Oprogramowanie bazodanowe. Lp. Zwartość karty Opis 1 Specyfikacja techniczna / funkcjonalna przedmiotu zamówienia
Zadanie nr 4.5: Oprogramowanie bazodanowe Lp. Zwartość karty Opis 1 Specyfikacja techniczna / funkcjonalna przedmiotu zamówienia Zakres przedmiotu zamówienia obejmuje dostarczenie, wdrożenie oraz konfigurację
Analiza danych i data mining.
Analiza danych i data mining. mgr Katarzyna Racka Wykładowca WNEI PWSZ w Płocku Przedsiębiorczy student 2016 15 XI 2016 r. Cel warsztatu Przekazanie wiedzy na temat: analizy i zarządzania danymi (data
System automatycznego wysyłania SMSów SaldoSMS
KWSOFT Pleszew 8-03-2005 Ul. Witkiewicza 9 63-300 Pleszew tel. 0509 370 429 http://www.kwsoft.com.pl kwsoft@kwsoft.com.pl System automatycznego wysyłania SMSów SaldoSMS Przygotowali: Krzysztof Juśkiewicz
PLAN WYNIKOWY PROGRAMOWANIE APLIKACJI INTERNETOWYCH. KL IV TI 6 godziny tygodniowo (6x15 tygodni =90 godzin ),
PLAN WYNIKOWY PROGRAMOWANIE APLIKACJI INTERNETOWYCH KL IV TI 6 godziny tygodniowo (6x15 tygodni =90 godzin ), Program 351203 Opracowanie: Grzegorz Majda Tematyka zajęć 2. Przygotowanie środowiska pracy
Shapefile, GeoPackage czy PostGIS. Marta Woławczyk (QGIS Polska)
Shapefile, GeoPackage czy PostGIS Marta Woławczyk (QGIS Polska) Shapefile Format plików przechowywujących dane wektorowe (punkty, linie, poligony) opracowany przez firmę ESRI w 1998 roku. Składa się z
Dział Temat lekcji Ilość lekcji. godz. 1 Organizacja zajęć Omówienie programu nauczania 3
rzedmiot : Systemy baz Rok szkolny : 2015/2016 Klasa : INF godz. x 0 = 90 godz. Zawód : technik informatyk; symbol 5120 rowadzący : Jacek Herbut, Henryk Kuczmierczyk Henryk Kuczmierczyk Numer Dział Temat
Rok szkolny 2015/16 Sylwester Gieszczyk. Wymagania edukacyjne w technikum. ADMINISTROWANIE BAZAMI DANYCH kl. 4c
Wymagania edukacyjne w technikum ADMINISTROWANIE BAZAMI DANYCH kl. 4c Lp. 1 2 4 5 Temat Zasady dotyczące zarządzania projektem podczas prac związanych z tworzeniem bazy oraz cykl życiowy bazy Modele tworzenia
Programowanie obiektowe
Programowanie obiektowe Wykład 13 Marcin Młotkowski 27 maja 2015 Plan wykładu Trwałość obiektów 1 Trwałość obiektów 2 Marcin Młotkowski Programowanie obiektowe 2 / 29 Trwałość (persistence) Definicja Cecha
Podstawy programowania
Podstawy programowania Część pierwsza Od języka symbolicznego do języka wysokiego poziomu Autor Roman Simiński Kontakt roman.siminski@us.edu.pl www.us.edu.pl/~siminski Niniejsze opracowanie zawiera skrót
Co to jest Business Intelligence?
Cykl: Cykl: Czwartki z Business Intelligence Sesja: Co Co to jest Business Intelligence? Bartłomiej Graczyk 2010-05-06 1 Prelegenci cyklu... mariusz@ssas.pl lukasz@ssas.pl grzegorz@ssas.pl bartek@ssas.pl
Ćwiczenie 5. Metody eksploracji danych
Ćwiczenie 5. Metody eksploracji danych Reguły asocjacyjne (association rules) Badaniem atrybutów lub cech, które są powiązane ze sobą, zajmuje się analiza podobieństw (ang. affinity analysis). Metody analizy
ZAMAWIAJĄCY. CONCEPTO Sp. z o.o.
Grodzisk Wielkopolski, dnia 11.02.2013r. ZAMAWIAJĄCY z siedzibą w Grodzisku Wielkopolskim (62-065) przy ul. Szerokiej 10 realizując zamówienie w ramach projektu dofinansowanego z Programu Operacyjnego
REFERAT PRACY DYPLOMOWEJ
REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i implementacja środowiska do automatyzacji przeprowadzania testów aplikacji internetowych w oparciu o metodykę Behavior Driven Development. Autor: Stepowany
SiR_13 Systemy SCADA: sterowanie nadrzędne; wizualizacja procesów. MES - Manufacturing Execution System System Realizacji Produkcji
System informatyczny na produkcji: Umożliwi stopniowe, ale jednocześnie ekonomiczne i bezpieczne wdrażanie i rozwój aplikacji przemysłowych w miarę zmiany potrzeb firmy. Może adoptować się do istniejącej
SYSTEMY OPERACYJNE: STRUKTURY I FUNKCJE (opracowano na podstawie skryptu PP: Królikowski Z., Sajkowski M. 1992: Użytkowanie systemu operacyjnego UNIX)
(opracowano na podstawie skryptu PP: Królikowski Z., Sajkowski M. 1992: Użytkowanie systemu operacyjnego UNIX) W informatyce występują ściśle obok siebie dwa pojęcia: sprzęt (ang. hardware) i oprogramowanie
Programowanie współbieżne i rozproszone
Programowanie współbieżne i rozproszone WYKŁAD 11 dr inż. CORBA CORBA (Common Object Request Broker Architecture) standard programowania rozproszonego zaproponowany przez OMG (Object Management Group)
Teraz bajty. Informatyka dla szkół ponadpodstawowych. Zakres rozszerzony. Część 1.
Teraz bajty. Informatyka dla szkół ponadpodstawowych. Zakres rozszerzony. Część 1. Grażyna Koba MIGRA 2019 Spis treści (propozycja na 2*32 = 64 godziny lekcyjne) Moduł A. Wokół komputera i sieci komputerowych
Terminologia baz danych
Terminologia baz danych Terminologia Banki danych - bazy danych w których przechowuje si informacj historyczne. Hurtownie danych (data warehouse): zweryfikowane dane z rónych baz, przydatne do analiz i
Globalne referencje dla idempiere Business Suite
Globalne referencje dla idempiere Business Suite otwartego oprogramowania ERP grudzień 2018r. Puławy, Polska Opracowanie zrealizowane na podstawie publicznych zasobów internetowych przez StabilisOne Sp.
EXSO-CORE - specyfikacja
EXSO-CORE - specyfikacja System bazowy dla aplikacji EXSO. Elementy tego systemu występują we wszystkich programach EXSO. Może on ponadto stanowić podstawę do opracowania nowych, dedykowanych systemów.
Instytut Technik Innowacyjnych Semantyczna integracja danych - metody, technologie, przykłady, wyzwania
Instytut Technik Innowacyjnych Semantyczna integracja danych - metody, technologie, przykłady, wyzwania Michał Socha, Wojciech Górka Integracja danych Prosty export/import Integracja 1:1 łączenie baz danych
Instrukcja do panelu administracyjnego. do zarządzania kontem FTP WebAs. www.poczta.greenlemon.pl
Instrukcja do panelu administracyjnego do zarządzania kontem FTP WebAs www.poczta.greenlemon.pl Opracowanie: Agencja Mediów Interaktywnych GREEN LEMON Spis treści 1.Wstęp 2.Konfiguracja 3.Konto FTP 4.Domeny
Leonard G. Lobel Eric D. Boyd. Azure SQL Database Krok po kroku. Microsoft. Przekład: Marek Włodarz. APN Promise, Warszawa 2014
Leonard G. Lobel Eric D. Boyd Microsoft TM Azure SQL Database Krok po kroku Przekład: Marek Włodarz APN Promise, Warszawa 2014 Spis treści Wprowadzenie........................................................
LITERATURA. C. J. Date; Wprowadzenie do systemów baz danych WNT Warszawa 2000 ( seria Klasyka Informatyki )
LITERATURA C. J. Date; Wprowadzenie do systemów baz danych WNT Warszawa 2000 ( seria Klasyka Informatyki ) H. Garcia Molina, Jeffrey D. Ullman, Jennifer Widom; Systemy baz danych. Kompletny podręcznik
Wybrane działy Informatyki Stosowanej
Wybrane działy Informatyki Stosowanej Java Enterprise Edition. WebServices. Język XML. Serwer aplikacji GlassFish. Dr inż. Andrzej Czerepicki a.czerepicki@wt.pw.edu.pl http://www2.wt.pw.edu.pl/~a.czerepicki
Oracle Application Express -
Oracle Application Express - Wprowadzenie Wprowadzenie Oracle Application Express (dawniej: HTML DB) to narzędzie do szybkiego tworzenia aplikacji Web owych korzystających z bazy danych Oracle. Od użytkownika
Ekspert MS SQL Server Oferta nr 00/08
Ekspert MS SQL Server NAZWA STANOWISKA Ekspert Lokalizacja/ Jednostka organ.: Pion Informatyki, Biuro Hurtowni Danych i Aplikacji Wspierających, Zespół Jakości Oprogramowania i Utrzymania Aplikacji Szczecin,
Opracował: Jan Front
Opracował: Jan Front Sterownik PLC PLC (Programowalny Sterownik Logiczny) (ang. Programmable Logic Controller) mikroprocesorowe urządzenie sterujące układami automatyki. PLC wykonuje w sposób cykliczny
Zakres tematyczny dotyczący kursu PHP i MySQL - Podstawy pracy z dynamicznymi stronami internetowymi
Zakres tematyczny dotyczący kursu PHP i MySQL - Podstawy pracy z dynamicznymi stronami internetowymi 1 Rozdział 1 Wprowadzenie do PHP i MySQL Opis: W tym rozdziale kursanci poznają szczegółową charakterystykę
Dokumentacja techniczna. Młodzieżowe Pośrednictwo Pracy
Dokumentacja techniczna Młodzieżowe Pośrednictwo Pracy Spis Treści 1. Widok ogólny architektury MPP... 3 2. Warstwy systemu... 5 3. Struktura systemu/komponentów... 7 3.1 Aplikacje... 7 3.2 Biblioteki...
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych, moduł kierunkowy ogólny Rodzaj zajęć: wykład, laboratorium BAZY DANYCH Databases Forma studiów: Stacjonarne
Zastosowanie Oracle Designer/2000 do projektowania i implementacji aplikacji WWW
V Konferencja PLOUG Zakopane Październik 1999 Zastosowanie Oracle Designer/2000 do projektowania i implementacji aplikacji WWW Grzegorz Bliźniuk gbliz@isi.wat.waw.pl. Roman Wantoch-Rekowski rekowski@isi.wat.waw.pl.
Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence
Hurtownie danych Wprowadzenie do systemów typu Business Intelligence Krzysztof Goczyła Teresa Zawadzka Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika
Automatyczne decyzje kredytowe, siła szybkiego reagowania i optymalizacji kosztów. Roman Tyszkowski ING Bank Śląski S.A. roman.tyszkowski@ingbank.
Automatyczne decyzje kredytowe, siła szybkiego reagowania i optymalizacji kosztów. Roman Tyszkowski ING Bank Śląski S.A. roman.tyszkowski@ingbank.pl Obsługa wniosków kredytowych Potrzeba elastyczności
Transformacja wiedzy w budowie i eksploatacji maszyn
Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces
DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:
DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: JAKIE PROBLEMY ROZWIĄZUJE BI 1 S t r o n a WSTĘP Niniejszy dokument to zbiór podstawowych problemów, z jakimi musi zmagać się przedsiębiorca, analityk,
Opracowanie systemu monitorowania zmian cen na rynku nieruchomości
Opracowanie systemu monitorowania zmian cen na rynku nieruchomości Ogólne założenia planowanego projektu Firma planuje realizację projektu związanego z uruchomieniem usługi, która będzie polegała na monitorowaniu
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Algorytmy i programowanie Algorithms and Programming Kierunek: Zarządzanie i Inżynieria Produkcji Rodzaj przedmiotu: kierunkowy Poziom studiów: studia I stopnia forma studiów: studia