Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania Semestr zimowy 2005/06
Celem wykładu jest przypomnienie podstawowych zagadnień z zakresu systemów baz danych oraz wprowadzenie do systemów hurtowni danych, przede wszystkim do technologii analitycznego przetwarzania na bieżaco (OLAP) oraz procesu ekstrakcji, transformacji i ładowania danych (proces ETL). Zagadnienia będa prezentowane w sposób praktyczny przy wykorzystaniu przede wszystkim wolnego oprogramowania: MySQL i JPivot/Mondrian oraz zaawansowanego systemu analitycznego SAS.
Wykład obejmuje zagadnienia zwiazane z: Systemami relacyjnych baz danych (przypomnienie), Hurtowniami danych, Przetwarzaniem analitycznym na bieżaco (ang. On-line Analitycal Processing). Prezentowane zagadnienia zwiazane sa dodatkowo z: Aktywnymi systemami baz danych, Systemami baz danych w wspomaganiu decyzji i analizie danych, Analitycznymi systemami baz danych, Systemami wspomagania decyzji, Przetwarzaniem i przechowywaniem informacji.
Prowadzacy i plan przedmiotu mgr inż. Krzysztof Dembczyński krzysztof.dembczynski@cs.put.poznan.pl mgr inż. Izabela Brzezińska izabela.brzezinska@cs.put.poznan.pl Strona przedmiotu: ophelia.cs.put.poznan.pl/webdav/dbdw/students Wykład: 16h (2x8h, w rzeczywistości 4 spotkania po 4h) Laboratorium: 16h (2x8h 4 spotkania po 4h)
Plan wykładu Ewolucja systemów baz danych Relacyjne systemy baz danych i język SQL Projektowanie baz danych i ochrona danych Optymalizacja i struktury danych Systemy OLAP I Systemy OLAP II Modelowanie wielowymiarowe Proces ekstrakcji, transformacji i ładowania danych (Proces ETL)
Plan laboratorium MySQL i język SQL Projektowanie baz danych Administracja i optymalizacja serwera MySQL Technologia OLAP i proces ETL
Ocena z przedmiotu Ocena z wykładu: test zaliczeniowy: 50% test musi być zaliczony zaliczenie od 50% punktów ocena z laboratorium: 50% laboratorium musi być zaliczone Ocena z laboratorium: kartkówki: 60% 3x20% na spotkaniu I, II i IV każda kartkówka musi zostać zaliczona zaliczenie od 50% punktów raporty: 40% 2x20% raport musi zostać zaliczony
Ocena z przedmiotu Skala ocen (taka sama na wykładzie i na laboratorium): 90% - 5.0 80% - 4.5 70% - 4.0 60% - 3.5 50% - 3.0 Liczba zdobytych punktów procentowych jest mnożona przez współczynnik zaufania :) na poczatku wynosi on dla wszystkich 1. Test zaliczeniowy oraz ostateczne uzupełniania z laboratorium odbęda się w sesji na dokładny termin jeszcze się umówimy.
Lista studentów Prośba: proszę starostę o przygotowanie listy studentów i przesłanie jej na adres: krzysztof.dembczynski@cs.put.poznan.pl Format listy: Imię Nazwisko Numer_indeksu
Darmowe systemy baz danych HSQL SQLite PostgreSQL MaxDB MySQL
MySQL Strona www.mysql.com Wersja 5.0 Podręcznik użytkownika
MySQL
Bibliografia C.J Date, Wprowadzenie do systemów baz danych, Wydawnictwa Naukowo-Techniczne 1999. MySQL Reference Manual, MySQL AB 1997-2004 Chris Todman, Projektowanie hurtowni danych. Zarzadzanie kontaktami z klientami (CRM), Wydawnictwa Naukowo-Techniczne 2003 M. Jarke, M. Lenzerini, Y. Vassiliou, P. Vassiliadis, Hurtownie danych. Podstawy organizacji i funkcjonowania, Wydawnictwa Szkolne i Pedagogiczne 2003 V. Poe, P. Klauer, S. Brobst, Tworzenie hurtowni danych, wspomaganie podejmowania decyzji, Wydawnictwa Naukowo-Techniczne 2000
Bibliografia R. Kimball, L. Reeves, M. Ross, W. Thornthwaite, The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing, and Deploying Data Warehouses, John Wiley & Sons 1998 R. Kimball, M. Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, John Wiley & Sons 2002 J. Han, M. Kamber, Data Mining: Concepts and Techniques, Morgan-Kaufmann 2000 http://www.sas.com http://support.sas.com
Pytania? No to zaczynamy...
Pytania? No to zaczynamy...