Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Podobne dokumenty
Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Systemy baz danych i hurtowni danych

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

Hurtownie danych. 31 stycznia 2017

Hurtownie danych a transakcyjne bazy danych

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Wstęp do Business Intelligence

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Bazy danych i ich aplikacje

KARTA PRZEDMIOTU 1,5 1,5

Informatyka II stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) kierunkowy (podstawowy / kierunkowy / inny HES)

E-1IZ s2. Informatyka II stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. ćwiczenia 30 zaliczenie z oceną

Rozumie istotę i znacznie procesów ekstrakcji, transformacji i ładowania danych (ETL), zna wybrany język ETL oraz odpowiednie narzędzia.

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) niestacjonarne (stacjonarne / niestacjonarne)

PRZEWODNIK PO PRZEDMIOCIE

E-I2SG-2010-s1. Informatyka II stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/17

PRZEWODNIK PO PRZEDMIOCIE

Ewolucja technik modelowania hurtowni danych

Sylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia.

Hurtownie danych - opis przedmiotu

Rok akademicki: 2014/2015 Kod: CCB s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

1.1 Matryca pokrycia efektów kształcenia. Efekty kształcenia w zakresie wiedzy. Efekty kształcenia w zakresie umiejętności

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2013/2014

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Modele danych - wykład V

KARTA PRZEDMIOTU. Programowanie aplikacji internetowych

Podstawowe wiadomości z zakresu: architektury sprzętowo-programowej komputerów, dowolnych języków programowania, algebry

PRZEWODNIK PO PRZEDMIOCIE

Inżynieria oprogramowania - opis przedmiotu

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

Podsumowanie wyników ankiety

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Technologie informacyjne Information technologies

Podstawowe wiadomości z zakresu: architektury sprzętowo-programowej komputerów, dowolnych języków programowania, algebry

E-1EZ s1. Technologie informacyjne. Elektrotechnika I stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny)

APLIKACJE KLIENT-SERWER Client-Server Applications Forma studiów: Stacjonarne Poziom kwalifikacji: I stopnia. Liczba godzin/tydzień: 2W, 2L

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

WYDZIAŁ EKONOMII KARTA OPISU MODUŁU KSZTAŁCENIA

Nazwa przedmiotu: MODELOWANIE I ANALIZA SYSTEMÓW INFORMATYCZNYCH. Modeling and analysis of computer systems Forma studiów: Stacjonarne

PRZEDMIOTY REALIZOWANE W RAMACH KIERUNKU INFORMATYKA I STOPNIA STUDIA STACJONARNE

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE

Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE. Teoria i inżynieria systemów. Logistyka (inżynierskie) Niestacjonarne

PRZEWODNIK PO PRZEDMIOCIE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM

Część I Istota analizy biznesowej a Analysis Services

Interbase. stacjonarne (stacjonarne / niestacjonarne) kierunkowy (podstawowy / kierunkowy / inny HES)

Zaawansowane bazy danych i hurtownie danych Wydział Informatyki Politechnika Białostocka

forma studiów: studia stacjonarne Liczba godzin/tydzień: 1, 0, 2, 0, 0

EFEKTY UCZENIA SIĘ DLA KIERUNKU INŻYNIERIA DANYCH W ODNIESIENIU DO EFEKTÓW UCZENIA SIĘ PRK POZIOM 6

PAŃSTWOWA WYŻSZA SZKOŁA ZAWODOWA W KONINIE. Wydział Kultury Fizycznej i Ochrony Zdrowia SYLABUS

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

PRZEWODNIK PO PRZEDMIOCIE

Egzamin / zaliczenie na ocenę*

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Proces ETL. Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris,

WYKAZ KIERUNKOWYCH EFEKTÓW KSZTAŁCENIA KIERUNEK: MATEMATYKA, SPS WIEDZA

NAZWA PRZEDMIOTU/MODUŁU KSZTAŁCENIA:

PRZEWODNIK PO PRZEDMIOCIE. Projektowanie procesów. Logistyka (inżynierska) niestacjonarne. I stopnia. dr Aleksandra Grabińska.

Opisy efektów kształcenia dla modułu

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2013/2014

Mechanika i Budowa Maszyn II stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)

KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Metody drążenia danych D1.3

kod nr w planie ECTS Przedmiot studiów PODSTAWY STATYSTYKI 7 2

Egzamin / zaliczenie na ocenę*

Załącznik do Uchwały Nr XXXVIII/326/11/12. Wydział: AUTOMATYKI, ELEKTRONIKI I INFORMATYKI WIEDZA

Podstawy Informatyki Information Technology. Inżynieria Środowiska I stopień (I stopień / II stopień) akademicki (ogólno akademicki / praktyczny)

zakładane efekty kształcenia

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) kierunkowy (podstawowy / kierunkowy / inny HES)

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Pakiety matematyczne i informatyczne. 2. KIERUNEK: Matematyka. 3. POZIOM STUDIÓW: I stopnia

Specjalizacja magisterska Bazy danych

PRZEWODNIK PO PRZEDMIOCIE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM

Kierunek i poziom studiów: Chemia, pierwszy. Sylabus modułu: Technologia informacyjna (0310-CH-S1-003) 1. Informacje ogólne

KIERUNKOWE EFEKTY KSZTAŁCENIA

Migracja Business Intelligence do wersji

tel. (+48 81) /22 fax (+48 81) Wykład Ćwiczenia Laboratorium Projekt

PRZEWODNIK PO PRZEDMIOCIE

Zasady projektowania hurtowni cd.

Geodezja i Kartografia I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)

INFORMATYKA W ZARZĄDZANIU

PRZEWODNIK PO PRZEDMIOCIE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM

Transkrypt:

Hurtownie danych Wprowadzenie do systemów typu Business Intelligence Krzysztof Goczyła Teresa Zawadzka Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris, tegra}@eti.pg.gda.pl - 1 -

Pobudka Średnia z kolokwium w roku akademickim 2015/2016 w I podejściu 11.85/20 Średnia osób nieuczęszczających na wykłady: 10.74/20 Średnia osób uczęszczających na wykłady: 14.14/20-2 -

Zasady zaliczenia - 3-1. Ocena jest wyznaczana na podstawie punktów uzyskanych z wykładu i laboratorium. 2. Połowę oceny z przedmiotu stanowią punkty uzyskane z wykładu, zaś drugą połowę punkty uzyskane z laboratorium. 3. Zaliczenie wykładu (kolokwium) i zaliczenie laboratorium jest obowiązkowe. 4. Ocena z przedmiotu: 100% - Dokument wyróżniający 90% - 5.0 80% - 4.5 70% - 4.0 60% - 3.5 50% - 3.0

Wybrana literatura D. Mendrala, M. Szeliga: SQL 2008. Usługi biznesowe. Analiza i eksploracja danych. Helion 2009. W. H. Inmon: Building the Data Warehouse. J. Wiley&Sons, 2002. R. Kimball: The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, Third Edition. J. Wiley&Sons, 2013. V. Poe, P. Klauer, S. Brebst: Tworzenie hurtowni danych, WNT 2000 P. Ponniah: Data Warehousing. J. Wiley&Sons, 2001. - 4 -

Kierunkowe efekty kształcenia (1) [K_U08] śledzi i optymalizuje wydajność bazy danych, administruje systemami baz danych i ich odtwarzania po awarii, waliduje wymagania niefunkcjonalne aplikacji bazodanowych Student potrafi dokonać analizy źródeł danych - ich zawartości i ich formatu. Wie, jak zaprojektować i przeprowadzić proces ETL. Student projektuje hurtownię danych - model logiczny w postaci schematu gwiazdy lub płatka śniegu i model fizyczny (stosując różne modele pamięci). Formułuje zapytania w języku MDX albo w rozszerzeniach wielowymiarowych SQL. Analizuje uzyskane wyniki. Posługuje się prostymi narzędziami typu Business Intelligence. - 5 -

Kierunkowe efekty kształcenia (2) [K_U10] posługuje się pakietami oprogramowania do obliczeń symbolicznych i numerycznych, narzędziami business intelligence, notacjami modelowania systemów informatycznych, prowadzi wnioskowania dedukcyjne i indukcyjne, formułuje zapytania w wybranych językach Student potrafi korzystać z podstawowych narzędzi typu Business Intelligence, w szczególności wchodzących w skład standardowych komercyjnych pakietów oprogramowania hurtowni danych. - 6 -

Kierunkowe efekty kształcenia (3) [K_W04] zna protokoły komunikacji, modele przetwarzania danych, technologie klasycznego i semantycznego Internetu, działanie serwera www, aplikacje internetowe i wzorce programowe oraz budowę aplikacji hostowanych w przeglądarce. Student zna i potrafi stosować modele danych stosowane w hurtowniach danych oraz budować hurtownie danych zgodne z tymi modelami. - 7 -

Kierunkowe efekty kształcenia (4) [K_W01] zna metody przeciwdziałania zagrożeniom bezpieczeństwa sieci komputerowej, protokoły kryptograficzne oraz metody kontroli dostępu do baz danych, systemów i sieci oraz techniki ich zabezpieczeń Student zna zabezpieczenia baz danych, w tym hurtowni danych, przed nieautoryzowanym dostępem. - 8 -

Wprowadzenie do systemów typu typu Business Intelligence Czym jest system typu BI? Czarodziej to, czy nie czarodziej? - 9 -

Doradca, informator, egzekutor? - 10-10

Kto podejmuje decyzję? BI - 11-11

Podstawowa architektura rozwiązań typu BI Proces ETL Prezes/Analityk Hurtownia danych Źródła danych - 12-12

Kto zna? Wydarzenia? Powiązania między wydarzeniami? - 13-13

Hurtownia danych czy zdarzeń? - 14-14

Dobra analogia? NIE Gandalf potrafi myśleć!!! - 15-15

Systemy typu Business Intelligence Systemy wspomagania decyzji o charakterze strategicznym dla firmy (DSS, Decision Support System; BI, Business Intelligence): łatwy dostęp do informacji silne narzędzia analityczne wydajne przetwarzanie ogromnych ilości danych przyjazne dla użytkownika prezentowanie spójnych wyników podatny na zmiany ukierunkowany na procesy biznesowe - 16 -

Narzędzie analityczne 1. Sprawdzenie wystąpienia danego zdarzenia (czynności), np.: czy dany produkt został sprzedany danemu klientowi? 2. Porównanie, np.: porównaj wartość zakupów danych dwóch klientów w ramach ostatnich 6 miesięcy lub porównaj liczbę sprzedanych egzemplarzy danego produktu względem jego kategorii. 3. Analiza trendu, np.: czy w ciągu ostatnich 12 miesięcy jest trend wzrostowy sprzedaży danego produktu?. 4. Rankingi, np.: podaj 10 najlepiej sprzedających się produktów w ciągu ostatniego roku. 5. Analiza statystyczna, np.: podaj średni zysk z ostatnich 6 miesięcy. - 17 -

Online Analytical Processing OLAP Przetwarzanie danych, którego celem są analizy trendów, analizy przekrojowe i inne analizy o charakterze strategicznym. Przykłady: http://www2.microstrategy.com/dashboardgallery/dashboards/interactivebubblechart.asp http://www2.microstrategy.com/dashboardgallery/dashboards/california.asp - 18 -

Proces biznesowy Seria powiązanych ze sobą działań lub zadań, które rozwiązują określony problem lub prowadzą do osiągnięcia określonego efektu. 1. Procesy biznesowe są zazwyczaj wyrażane za pomocą czasowników ponieważ reprezentują aktywność organizacji. 2. Procesy biznesowe są często wspierane przez systemy, jak np.: system fakturowania. 3. Procesy biznesowe generują metryki liczbowe, które podlegają analizie. - 19 -

FASMI (Fast Analysis of Shared Multidimensional Information) test 1. FAST system dostarcza użytkownikowi większość odpowiedzi w czasie około 5 sekund. 2. ANALYSIS system jest dostosowany do logiki biznesowej i statystyki analitycznej. 3. SHARED system implementuje politykę bezpieczeństwa dostępu do danych. 4. MULTIDIMENSIONAL system musi dostarczać wielowymiarowego spojrzenia na dane. 5. INFORMATION system musi dostarczać informacji. - 20 -

Cechy OLAP Wielkość Historia Liczba użytkowników Złożoność zapytań Normalizacja Dodawanie Usuwanie Aktualizacja Transakcyjność OLTP OLAP - 21 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Cechy OLAP OLTP OLAP Wielkość Od małej do dużej Ogromna Historia Liczba użytkowników Złożoność zapytań Normalizacja Dodawanie Usuwanie Aktualizacja Transakcyjność - 22 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Cechy OLAP OLTP OLAP Wielkość Od małej do dużej Ogromna Historia Czasami Zawsze Liczba użytkowników Złożoność zapytań Normalizacja Dodawanie Usuwanie Aktualizacja Transakcyjność - 23 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Cechy OLAP OLTP OLAP Wielkość Od małej do dużej Ogromna Historia Czasami Zawsze Liczba użytkowników Duża Mała Złożoność zapytań Normalizacja Dodawanie Usuwanie Aktualizacja Transakcyjność - 24 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Cechy OLAP OLTP OLAP Wielkość Od małej do dużej Ogromna Historia Czasami Zawsze Liczba użytkowników Duża Mała Złożoność zapytań Mała lub średnia Duża Normalizacja Dodawanie Usuwanie Aktualizacja Transakcyjność - 25 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Cechy OLAP OLTP OLAP Wielkość Od małej do dużej Ogromna Historia Czasami Zawsze Liczba użytkowników Duża Mała Złożoność zapytań Mała lub średnia Duża Normalizacja Tak Nie Dodawanie Usuwanie Aktualizacja Transakcyjność - 26 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Cechy OLAP OLTP OLAP Wielkość Od małej do dużej Ogromna Historia Czasami Zawsze Liczba użytkowników Duża Mała Złożoność zapytań Mała lub średnia Duża Normalizacja Tak Nie Dodawanie Tak Tak (BULK) Usuwanie Aktualizacja Transakcyjność - 27 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Cechy OLAP OLTP OLAP Wielkość Od małej do dużej Ogromna Historia Czasami Zawsze Liczba użytkowników Duża Mała Złożoność zapytań Mała lub średnia Duża Normalizacja Tak Nie Dodawanie Tak Tak (BULK) Usuwanie Tak Nie Aktualizacja Transakcyjność - 28 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Cechy OLAP OLTP OLAP Wielkość Od małej do dużej Ogromna Historia Czasami Zawsze Liczba użytkowników Duża Mała Złożoność zapytań Mała lub średnia Duża Normalizacja Tak Nie Dodawanie Tak Tak (BULK) Usuwanie Tak Nie Aktualizacja Tak Rzadko Transakcyjność - 29 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Cechy OLAP OLTP OLAP Wielkość Od małej do dużej Ogromna Historia Czasami Zawsze Liczba użytkowników Duża Mała Złożoność zapytań Mała lub średnia Duża Normalizacja Tak Nie Dodawanie Tak Tak (BULK) Usuwanie Tak Nie Aktualizacja Tak Rzadko Transakcyjność Tak Nie - 30 - Przetwarzanie transakcyjne (w bazach danych): OLTP (On-Line Transactional Processing)

Co każdy student wiedzieć powinien 1. Wytłumaczyć, czym jest system typu BI? 2. Opisać ogólną architekturę systemów typu BI. 3. Wytłumaczyć, czym jest przetwarzanie analityczne. 4. Umieć porównać przetwarzanie analityczne z przetwarzaniem transakcyjnym - 31 -