Analityczne bazy danych Kostki danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Analityczne bazy danych Kostki danych"

Transkrypt

1 Analityczne bazy danych Kostki danych 10 maja 2015

2 Podejmowanie decyzji Ze względu na horyzont czasowy decyzje organizacyjne można podzielić na trzy kategorie: decyzje operacyjne o zakresie dni lub tygodni; decyzje taktyczne, których efekty obejmuja od kilku miesięcy do roku, decyzje strategiczne, których wpływ rozciaga się na kilka lat. Zaobserwowano, że w miarę przechodzenia od decyzji operacyjnych do strategicznych stosowane procedury postępowania staja się coraz mniej algorytmiczne.

3 Podejmowanie decyzji Poczatkowo systemów komputerowe w działalności gospodarczej używano przede wszystkim do operacyjnego przetwarzania danych w takich aplikacjach jak przyjmowanie i obróbka zamówień, fakturowanie, inwentaryzacja itp. Stopniowo zaczęto jednak używać komputerów również do mniej rutynowych działań, okreśłanych mianem systemów wspomagania decyzji (decision support systems, DSS). Inne spotykane nazwy to BIS/BIT (Business Intelligence System/Technology) EIS (Executive Information System). Oprócz mechanicznego przetwarzania danych obejmuja one również rozmaite mechanizmy wnioskowania z faktów zawartych w bazie danych. Stad wział się podział aplikacji bazodanowych na operacyjne i analityczne.

4 Wymagania na dane dla systemów wspomagania decyzji Informacja najczęściej ma być przedstawiona w postaci sumarycznej. Brak standardowych metod dostępu, duże zróżnicowanie sposobów wyboru i postaci informacji do przedstawienia, dynamika. Łaczenie wyszukanej informacji z innymi zasobami obliczeniowymi (arkusze kalkulacyjne, specjalizowane pakiety).

5 Analityczne przetwarzanie danych Termin angielski: On-Line Analytical Processing, stad powszechnie używany skrót OLAP. Typowe zastosowania to analiza trendów oraz poszukiwanie wzorców zachowań lub anomalii. Używane do pracy interakcyjnej, więc bardzo istotna jest wydajność, zwłaszcza czasowa. Jeśli użytkownik dostrzeże, że pewne zapytania (np. oparte na 5 i więcej złaczeniach) sa realizowane bardzo wolno, to zacznie ich unikać. Przyjmuje się, że odpowiedź na 90% zapytań powinna następować w ciagu 10 sekund.

6 Analityczne bazy danych Inaczej bazy danych OLAP (On-Line Analytical Processing). Rosnace znaczenie: 8 mld. dol. w 1998 roku. Od komputerów biurkowych po olbrzymie konfiguracje. Wiele modnych haseł, zaklęć zwijanie i rozwijanie, drażenie, MOLAP, obracanie.

7 Podstawowe zagadnienia Co to jest analityczna baza danych? Modele i operacje Implementacja analitycznej bazy danych Kierunki rozwojowe

8 Raporty macierzowe Pierwszym wsparciem dla analizy danych były raporty macierzowe. Raporty macierzowe przypominaja arkusze kalkulacyjny. Często dotycza finansów lub zarzadzania. W systemie sprzedaży będzie na przykład potrzebny raport o klientach i ich wzorcach kupowania z podziałem na regiony. Jednak zamiast analizować wzorce dla każdego towaru, dzielimy towary na kategorie. Tak więc kolumnami raportu będa wypisane u góry kategorie towarów, wierszami stany, a każda z komórek będzie pokazywać liczbę pozycji sprzedanych w tej kategorii.

9 Data Mart Mała hurtownia, nazywana czasem tematyczna baza danych Obejmuje tylko część tematyki organizacji, np. marketing: klienci, towary, sprzedaż Model dostosowany do potrzeb działu. Najczęściej informacja wstępnie zagregowana Eliminacja zbędnych detali Wybieramy pewien krytyczny poziom szczegółowości.

10 Narzędzia do zapytań i analiz Budowanie zapytań Generatory raportów porównania: wzrost, spadek trendy, grafy Arkusze kalkulacyjne Interfejs WWW Data Mining

11 Inne operacje Funkcje po czasie np. średnie po różnych okresach Atrybuty obliczane np. marża = sprzedaż * stopa Zapytania tekstowe, np. znajdź dokumenty zawierajace słowa A i B uporzadkuj dokumenty według częstości występowania słów X, Y i Z

12 Modele danych i operatory Modele danych relacja gwiazda i płatek śniegu kostka: rozwinięcie idei arkusza kalkulacyjnego (tablice wielowymiarowe) Operatory slice & dice roll-up, drill down pivoting inne

13 Wielowymiarowy model danych Najczęściej używa się wielowymiarowych bazy danych z uwagi na analityczny model danych o postaci kostki wielowymiarowej obejmujacy: fakty zwane też miarami (measures), np. liczba sprzedanych samochodów; wymiary (dimensions), np. miesiace, regiony sprzedaży.

14 Wymiary Wymiary tworza zazwyczaj hierarchie, np. dla czasu będzie to rok-kwartał-miesiac-dzień. Dzięki temu możliwa jest interakcyjna zmiana poziomu szczegółowości (ziarnistości) ogladanej informacji. W bardziej złożonych przypadkach hierarchie moga rozgałęziać się, np. podział na tygodnie jest niezgodny z podziałem na miesiace.

15 Czas Wymiar czasu wymaga specjalnego traktowania Zwykle jest ukryty nie tworzy się dla niego osobnej tabeli wymiaru. Ma naturę sekwencyjna: jest uporzadkowany Zapytanie o sprzedaż w pierwszych trzech miesiacach roku sa bardzo częste Rzadko natomiast pytamy o sprzedaż czterech pierwszych towarów (nawet zakładajac uporzadkowanie np. wg nazwy) Sposób agregacji po czasie zależy od sensu miary Jeśli sprzedano 20 komputerów w styczniu, 15 w lutym i 7 w marcu, to zwykle pytamy o sumę sprzedanych komputerów w pierwszym kwartale. Natomiast jeśli firma zatrudniała 20 pracowników w styczniu, 15 w lutym i 7 w marcu, to sumowanie tych liczb jest raczej bez sensu (chyba że liczymy osobomiesiace ) i zwykle pytamy o przeciętne zatrudnienie w pierwszym kwartale.

16 Baza danych Źródłem danych jest najczęściej hurtownia danych (rzeczywista lub wirtualna). Bezpośrednie trzymanie w bazie danych informacji o faktach dla wszystkich poziomów szczegółowości może być kosztowne Tylko dla najczęściej używanych poziomów hierarchii. Pozostałe sa wyliczane na bieżaco w razie potrzeby. Przy agregowaniu miar warto pamiętać o różnych regułach liczenia, np. Wielkość sprzedaży jest na ogół sumowana Temperatura lub cena będa raczej uśredniane. W analitycznej bazie danych trzymane sa w zasadzie dane zagregowane. Aby obejrzeć dane szczegółowe (drill-through) konieczne jest sięgnięcie do hurtowni danych lub bazy operacyjnej. Ponieważ jest to kosztowne czasowo, taka potrzeba nie powinna występować zbyt często.

17 Operacje na danych Przecinanie i rzutowanie (slice and dice) Zmiana poziomu szczegółowości: drażenie lub rozwijanie (drill-down) i zwijanie (roll-up), obracanie (pivot): zmienia położenie wymiaru na wykresie.

18 Podejścia do budowy bazy OLAP 1 ROLAP = relacyjny OLAP : dopasowujemy relacyjny DBMS do schematu gwiazdy. 2 MOLAP = wielowymiarowy OLAP : używamy specjalizowanego DBMS z modelem w rodzaju kostka danych.

19 Schemat gwiazdy Schemat gwiazdy to typowy sposób organizacji danych dla relacyjnej bazy danych dla OLAP. Obejmuje: Tabelę faktów: olbrzymi zbiór faktów takich jak informacje o sprzedaży. Tabele wymiarów: mniejsze, statyczne informacje o obiektach, których dotycza fakty. Uogólnienie: model płatka śniegu. Hierarchie tabel dla poszczególnych wymiarów: normalizacja wymiarów.

20 Przykład schematu gwiazdy Chcemy gromadzić w hurtowni danych informacje o sprzedaży piwa: bar, marka piwa, piwosz, który je zakupił, dzień, godzina oraz cena. Tabela faktów będzie relacja: Sprzedaż(bar,piwo,piwosz,dzień,godzina,cena)

21 Przykład, cd. Tabele wymiarów zawieraja informacje o barach, piwach i piwoszach: Bary(bar, adres, licencja) Piwa(piwo, prod) Piwosze(piwosz, adres, tel)

22 Atrybuty wymiarów i atrybuty zależne Dwa rodzaje atrybutów w tabeli faktów: Atrybuty wymiarów: klucze tabel wymiarów. Atrybuty zależne: wartości wyznaczone przez atrybuty wymiarów krotki.

23 Przykład: atrybut zależny cena jest atrybutem zależnym w przykładowej relacji Sprzedaż. Jest ona wyznaczona przez kombinację atrybutów wymiarów: bar, piwo, piwosz i czas (kombinacja atrybutów daty i godziny).

24 Techniki optymalizacji ROLAP Indeksy bitmapowe: dla każdej wartości klucza indeksowego w tabeli wymiaru (np. dla każdego piwa w tabeli Piwa) tworzymy wektor bitowy podajacy, które krotki w tabeli faktów zawieraja tę wartość. Perspektywy zmaterializowane: w hurtowni przechowujemy gotowe odpowiedzi na kilka użytecznych zapytań (perspektywy).

25 Typowe zapytanie OLAP Zapytanie OLAP często zaczyna się od star join : złaczenia naturalnego tabeli faktów z wszystkimi lub większościa tabel wymiarów. Przykład: SELECT * FROM Sprzedaż,Bary,Piwa,Piwosze WHERE Sprzedaż.bar = Piwa.bar AND Sprzedaż.piwo = Piwa.piwo AND Sprzedaż.piwosz = Piwosze.piwosz;

26 Typowe zapytanie OLAP Rozpoczyna się złaczeniem gwiaździstym. Wybiera interesujace krotki używajac danych z tabel wymiarów. Grupuje po jednym lub więcej wymiarach. Agreguje niektóre atrybuty wyniku.

27 Przykład zapytania OLAP Dla każdego baru w Poznaniu podaj całkowita sprzedaż każdego piwa wytwarzanego przez browar Anheuser-Busch. Filtr: adres = Poznań i prod = Anheuser-Busch. Grupowanie: po bar i piwo. Agregacja: Suma po cena.

28 Przykład: SQL SELECT bar, piwo, SUM(cena) FROM Sprzedaż NATURAL JOIN Bary NATURAL JOIN Piwa WHERE addr = Poznań AND prod = Anheuser-Busch GROUP BY bar, piwo;

29 Perspektywy zmaterializowane Bezpośrednie wykonanie naszego zapytania dla tabeli Sprzedaż i tabel wymiarów może trwać za długo. Jeśli utworzymy perspektywę zmaterializowana zawierajac a odpowiednie informacje, będziemy mogli znacznie szybciej podać odpowiedź.

30 Przykład: Perspektywa zmaterializowana Jaka perspektywa mogłaby nam pomóc? Podstawowe wymagania: 1 Musi łaczyć co najmniej Sprzedaż, Bary i Piwa. 2 Musi grupować co najmniej po bar i piwo. 3 Nie musi wybierać barów w Poznaniu ani piw Anheuser-Busch. 4 Nie musi wycinać kolumn adres ani prod.

31 Przykład A oto przydatna perspektywa: CREATE VIEW BaPiS(bar, adres, piwo, prod, sprzedaż) AS SELECT bar, adres, piwo, prod, SUM(cena) sprzedaż FROM Sprzedaż NATURAL JOIN Bary NATURAL JOIN Piwa GROUP BY bar, adres, piwo, prod; Ponieważ bar adres oraz piwo prod, jest to pozorne grupowanie, konieczne ponieważ adres i prod występuja we frazie SELECT.

32 Przykład zakończenie Przeformułowane zapytanie z użyciem zmaterializowanej perspektwy BaPiS: SELECT bar, piwo, sprzedaż FROM BaPiS WHERE adres = Poznań AND prod = Anheuser-Busch ;

33 Aspekty materializacji Typ i częstość zapytań Czas odpowiedzi na zapytania Koszt pamięci Koszt aktualizacji

34 MOLAP i kostki danych Klucze tabel wymiarów staja się wymiarami hiperkostki. Przykład: dla danych z tabeli Sprzedaż mamy cztery wymiary: bar, piwo, piwosz i czas. Atrybuty zależne (np. cena) występuja w punktach (kratkach) kostki.

35 Wizualizacja kostki danych

36 Marginesy Kostka często zawiera również agregacje (zwykle SUM) wzdłuż hiper-krawędzi kostki. Marginesy obejmuja agregacje jednowymiarowe, dwuwymiarowe,...

37 Przykład: marginesy Nasza 4-wymiarowa kostka Sprzedaż obejmuje sumy cena dla każdego baru, każdego piwa, każdego piwosza i każdej jednostki czasu (zapewne dni). Zawiera też sumy cena dla wszystkich par bar-piwo, trójek bar-piwosz-dzień,...

38 Struktura kostki Każdy wymiar należy traktować jako majacy dodatkowa wartość *. Punkt wewnętrzny z jedna lub więcej współrzędna * zawiera agregaty po wymiarach z *. Przykład: Sprzedaż( Pod Żaglem, Bud, *, *) zawiera sumę piwa Bud wypitego w Pod Żaglem przez wszystkich piwoszy w dowolnym czasie.

39 Rozwijanie (drill-down) Drill-down = deagregacja rozbija agregację na jej składniki. Przykład: po stwierdzeniu, że Pod Żaglem sprzedaje się bardzo mało piw Okocim, rozbić tę sprzedaż na poszczególne gatunki piw Okocim.

40 Zwijanie (roll-up) Roll-up = agregacja po jednym lub więcej wymiarach. Przykład: majac tabelę podajac a jak wiele piwa Okocim wypija każdy piwosz w każdym barze, zwinać ja do tabeli podajacej ogólna ilość piwa Okocim wypijanego przez każdego z piwoszy.

41 Roll-Up i Drill-Down Anheuser-Busch dla piwosz/bar Jim Bob Mary Joe s Bar Nut-House Blue Chalk Zwinięcie po Bary A-B / piwosz Jim Mary Bob

42 Roll-Up i Drill-Down Rozwinięcie po Piwa Piwa A-B / piwosz Jim Bob Mary Bud M lob Bud Light

43 Zmaterializowane perspektywy kostek danych Dla kostek danych warto robić perspektywy zmaterializowane agregujace po jednym lub więcej wymiarach. Wymiary nie powinny być całkowicie agregowane można ewentualnie grupować po atrybucie z tabeli wymiaru.

44 Przykład Zmaterializowana perspektywa dla naszej kostki Sprzedaż mogłaby: 1 Agregować całkowicie po piwosz. 2 Nie agregować wcale po piwo. 3 Agregować po czasie według tydzień. 4 Agregować po miasto dla barów.

45 Indeksy Tradycyjne techniki B-drzewa, tablice haszujace, R-drzewa, gridy,... Specyficzne listy odwrócone indeksy bitmapowe indeksy złaczeniowe indeksy tekstowe

46 Użycie list odwróconych Zapytanie: Podaj osoby dla których wiek = 20 i imię = Fred Lista dla age = 20: r4, r18, r34, r35 Lista dla name = Fred : r18, r52 Odpowiedzia jest przecięcie: r18

47 Użycie bitmap Zapytanie: Podaj osoby dla których wiek = 20 i imię = Fred Mapa dla age = 20: Mapa dla name = Fred : Odpowiedzia jest przecięcie: Dobre jeśli mało wartości danych. Wektory bitowe można kompresować.

48 MDX Multidimensional Expressions (MDX): język zapytań dla MOLAP, poczatkowo jako część OLE DB (Microsoft 1997). Potem w Microsoft OLAP Services 7.0 i Microsoft Analysis Services. XML for Analysis zawiera MDX jako język zapytań. Był wspierany m.in. przez Applix, Oracle, SAS, SAP, Panorama Software, Cognos i Hyperion Solutions. W 2001 XMLA Council (www.xmla.org) publikuje standard XML for Analysis, z językiem zapytań mdxml (MDX obudowany znacznikiem <Statement> z XML.

49 Przykład zapytania w MDX SELECT { [Measures].[Sprzedaż w sklepach] } ON COLUMNS, { [Date].[2002], [Date].[2003] } ON ROWS FROM Sprzedaż WHERE ( [Sklep].[Europa].[Polska] ) Klauzula SELECT określa osie zapytania jako Sprzedaż w sklepach z wymiaru Measures oraz 2002 i 2003 z wymiaru Date. Klauzula FROM wskazuje, że źródłem danych jest kostka Sprzedaż. Klauzula WHERE definiuje przekrój jako element Polska wymiaru Sklep.

50 Perspektywy rozwojowe Oracle: Essbase (po przejęciu firmy Hyperion), BI Server. IBM: Cognos 8 BI (wraz z PowerPlay Studio ), baza danych TM1 (Applix). Microsoft: baza danych Panorama (właczona w SQL Server 7), dwa narzędzia analizy (Maximal i ProClarity), integracja z Excelem, SharePoint i Visio. W planach in-memory narzędzie Gemini.

51 Data Mining Automatyczne poszukiwanie interesujacych wzorców i trendów w danych. Terminu data mining używa się popularnie dla określenia sumaryzacji dużych zbiorów danych w użyteczny sposób. Wskazanie regularności, często zapisywanych regułami W odróżnieniu od dedukcyjnych baz danych (np. Datalog) stosuje się metody indukcyjne Konsekwencja: otrzymane wnioski nigdy nie sa gwarantowane, moga być skutkiem szczególnej chwilowej zawartości bazy danych.

52 Przykłady : Grupowanie wszystkich stron WWW według tematyki. Zapobieganie nadużyciom kredytowym: znajdowanie charakterystycznych cech nielegalnych transakcji z użyciem kard kredytowych. Wyszukiwanie asocjacji, np. znajdowanie towarów często kupowanych razem. Wyszukiwanie podobnych sekwencji zachowań, np. akcji o podobnych wahaniach obserwowanych wartości.

53 Charakterystyka Polega na nietrywialnym automatycznym wydobyciu nieznanej dotychczas i potencjalnie użytecznej informacji zawartej implicite w bazie danych. Oparte jest na poszukiwaniu wzorców w danych, bez uprzedniego generowania hipotez to odróżnia je od klasycznego podejścia statystycznego, gdzie analityk buduje hipotezę i próbuje ja potwierdzić na próbce z bazy danych Kłopoty z sytuacjami, gdy wzorce otrzymuje się w iteracyjnym procesie decyzyjnym. Informacja w bazie danych często zaburzona lub niekompletna, dlatego częste wykorzystanie metod statystycznych.

54 Technologia Ogólnie sztuczna inteligencja, uczenie maszynowe, sieci neuronowe, reguły asocjacji, zbiory rozmyte (rough sets). Klasyfikacja i przewidywanie: dla podanych z góry kategorii buduje się klasyfikator. Analiza klastrów (inaczej analiza czynnikowa?): samodzielne definiowanie kategorii. Rozpoznawanie i wyszukiwanie wzorców. Drzewa decyzyjne

55 Drzewa decyzyjne Przewidywanie wartości jakiegoś atrybutu na podstawie innych atrybutów, których wartości możemy testować. Przykład: Przeprowadzono badania (np. ankietowe) jakich cech oczekuja klienci w nowym modelu samochodu. Cel: wybrać grupę klientów do kampaniii marketingowej.

56 Zagadnienia Drzewo decyzyjne nie może być zbyt głębokie. W dolnych warstwach zbyt małe zbiory danych (nieistotne statystycznie) dla podjęcia decyzji Przy ograniczeniu głębokości należy dażyć do maksymalnej niezawodności.

57 Klastrowanie: zagadnienia Dzielenie danych na automatycznie generowane kategorie Czy podana oczekiwana liczba grup? Jak znajdować najlepsze grupy? Czy grupy sa znaczace semantycznie? np. yuppies

58 Analiza koszyka zakupów Koszyki zakupów = zbiory towarów kupowanych razem przez klienta podczas jednej wizyty w sklepie. Podsumowanie koszyków zakupów to częste zbiory towarów zbiory towarów często występujacych wspólnie.

59 Przykład koszyka zakupów Jeśli klienci często kupuja parówki i keczup, sklep może: Umieścić parówki i keczup blisko siebie, a między nimi chrupki ziemniaczane. Ogłosić przecenę na parówki równocześnie podnoszac cenę keczupu.

60 Znajdowanie częstych par W najprostszym przypadku chcemy znaleźć częste pary towarów. Załóżmy, że dana jest relacja Koszyki(koszyk, towar) Wsparcie zbioru towarów: liczba koszyków, w których towary te współwystępuja. Próg wsparcia pw to minimalna liczba koszyków, w których para musi wystapić, aby wzbudziła nasze zainteresowanie.

61 Częste pary w SQL Algorytm: 1 Szukaj par wierszy z Koszyki o takim samym koszyku i innych towarach. Pierwszy towar musi poprzedzać drugi (aby nie liczyv tej samej pary dwukrotnie). 2 Dla takiej każdej pary towarów utwórz osobna grupę. 3 Wyrzuć grupy zawierajace mniej niż pw elementów. SELECT k1.towar, k2.towar FROM Koszyki k1, Koszyki k2 WHERE k1.koszyk = k2.koszyk AND k1.towar < k2.towar GROUP BY k1.towar, k2.towar HAVING COUNT(*) >= pw;

62 Algorytm A-Priori (1) Próg wsparcia pw powinien wysoki taki aby otrzymać niewiele par. Przyśpieszenie w algorytmie a-priori opiera się na obserwacji, że zbiór towarów ma wsparcie przekraczajace pw tylko wtedy, gdy ma je każdy jego podzbiór. A więc para towarów {i, j} ma wsparcie przekraczajace pw tylko gdy ma je osobno każdy z towarów {i} i {j}.

63 Algorytm A-Priori (2) Umieścimy w zmaterializowanej perspektywie tylko informację o częstych towarach. INSERT INTO Koszyki1(koszyk, towar) SELECT * FROM Koszyki WHERE towar IN ( SELECT towar FROM Koszyki GROUP BY towar HAVING COUNT(*) >= pw);

64 Algorytm A-Priori (3) Nowa wersja poprzedniego zapytania SELECT I.towar, J.towar, COUNT(I.koszyk) FROM Koszyki1 I, Koszyki1 J WHERE I.koszyk = J.koszyk AND I.towar < J.towar GROUP BY I.towar, J.towar HAVING COUNT(I.koszyk) >= s;

65 Algorytm A-Priori (4) Zmaterializuj perspektywę Koszyki1. Uruchom poprzednie zapytanie, używajac Koszyki1 zamiast Koszyki. Obliczenie perspektywy Koszyki1 jest tanie, bo nie zawiera ona złaczenia. Perspektywa Koszyki1 zapewne ma dużo mniej wierszy niż tabela Koszyki. Czas realizacji zapytania maleje z kwadratem liczby wierszy podlegajacych złaczeniu.

66 A-Priori: przykład Sklep sprzedaje różnych towarów. Przeciętnie koszyk zawiera 20 towarów. Baza danych przechowuje (milion) koszyków. Tabela Koszyki zawiera 20 milionów wierszy. Podczas złaczenia powstanie 195 milionów wierszy. Załóżmy, że poziom wsparcia to 1% liczby koszyków, czyli Wtedy towarów o tym wsparciu będzie co najwyżej Przeciętnie podczas złaczenia powstanie 45 milionów wierszy, czyli osiagamy 4-krotne przyspieszenie.

67 Narzędzia Weka: Nowa Zelandia Rses i Rses-lib: MIMUW. SAS

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach. http://zajecia.jakubw.

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach. http://zajecia.jakubw. Hurtownie danych Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach. http://zajecia.jakubw.pl/hur UZASADNIENIE BIZNESOWE Po co nam hurtownia danych? Jakie mogą

Bardziej szczegółowo

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH Wstęp. Architektura hurtowni. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH B. Inmon, 1996: Hurtownia to zbiór zintegrowanych, nieulotnych, ukierunkowanych

Bardziej szczegółowo

Modele danych - wykład V

Modele danych - wykład V Modele danych - wykład V Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Zagadnienia 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie

Bardziej szczegółowo

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE Modele danych - wykład V Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Zagadnienia 1. Wprowadzenie 2. MOLAP modele danych 3. modele danych 4. Podsumowanie 5. Zadanie fajne

Bardziej szczegółowo

Business Intelligence

Business Intelligence Business Intelligence Paweł Mielczarek Microsoft Certified Trainer (MCT) MCP,MCSA, MCTS, MCTS SQL 2005, MCTS SQL 2008, MCTS DYNAMICS, MBSS, MBSP, MCITP DYNAMICS. Geneza Prowadzenie firmy wymaga podejmowania

Bardziej szczegółowo

Hurtownie danych. Przetwarzanie zapytań. http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU

Hurtownie danych. Przetwarzanie zapytań. http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU Hurtownie danych Przetwarzanie zapytań. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU Magazyny danych operacyjnych, źródła Centralna hurtownia danych Hurtownie

Bardziej szczegółowo

Wielowymiarowy model danych

Wielowymiarowy model danych Plan wykładu Wielowymiarowy model danych 1. Model danych 2. Analiza wielowymiarowa 3. Model wielowymiarowy: koncepcja wymiarów i faktów 4. Operacje modelu wielowymiarowego 5. Implementacje modelu wielowymiarowego:

Bardziej szczegółowo

Hurtownie danych a transakcyjne bazy danych

Hurtownie danych a transakcyjne bazy danych Hurtownie danych a transakcyjne bazy danych Materiały źródłowe do wykładu: [1] Jerzy Surma, Business Intelligence. Systemy wspomagania decyzji, Wydawnictwo Naukowe PWN, Warszawa 2009 [2] Arkadiusz Januszewski,

Bardziej szczegółowo

Wstęp do Business Intelligence

Wstęp do Business Intelligence Wstęp do Business Intelligence Co to jest Buisness Intelligence Business Intelligence (analityka biznesowa) - proces przekształcania danych w informacje, a informacji w wiedzę, która może być wykorzystana

Bardziej szczegółowo

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego http://www.jakubw.pl/zajecia/hur/bi.pdf http://www.jakubw.pl/zajecia/hur/dw.pdf http://www.jakubw.pl/zajecia/hur/dm.pdf http://www.jakubw.pl/zajecia/hur/

Bardziej szczegółowo

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania Semestr zimowy 2007/08 Studia uzupełniajace magisterskie

Bardziej szczegółowo

Hurtownie danych wykład 3

Hurtownie danych wykład 3 Hurtownie danych wykład 3 dr Sebastian Zając SGH Warszawa 7 lutego 2017 Architektura relacyjna i wielowymiarowa Ze względu na przechowywanie danych na serwerze możemy zdecydować się na relacyjną bazę danych

Bardziej szczegółowo

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Systemy OLAP I Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania Semestr zimowy 2008/09 Studia

Bardziej szczegółowo

OLAP i hurtownie danych c.d.

OLAP i hurtownie danych c.d. OLAP i hurtownie danych c.d. Przypomnienie OLAP -narzędzia analizy danych Hurtownie danych -duże bazy danych zorientowane tematycznie, nieulotne, zmienne w czasie, wspierjące procesy podejmowania decyzji

Bardziej szczegółowo

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego BD2 BazyDanych2 dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego ³ Copyright c Tomasz Traczyk Instytut Automatyki i Informatyki Stosowanej Politechniki Warszawskiej Materiały dydaktyczne

Bardziej szczegółowo

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych 1 Plan wykładu 2 Hurtownie danych Integracja danych za pomocą hurtowni danych Przetwarzanie analityczne OLAP Model wielowymiarowy Implementacje modelu wielowymiarowego ROLAP MOLAP Odświeżanie hurtowni

Bardziej szczegółowo

Część I Istota analizy biznesowej a Analysis Services

Część I Istota analizy biznesowej a Analysis Services Spis treści Część I Istota analizy biznesowej a Analysis Services 1 Analiza biznesowa: podstawy analizy danych... 3 Wprowadzenie do analizy biznesowej... 3 Wielowymiarowa analiza danych... 5 Atrybuty w

Bardziej szczegółowo

Bazy analityczne (hurtownie danych, bazy OLAP)

Bazy analityczne (hurtownie danych, bazy OLAP) Bazy analityczne (hurtownie danych, bazy OLAP) Materiały pomocnicze. Bazy produkcyjne (transakcyjne) i analityczne Większość systemów baz danych to systemy produkcyjne, inaczej nazywane transakcyjnymi,

Bardziej szczegółowo

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot Alberto Ferrari i Marco Russo Przekład: Marek Włodarz APN Promise Warszawa 2014 Spis treści Wprowadzenie............................................................

Bardziej szczegółowo

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services Spis treści Wstęp... ix Odkąd najlepiej rozpocząć lekturę?... ix Informacja dotycząca towarzyszącej ksiąŝce płyty CD-ROM... xi Wymagania systemowe... xi Instalowanie i uŝywanie plików przykładowych...

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Spis tre±ci. Przedmowa... Cz ± I

Spis tre±ci. Przedmowa... Cz ± I Przedmowa.................................................... i Cz ± I 1 Czym s hurtownie danych?............................... 3 1.1 Wst p.................................................. 3 1.2 Denicja

Bardziej szczegółowo

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów Przeznaczenie szkolenia Szkolenie dla osób chcących: Profesjonalnie przygotowywać dane do dalszej

Bardziej szczegółowo

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1) Hurtownie danych dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki Maciej Zakrzewicz (1) Plan wykładu Wprowadzenie do Business Intelligence (BI) Hurtownia danych Zasilanie hurtowni

Bardziej szczegółowo

Wprowadzenie do hurtowni danych

Wprowadzenie do hurtowni danych Wprowadzenie do hurtowni danych przygotował: Paweł Kasprowski Kostka Kostka (cube) to podstawowy element hurtowni Kostka jest wielowymiarowa (od 1 do N wymiarów) Kostka składa się z: faktów wektora wartości

Bardziej szczegółowo

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38 Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem zajęcia 1 dr Jakub Boratyński pok. A38 Program zajęć Bazy danych jako podstawowy element systemów informatycznych wykorzystywanych

Bardziej szczegółowo

Hurtownie danych w praktyce

Hurtownie danych w praktyce Hurtownie danych w praktyce Fakty i mity Dr inż. Maciej Kiewra Parę słów o mnie... 8 lat pracy zawodowej z hurtowniami danych Projekty realizowane w kraju i zagranicą Certyfikaty Microsoft z Business Intelligence

Bardziej szczegółowo

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Plan wykładów Wprowadzenie - integracja

Bardziej szczegółowo

Hurtownie danych - przegląd technologii

Hurtownie danych - przegląd technologii Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Plan wykład adów Wprowadzenie - integracja

Bardziej szczegółowo

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Usługi analityczne budowa kostki analitycznej Część pierwsza. Usługi analityczne budowa kostki analitycznej Część pierwsza. Wprowadzenie W wielu dziedzinach działalności człowieka analiza zebranych danych jest jednym z najważniejszych mechanizmów podejmowania decyzji.

Bardziej szczegółowo

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL Podstawy baz danych: Rysunek 1. Tradycyjne systemy danych 1- Obsługa wejścia 2- Przechowywanie danych 3- Funkcje użytkowe 4- Obsługa wyjścia Ewolucja baz danych: Fragment świata rzeczywistego System przetwarzania

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2008 Zagadnienia do omówienia 1. 2. Przegląd architektury HD 3. Warsztaty

Bardziej szczegółowo

Co to jest Business Intelligence?

Co to jest Business Intelligence? Cykl: Cykl: Czwartki z Business Intelligence Sesja: Co Co to jest Business Intelligence? Bartłomiej Graczyk 2010-05-06 1 Prelegenci cyklu... mariusz@ssas.pl lukasz@ssas.pl grzegorz@ssas.pl bartek@ssas.pl

Bardziej szczegółowo

Spojrzenie na systemy Business Intelligence

Spojrzenie na systemy Business Intelligence Marcin Adamczak Nr 5375 Spojrzenie na systemy Business Intelligence 1.Wprowadzenie. W dzisiejszym świecie współczesna organizacja prędzej czy później stanie przed dylematem wyboru odpowiedniego systemu

Bardziej szczegółowo

Systemy GIS Tworzenie zapytań w bazach danych

Systemy GIS Tworzenie zapytań w bazach danych Systemy GIS Tworzenie zapytań w bazach danych Wykład nr 6 Analizy danych w systemach GIS Jak pytać bazę danych, żeby otrzymać sensowną odpowiedź......czyli podstawy języka SQL INSERT, SELECT, DROP, UPDATE

Bardziej szczegółowo

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa Budowa systemu wspomagającego podejmowanie decyzji Metodyka projektowo wdrożeniowa Agenda Systemy wspomagające decyzje Business Intelligence (BI) Rodzaje systemów BI Korzyści z wdrożeń BI Zagrożenia dla

Bardziej szczegółowo

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com Media Partners Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com Adrian Chodkowski Konsultant Business Intelligence w Jcommerce S.A Certyfikowany

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

Baza danych. Modele danych

Baza danych. Modele danych Rola baz danych Systemy informatyczne stosowane w obsłudze działalności gospodarczej pełnią funkcję polegającą na gromadzeniu i przetwarzaniu danych. Typowe operacje wykonywane na danych w systemach ewidencyjno-sprawozdawczych

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2012 Zagadnienia do omówienia 1. Miejsce i rola w firmie 2. Przegląd architektury

Bardziej szczegółowo

Kostki OLAP i język MDX

Kostki OLAP i język MDX Kostki OLAP i język MDX 24 kwietnia 2015 r. Opis pliku z zadaniami Wszystkie zadania na zajęciach będą przekazywane w postaci plików PDF sformatowanych jak ten. Będą się na nie składały różne rodzaje zadań,

Bardziej szczegółowo

Projektowanie hurtowni danych i modelowanie wielowymiarowe

Projektowanie hurtowni danych i modelowanie wielowymiarowe Projektowanie hurtowni danych i modelowanie wielowymiarowe Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania

Bardziej szczegółowo

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1) Hurtownie danych 1 Problematyka hurtowni danych Wykład przygotował: Robert Wrembel ZSBD wykład 12 (1) 1 Plan wykładu Problematyka integracji danych Integracja danych za pomocą hurtowni danych Przetwarzanie

Bardziej szczegółowo

Wprowadzenie do hurtowni danych

Wprowadzenie do hurtowni danych Wprowadzenie do hurtowni danych przygotował: Paweł Kasprowski Informacje ogólne ( pawel@kasprowski.pl ) Wykładowca: Paweł Kasprowski Temat: Wprowadzenie do hurtowni danych Umiejętności wymagane: Znajomość

Bardziej szczegółowo

Informatyzacja przedsiębiorstw

Informatyzacja przedsiębiorstw Informatyzacja przedsiębiorstw Izabela Szczęch Politechnika Poznańska Plan wykładu Elementy Business Intelligence Model wielowymiarowy Modelowanie hurtowni danych podstawowe schematy logiczne Operacje

Bardziej szczegółowo

Systemy OLAP. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Systemy OLAP. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania Semestr zimowy 2005/06 Plan wykładu Ewolucja

Bardziej szczegółowo

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu Podstawy baz danych PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych

Bardziej szczegółowo

Wykład XII. optymalizacja w relacyjnych bazach danych

Wykład XII. optymalizacja w relacyjnych bazach danych Optymalizacja wyznaczenie spośród dopuszczalnych rozwiązań danego problemu, rozwiązania najlepszego ze względu na przyjęte kryterium jakości ( np. koszt, zysk, niezawodność ) optymalizacja w relacyjnych

Bardziej szczegółowo

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych Plan wykładu Bazy Wykład 14: Hurtownie Bazy operacyjne i analityczne Architektura hurtowni Projektowanie hurtowni Małgorzata Krętowska, Agnieszka Oniśko Wydział Informatyki PB Bazy (studia dzienne) 2 Rodzaje

Bardziej szczegółowo

www.comarch.pl/szkolenia Operacja PIVOT w języku SQL w środowisku Oracle 21.11.2012

www.comarch.pl/szkolenia Operacja PIVOT w języku SQL w środowisku Oracle 21.11.2012 Operacja PIVOT w języku SQL w środowisku Oracle 21.11.2012 Zakres Wprowadzenie Idea przestawiania danych Możliwe zastosowania Przestawianie danych bez klauzuli PIVOT Konstrukcja klauzuli Korzyści ze stosowania

Bardziej szczegółowo

Pierwsze wdrożenie SAP BW w firmie

Pierwsze wdrożenie SAP BW w firmie Pierwsze wdrożenie w firmie Mirosława Żurek, BCC Poznao, maj 2013 Zakres tematyczny wykładu Podstawowe założenia i pojęcia hurtowni danych ; Przykładowe pierwsze wdrożenie w firmie i jego etapy; Przykładowe

Bardziej szczegółowo

Schematy logiczne dla hurtowni danych

Schematy logiczne dla hurtowni danych Schematy logiczne dla hurtowni danych 26 Plan rozdziału 27 Model biznesowy, logiczny i fizyczny hurtowni danych Podstawowe pojęcia w modelu logicznym, logiczny model wielowymiarowy Implementacje ROLAP/MOLAP

Bardziej szczegółowo

Analiza danych i data mining.

Analiza danych i data mining. Analiza danych i data mining. mgr Katarzyna Racka Wykładowca WNEI PWSZ w Płocku Przedsiębiorczy student 2016 15 XI 2016 r. Cel warsztatu Przekazanie wiedzy na temat: analizy i zarządzania danymi (data

Bardziej szczegółowo

1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4

1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4 1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4 2 Tabele przestawne, wykresy przestawne i formatowanie warunkowe 11 Co to

Bardziej szczegółowo

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego.

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego. 77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego. Przy modelowaniu bazy danych możemy wyróżnić następujące typy połączeń relacyjnych: jeden do wielu, jeden do jednego, wiele

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski Data Mining Wykład 1 Wprowadzenie do Eksploracji Danych Prowadzący Dr inż. Jacek Lewandowski Katedra Genetyki Wydział Biologii i Hodowli Zwierząt Uniwersytet Przyrodniczy we Wrocławiu ul. Kożuchowska 7,

Bardziej szczegółowo

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP WYKŁAD 12: OLAP Plan Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP Motywacja: Zaawansowane metody ekstrakcji danych i techniki przechowywania danych Rozwój wielu dziedzin zastosowań

Bardziej szczegółowo

Oracle11g: Wprowadzenie do SQL

Oracle11g: Wprowadzenie do SQL Oracle11g: Wprowadzenie do SQL OPIS: Kurs ten oferuje uczestnikom wprowadzenie do technologii bazy Oracle11g, koncepcji bazy relacyjnej i efektywnego języka programowania o nazwie SQL. Kurs dostarczy twórcom

Bardziej szczegółowo

DMX DMX DMX DMX: CREATE MINING STRUCTURE. Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski

DMX DMX DMX DMX: CREATE MINING STRUCTURE. Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski DMX DMX DMX Data Mining Extensions jest językiem do tworzenia i działania na modelach eksploracji danych w Microsoft SQL Server Analysis Services SSAS. Za pomocą DMX można tworzyć strukturę nowych modeli

Bardziej szczegółowo

Teoretyczne podstawy informatyki

Teoretyczne podstawy informatyki Teoretyczne podstawy informatyki Wykład 8b: Algebra relacyjna http://hibiscus.if.uj.edu.pl/~erichter/dydaktyka2009/tpi-2009 Prof. dr hab. Elżbieta Richter-Wąs 1 Algebra relacyjna Algebra relacyjna (ang.

Bardziej szczegółowo

Integracja i Eksploracja Danych

Integracja i Eksploracja Danych Integracja i Eksploracja Danych Laboratorium nr 4 Wprowadzenie do języka MDX. Zadania: 1) Analogicznie do przykładu zawartego na poprzednich zajęciach, korzystając z SQL Server Business Intelligence Development

Bardziej szczegółowo

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. http://zajecia.jakubw.pl/hur INTEGRACJA DANYCH ETL

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. http://zajecia.jakubw.pl/hur INTEGRACJA DANYCH ETL Hurtownie danych Ładowanie, integracja i aktualizacja danych. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur INTEGRACJA DANYCH Źródła danych ETL Centralna hurtownia danych Do hurtowni

Bardziej szczegółowo

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence Marcin Adamczak Jakub Gruszka MSP Business Intelligence Plan Prezentacji Definicja Podział Zastosowanie Wady i zalety Przykłady Historia W październiku 1958 Hans Peter Luhn pracownik działu badań w IBM

Bardziej szczegółowo

BAZY DANYCH LABORATORIUM. Studia niestacjonarne I stopnia

BAZY DANYCH LABORATORIUM. Studia niestacjonarne I stopnia BAZY DANYCH LABORATORIUM Studia niestacjonarne I stopnia Gdańsk, 2011 1. Cel zajęć Celem zajęć laboratoryjnych jest wyrobienie praktycznej umiejętności tworzenia modelu logicznego danych a nastepnie implementacji

Bardziej szczegółowo

OnLine Analytical Processing (OLAP) Kostki OLAP i zapytania MDX

OnLine Analytical Processing (OLAP) Kostki OLAP i zapytania MDX OnLine Analytical Processing (OLAP) Kostki OLAP i zapytania MDX 24 kwietnia 2014 Opis pliku z zadaniami Wszystkie zadania na zajęciach będą przekazywane w postaci plików PDF sformatowanych jak ten. Będą

Bardziej szczegółowo

Bazy danych i usługi sieciowe

Bazy danych i usługi sieciowe Bazy danych i usługi sieciowe Wstęp do problematyki baz danych Paweł Daniluk Wydział Fizyki Jesień 2014 P. Daniluk (Wydział Fizyki) BDiUS w. I Jesień 2014 1 / 17 Plan wykładu 1 Bazy danych 1 Motywacja

Bardziej szczegółowo

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d.

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d. TECHNOLOGIE BAZ DANYCH WYKŁAD 1 Wprowadzenie do baz danych. Normalizacja. (Wybrane materiały) Dr inż. E. Busłowska Definicja bazy danych Uporządkowany zbiór informacji, posiadający własną strukturę i wartość.

Bardziej szczegółowo

Wstęp wprowadzający do laboratorium 2. mgr inż. Rafał Grycuk

Wstęp wprowadzający do laboratorium 2. mgr inż. Rafał Grycuk Wstęp wprowadzający do laboratorium 2 mgr inż. Rafał Grycuk Plan prezentacji 1. Czym jest T-SQL i czym się różni od standardu SQL 2. Typy zapytań 3. Zapytanie typu SELECT 4. Słowo o indeksach T-SQL (1)

Bardziej szczegółowo

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL ORACLE System Zarządzania Bazą Danych Oracle Oracle Advanced SQL wersja 1.0 Politechnika Śląska 2008 Raportowanie z wykorzystaniem fraz rollup, cube Frazy cube, rollup, grouping sets umożliwiają rozszerzoną

Bardziej szczegółowo

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego 1 85-240 Bydgoszcz www.softmaks.pl kontakt@softmaks.pl

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego 1 85-240 Bydgoszcz www.softmaks.pl kontakt@softmaks.pl Paweł Gołębiewski Softmaks.pl Sp. z o.o. ul. Kraszewskiego 1 85-240 Bydgoszcz www.softmaks.pl kontakt@softmaks.pl Droga na szczyt Narzędzie Business Intelligence. Czyli kiedy podjąć decyzję o wdrożeniu?

Bardziej szczegółowo

Bartłomiej Graczyk MCT,MCITP,MCTS

Bartłomiej Graczyk MCT,MCITP,MCTS Praktyczne wykorzystanie elementów raportowania (SSRS, Performance Point Service, Excel Services, Visio Services) w Microsoft Project 2010 Bartłomiej Graczyk 2012-11-05 Bartłomiej Graczyk MCT,MCITP,MCTS

Bardziej szczegółowo

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI Bazy danych Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI Wszechnica Poranna Trzy tematy: 1. Bazy danych - jak je ugryźć? 2. Język SQL podstawy zapytań. 3. Mechanizmy wewnętrzne baz danych czyli co

Bardziej szczegółowo

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K. HURTOWNIE DANYCH Krzysztof Goczyła Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska kris@eti.pg.gda.pl # 1 Część I. Tworzenie hurtowni danych 1. Co to jest hurtownia danych? 2. Model

Bardziej szczegółowo

Bazy danych 8. Podzapytania i grupowanie. P. F. Góra

Bazy danych 8. Podzapytania i grupowanie. P. F. Góra Bazy danych 8. Podzapytania i grupowanie P. F. Góra http://th-www.if.uj.edu.pl/zfs/gora/ 2009 Podzapytania Podzapytania pozwalaja na tworzenie strukturalnych podzapytań, co umożliwia izolowanie poszczególnych

Bardziej szczegółowo

Indeksy w hurtowniach danych

Indeksy w hurtowniach danych Indeksy w hurtowniach danych Hurtownie danych 2011 Łukasz Idkowiak Tomasz Kamiński Bibliografia Zbyszko Królikowski, Hurtownie danych. Logiczne i fizyczne struktury danych, Wydawnictwo Politechniki Poznańskiej,

Bardziej szczegółowo

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Wprowadzenie do technologii Business Intelligence i hurtowni danych Wprowadzenie do technologii Business Intelligence i hurtowni danych 1 Plan rozdziału 2 Wprowadzenie do Business Intelligence Hurtownie danych Produkty Oracle dla Business Intelligence Business Intelligence

Bardziej szczegółowo

Specjalizacja magisterska Bazy danych

Specjalizacja magisterska Bazy danych Specjalizacja magisterska Bazy danych Strona Katedry http://bd.pjwstk.edu.pl/katedra/ Prezentacja dostępna pod adresem: http://www.bd.pjwstk.edu.pl/bazydanych.pdf Wymagania wstępne Znajomość podstaw języka

Bardziej szczegółowo

Bazy danych. Plan wykładu. Diagramy ER. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych

Bazy danych. Plan wykładu. Diagramy ER. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych Plan wykładu Bazy danych Wykład 9: Przechodzenie od diagramów E/R do modelu relacyjnego. Definiowanie perspektyw. Diagramy E/R - powtórzenie Relacyjne bazy danych Od diagramów E/R do relacji SQL - perspektywy

Bardziej szczegółowo

Tabele przestawne jako narzędzie analizy biznesowej

Tabele przestawne jako narzędzie analizy biznesowej Firma szkoleniowa 2014 roku. TOP 3 w rankingu firm szkoleniowych zaprasza na szkolenie: Tabele przestawne jako narzędzie analizy biznesowej warsztaty komputerowe 24-25 września 2015 r. Warszawa Ekspert:

Bardziej szczegółowo

OPIS PRZEDMIOTU ZAMÓWIENIA

OPIS PRZEDMIOTU ZAMÓWIENIA Załącznik nr 1 OPIS PRZEDMIOTU ZAMÓWIENIA Licencja Microsoft Windows SQL Server Standard 2012 (nie OEM) lub w pełni równoważny oraz licencja umożliwiająca dostęp do Microsoft Windows SQL Server Standard

Bardziej szczegółowo

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Instalacja SQL Server Express. Logowanie na stronie Microsoftu Instalacja SQL Server Express Logowanie na stronie Microsoftu Wybór wersji do pobrania Pobieranie startuje, przechodzimy do strony z poradami. Wypakowujemy pobrany plik. Otwiera się okno instalacji. Wybieramy

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Alicja Marszałek Różne rodzaje baz danych

Alicja Marszałek Różne rodzaje baz danych Alicja Marszałek Różne rodzaje baz danych Rodzaje baz danych Bazy danych można podzielić wg struktur organizacji danych, których używają. Można podzielić je na: Bazy proste Bazy złożone Bazy proste Bazy

Bardziej szczegółowo

Ewelina Dziura Krzysztof Maryański

Ewelina Dziura Krzysztof Maryański Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład

Bardziej szczegółowo

SQL Server. 2012 Analysis Services Model tabelaryczny BISM

SQL Server. 2012 Analysis Services Model tabelaryczny BISM Marco Russo Alberto Ferrari Chris Webb Microsoft SQL Server 2012 Analysis Services Model tabelaryczny BISM Przekład: Jakub Niedźwiedź, Witold Sikorski APN Promise, Warszawa 2012 Skrócony spis treści Przedmowa....

Bardziej szczegółowo

JPivot & Mondrian. 16 maja Krukar, Lewandowska (BiHD) JPivot & Mondrian 16 maja / 42

JPivot & Mondrian. 16 maja Krukar, Lewandowska (BiHD) JPivot & Mondrian 16 maja / 42 JPivot & Mondrian Urszula Krukar Agnieszka Lewandowska 16 maja 2007 Krukar, Lewandowska (BiHD) JPivot & Mondrian 16 maja 2007 1 / 42 1 Wprowadzenie 2 Pentaho BI Suite 3 Mondrian 4 Schemat kostki 5 JPivot

Bardziej szczegółowo

ZAGADNIENIA DO EGZAMINU DYPLOMOWEGO NA STUDIACH INŻYNIERSKICH. Matematyka dyskretna, algorytmy i struktury danych, sztuczna inteligencja

ZAGADNIENIA DO EGZAMINU DYPLOMOWEGO NA STUDIACH INŻYNIERSKICH. Matematyka dyskretna, algorytmy i struktury danych, sztuczna inteligencja Kierunek Informatyka Rok akademicki 2016/2017 Wydział Matematyczno-Przyrodniczy Uniwersytet Rzeszowski ZAGADNIENIA DO EGZAMINU DYPLOMOWEGO NA STUDIACH INŻYNIERSKICH Technika cyfrowa i architektura komputerów

Bardziej szczegółowo

TP1 - TABELE PRZESTAWNE od A do Z

TP1 - TABELE PRZESTAWNE od A do Z TP1 - TABELE PRZESTAWNE od A do Z Program szkolenia 1. Tabele programu Excel 1.1. Wstawianie tabeli 1.2. Style tabeli 1.3. Właściwości tabeli 1.4. Narzędzia tabel 1.4.1. Usuń duplikaty 1.4.2. Konwertuj

Bardziej szczegółowo

DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna&

DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna& DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna& Artur Wroński" Priorytety rozwoju technologii Big Data& Analiza większych zbiorów danych, szybciej& Łatwość użycia& Wsparcie

Bardziej szczegółowo

Modelowanie hurtowni danych

Modelowanie hurtowni danych Modelowanie hurtowni danych Zbyszko Królikowski Instytut Informatyki Dane w hurtowniach danych pojęcia podstawowe Hurtowniadanychjestkolekcją:zintegrowanych, zorientowanych tematycznie, zmiennych w czasie,

Bardziej szczegółowo

Szczegółowy opis przedmiotu zamówienia

Szczegółowy opis przedmiotu zamówienia ZP/ITS/19/2013 SIWZ Załącznik nr 1.1 do Szczegółowy opis przedmiotu zamówienia Przedmiotem zamówienia jest: Przygotowanie zajęć dydaktycznych w postaci kursów e-learningowych przeznaczonych dla studentów

Bardziej szczegółowo

Podstawowe zagadnienia z zakresu baz danych

Podstawowe zagadnienia z zakresu baz danych Podstawowe zagadnienia z zakresu baz danych Jednym z najważniejszych współczesnych zastosowań komputerów we wszelkich dziedzinach życia jest gromadzenie, wyszukiwanie i udostępnianie informacji. Specjalizowane

Bardziej szczegółowo

Plan prezentacji 0 Wprowadzenie 0 Zastosowania 0 Przykładowe metody 0 Zagadnienia poboczne 0 Przyszłość 0 Podsumowanie 7 Jak powstaje wiedza? Dane Informacje Wiedza Zrozumienie 8 Przykład Teleskop Hubble

Bardziej szczegółowo

- język zapytań służący do zapisywania wyrażeń relacji, modyfikacji relacji, tworzenia relacji

- język zapytań służący do zapisywania wyrażeń relacji, modyfikacji relacji, tworzenia relacji 6. Język SQL Język SQL (Structured Query Language): - język zapytań służący do zapisywania wyrażeń relacji, modyfikacji relacji, tworzenia relacji - stworzony w IBM w latach 70-tych DML (Data Manipulation

Bardziej szczegółowo

Oracle PL/SQL. Paweł Rajba. pawel@ii.uni.wroc.pl http://www.kursy24.eu/

Oracle PL/SQL. Paweł Rajba. pawel@ii.uni.wroc.pl http://www.kursy24.eu/ Paweł Rajba pawel@ii.uni.wroc.pl http://www.kursy24.eu/ Zawartość modułu 6 Wprowadzenie Definiowanie wyzwalaczy DML Metadane wyzwalaczy Inne zagadnienia, tabele mutujące Wyzwalacze INSTEAD OF Wyzwalacze

Bardziej szczegółowo

SQL (ang. Structured Query Language)

SQL (ang. Structured Query Language) SQL (ang. Structured Query Language) SELECT pobranie danych z bazy, INSERT umieszczenie danych w bazie, UPDATE zmiana danych, DELETE usunięcie danych z bazy. Rozkaz INSERT Rozkaz insert dodaje nowe wiersze

Bardziej szczegółowo

opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje nazwy tabel lub widoków warunek (wybieranie wierszy)

opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje nazwy tabel lub widoków warunek (wybieranie wierszy) Zapytania SQL. Polecenie SELECT jest używane do pobierania danych z bazy danych (z tabel lub widoków). Struktura polecenia SELECT SELECT FROM WHERE opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje

Bardziej szczegółowo