Analityczne bazy danych Kostki danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Analityczne bazy danych Kostki danych"

Transkrypt

1 Analityczne bazy danych Kostki danych 10 maja 2015

2 Podejmowanie decyzji Ze względu na horyzont czasowy decyzje organizacyjne można podzielić na trzy kategorie: decyzje operacyjne o zakresie dni lub tygodni; decyzje taktyczne, których efekty obejmuja od kilku miesięcy do roku, decyzje strategiczne, których wpływ rozciaga się na kilka lat. Zaobserwowano, że w miarę przechodzenia od decyzji operacyjnych do strategicznych stosowane procedury postępowania staja się coraz mniej algorytmiczne.

3 Podejmowanie decyzji Poczatkowo systemów komputerowe w działalności gospodarczej używano przede wszystkim do operacyjnego przetwarzania danych w takich aplikacjach jak przyjmowanie i obróbka zamówień, fakturowanie, inwentaryzacja itp. Stopniowo zaczęto jednak używać komputerów również do mniej rutynowych działań, okreśłanych mianem systemów wspomagania decyzji (decision support systems, DSS). Inne spotykane nazwy to BIS/BIT (Business Intelligence System/Technology) EIS (Executive Information System). Oprócz mechanicznego przetwarzania danych obejmuja one również rozmaite mechanizmy wnioskowania z faktów zawartych w bazie danych. Stad wział się podział aplikacji bazodanowych na operacyjne i analityczne.

4 Wymagania na dane dla systemów wspomagania decyzji Informacja najczęściej ma być przedstawiona w postaci sumarycznej. Brak standardowych metod dostępu, duże zróżnicowanie sposobów wyboru i postaci informacji do przedstawienia, dynamika. Łaczenie wyszukanej informacji z innymi zasobami obliczeniowymi (arkusze kalkulacyjne, specjalizowane pakiety).

5 Analityczne przetwarzanie danych Termin angielski: On-Line Analytical Processing, stad powszechnie używany skrót OLAP. Typowe zastosowania to analiza trendów oraz poszukiwanie wzorców zachowań lub anomalii. Używane do pracy interakcyjnej, więc bardzo istotna jest wydajność, zwłaszcza czasowa. Jeśli użytkownik dostrzeże, że pewne zapytania (np. oparte na 5 i więcej złaczeniach) sa realizowane bardzo wolno, to zacznie ich unikać. Przyjmuje się, że odpowiedź na 90% zapytań powinna następować w ciagu 10 sekund.

6 Analityczne bazy danych Inaczej bazy danych OLAP (On-Line Analytical Processing). Rosnace znaczenie: 8 mld. dol. w 1998 roku. Od komputerów biurkowych po olbrzymie konfiguracje. Wiele modnych haseł, zaklęć zwijanie i rozwijanie, drażenie, MOLAP, obracanie.

7 Podstawowe zagadnienia Co to jest analityczna baza danych? Modele i operacje Implementacja analitycznej bazy danych Kierunki rozwojowe

8 Raporty macierzowe Pierwszym wsparciem dla analizy danych były raporty macierzowe. Raporty macierzowe przypominaja arkusze kalkulacyjny. Często dotycza finansów lub zarzadzania. W systemie sprzedaży będzie na przykład potrzebny raport o klientach i ich wzorcach kupowania z podziałem na regiony. Jednak zamiast analizować wzorce dla każdego towaru, dzielimy towary na kategorie. Tak więc kolumnami raportu będa wypisane u góry kategorie towarów, wierszami stany, a każda z komórek będzie pokazywać liczbę pozycji sprzedanych w tej kategorii.

9 Data Mart Mała hurtownia, nazywana czasem tematyczna baza danych Obejmuje tylko część tematyki organizacji, np. marketing: klienci, towary, sprzedaż Model dostosowany do potrzeb działu. Najczęściej informacja wstępnie zagregowana Eliminacja zbędnych detali Wybieramy pewien krytyczny poziom szczegółowości.

10 Narzędzia do zapytań i analiz Budowanie zapytań Generatory raportów porównania: wzrost, spadek trendy, grafy Arkusze kalkulacyjne Interfejs WWW Data Mining

11 Inne operacje Funkcje po czasie np. średnie po różnych okresach Atrybuty obliczane np. marża = sprzedaż * stopa Zapytania tekstowe, np. znajdź dokumenty zawierajace słowa A i B uporzadkuj dokumenty według częstości występowania słów X, Y i Z

12 Modele danych i operatory Modele danych relacja gwiazda i płatek śniegu kostka: rozwinięcie idei arkusza kalkulacyjnego (tablice wielowymiarowe) Operatory slice & dice roll-up, drill down pivoting inne

13 Wielowymiarowy model danych Najczęściej używa się wielowymiarowych bazy danych z uwagi na analityczny model danych o postaci kostki wielowymiarowej obejmujacy: fakty zwane też miarami (measures), np. liczba sprzedanych samochodów; wymiary (dimensions), np. miesiace, regiony sprzedaży.

14 Wymiary Wymiary tworza zazwyczaj hierarchie, np. dla czasu będzie to rok-kwartał-miesiac-dzień. Dzięki temu możliwa jest interakcyjna zmiana poziomu szczegółowości (ziarnistości) ogladanej informacji. W bardziej złożonych przypadkach hierarchie moga rozgałęziać się, np. podział na tygodnie jest niezgodny z podziałem na miesiace.

15 Czas Wymiar czasu wymaga specjalnego traktowania Zwykle jest ukryty nie tworzy się dla niego osobnej tabeli wymiaru. Ma naturę sekwencyjna: jest uporzadkowany Zapytanie o sprzedaż w pierwszych trzech miesiacach roku sa bardzo częste Rzadko natomiast pytamy o sprzedaż czterech pierwszych towarów (nawet zakładajac uporzadkowanie np. wg nazwy) Sposób agregacji po czasie zależy od sensu miary Jeśli sprzedano 20 komputerów w styczniu, 15 w lutym i 7 w marcu, to zwykle pytamy o sumę sprzedanych komputerów w pierwszym kwartale. Natomiast jeśli firma zatrudniała 20 pracowników w styczniu, 15 w lutym i 7 w marcu, to sumowanie tych liczb jest raczej bez sensu (chyba że liczymy osobomiesiace ) i zwykle pytamy o przeciętne zatrudnienie w pierwszym kwartale.

16 Baza danych Źródłem danych jest najczęściej hurtownia danych (rzeczywista lub wirtualna). Bezpośrednie trzymanie w bazie danych informacji o faktach dla wszystkich poziomów szczegółowości może być kosztowne Tylko dla najczęściej używanych poziomów hierarchii. Pozostałe sa wyliczane na bieżaco w razie potrzeby. Przy agregowaniu miar warto pamiętać o różnych regułach liczenia, np. Wielkość sprzedaży jest na ogół sumowana Temperatura lub cena będa raczej uśredniane. W analitycznej bazie danych trzymane sa w zasadzie dane zagregowane. Aby obejrzeć dane szczegółowe (drill-through) konieczne jest sięgnięcie do hurtowni danych lub bazy operacyjnej. Ponieważ jest to kosztowne czasowo, taka potrzeba nie powinna występować zbyt często.

17 Operacje na danych Przecinanie i rzutowanie (slice and dice) Zmiana poziomu szczegółowości: drażenie lub rozwijanie (drill-down) i zwijanie (roll-up), obracanie (pivot): zmienia położenie wymiaru na wykresie.

18 Podejścia do budowy bazy OLAP 1 ROLAP = relacyjny OLAP : dopasowujemy relacyjny DBMS do schematu gwiazdy. 2 MOLAP = wielowymiarowy OLAP : używamy specjalizowanego DBMS z modelem w rodzaju kostka danych.

19 Schemat gwiazdy Schemat gwiazdy to typowy sposób organizacji danych dla relacyjnej bazy danych dla OLAP. Obejmuje: Tabelę faktów: olbrzymi zbiór faktów takich jak informacje o sprzedaży. Tabele wymiarów: mniejsze, statyczne informacje o obiektach, których dotycza fakty. Uogólnienie: model płatka śniegu. Hierarchie tabel dla poszczególnych wymiarów: normalizacja wymiarów.

20 Przykład schematu gwiazdy Chcemy gromadzić w hurtowni danych informacje o sprzedaży piwa: bar, marka piwa, piwosz, który je zakupił, dzień, godzina oraz cena. Tabela faktów będzie relacja: Sprzedaż(bar,piwo,piwosz,dzień,godzina,cena)

21 Przykład, cd. Tabele wymiarów zawieraja informacje o barach, piwach i piwoszach: Bary(bar, adres, licencja) Piwa(piwo, prod) Piwosze(piwosz, adres, tel)

22 Atrybuty wymiarów i atrybuty zależne Dwa rodzaje atrybutów w tabeli faktów: Atrybuty wymiarów: klucze tabel wymiarów. Atrybuty zależne: wartości wyznaczone przez atrybuty wymiarów krotki.

23 Przykład: atrybut zależny cena jest atrybutem zależnym w przykładowej relacji Sprzedaż. Jest ona wyznaczona przez kombinację atrybutów wymiarów: bar, piwo, piwosz i czas (kombinacja atrybutów daty i godziny).

24 Techniki optymalizacji ROLAP Indeksy bitmapowe: dla każdej wartości klucza indeksowego w tabeli wymiaru (np. dla każdego piwa w tabeli Piwa) tworzymy wektor bitowy podajacy, które krotki w tabeli faktów zawieraja tę wartość. Perspektywy zmaterializowane: w hurtowni przechowujemy gotowe odpowiedzi na kilka użytecznych zapytań (perspektywy).

25 Typowe zapytanie OLAP Zapytanie OLAP często zaczyna się od star join : złaczenia naturalnego tabeli faktów z wszystkimi lub większościa tabel wymiarów. Przykład: SELECT * FROM Sprzedaż,Bary,Piwa,Piwosze WHERE Sprzedaż.bar = Piwa.bar AND Sprzedaż.piwo = Piwa.piwo AND Sprzedaż.piwosz = Piwosze.piwosz;

26 Typowe zapytanie OLAP Rozpoczyna się złaczeniem gwiaździstym. Wybiera interesujace krotki używajac danych z tabel wymiarów. Grupuje po jednym lub więcej wymiarach. Agreguje niektóre atrybuty wyniku.

27 Przykład zapytania OLAP Dla każdego baru w Poznaniu podaj całkowita sprzedaż każdego piwa wytwarzanego przez browar Anheuser-Busch. Filtr: adres = Poznań i prod = Anheuser-Busch. Grupowanie: po bar i piwo. Agregacja: Suma po cena.

28 Przykład: SQL SELECT bar, piwo, SUM(cena) FROM Sprzedaż NATURAL JOIN Bary NATURAL JOIN Piwa WHERE addr = Poznań AND prod = Anheuser-Busch GROUP BY bar, piwo;

29 Perspektywy zmaterializowane Bezpośrednie wykonanie naszego zapytania dla tabeli Sprzedaż i tabel wymiarów może trwać za długo. Jeśli utworzymy perspektywę zmaterializowana zawierajac a odpowiednie informacje, będziemy mogli znacznie szybciej podać odpowiedź.

30 Przykład: Perspektywa zmaterializowana Jaka perspektywa mogłaby nam pomóc? Podstawowe wymagania: 1 Musi łaczyć co najmniej Sprzedaż, Bary i Piwa. 2 Musi grupować co najmniej po bar i piwo. 3 Nie musi wybierać barów w Poznaniu ani piw Anheuser-Busch. 4 Nie musi wycinać kolumn adres ani prod.

31 Przykład A oto przydatna perspektywa: CREATE VIEW BaPiS(bar, adres, piwo, prod, sprzedaż) AS SELECT bar, adres, piwo, prod, SUM(cena) sprzedaż FROM Sprzedaż NATURAL JOIN Bary NATURAL JOIN Piwa GROUP BY bar, adres, piwo, prod; Ponieważ bar adres oraz piwo prod, jest to pozorne grupowanie, konieczne ponieważ adres i prod występuja we frazie SELECT.

32 Przykład zakończenie Przeformułowane zapytanie z użyciem zmaterializowanej perspektwy BaPiS: SELECT bar, piwo, sprzedaż FROM BaPiS WHERE adres = Poznań AND prod = Anheuser-Busch ;

33 Aspekty materializacji Typ i częstość zapytań Czas odpowiedzi na zapytania Koszt pamięci Koszt aktualizacji

34 MOLAP i kostki danych Klucze tabel wymiarów staja się wymiarami hiperkostki. Przykład: dla danych z tabeli Sprzedaż mamy cztery wymiary: bar, piwo, piwosz i czas. Atrybuty zależne (np. cena) występuja w punktach (kratkach) kostki.

35 Wizualizacja kostki danych

36 Marginesy Kostka często zawiera również agregacje (zwykle SUM) wzdłuż hiper-krawędzi kostki. Marginesy obejmuja agregacje jednowymiarowe, dwuwymiarowe,...

37 Przykład: marginesy Nasza 4-wymiarowa kostka Sprzedaż obejmuje sumy cena dla każdego baru, każdego piwa, każdego piwosza i każdej jednostki czasu (zapewne dni). Zawiera też sumy cena dla wszystkich par bar-piwo, trójek bar-piwosz-dzień,...

38 Struktura kostki Każdy wymiar należy traktować jako majacy dodatkowa wartość *. Punkt wewnętrzny z jedna lub więcej współrzędna * zawiera agregaty po wymiarach z *. Przykład: Sprzedaż( Pod Żaglem, Bud, *, *) zawiera sumę piwa Bud wypitego w Pod Żaglem przez wszystkich piwoszy w dowolnym czasie.

39 Rozwijanie (drill-down) Drill-down = deagregacja rozbija agregację na jej składniki. Przykład: po stwierdzeniu, że Pod Żaglem sprzedaje się bardzo mało piw Okocim, rozbić tę sprzedaż na poszczególne gatunki piw Okocim.

40 Zwijanie (roll-up) Roll-up = agregacja po jednym lub więcej wymiarach. Przykład: majac tabelę podajac a jak wiele piwa Okocim wypija każdy piwosz w każdym barze, zwinać ja do tabeli podajacej ogólna ilość piwa Okocim wypijanego przez każdego z piwoszy.

41 Roll-Up i Drill-Down Anheuser-Busch dla piwosz/bar Jim Bob Mary Joe s Bar Nut-House Blue Chalk Zwinięcie po Bary A-B / piwosz Jim Mary Bob

42 Roll-Up i Drill-Down Rozwinięcie po Piwa Piwa A-B / piwosz Jim Bob Mary Bud M lob Bud Light

43 Zmaterializowane perspektywy kostek danych Dla kostek danych warto robić perspektywy zmaterializowane agregujace po jednym lub więcej wymiarach. Wymiary nie powinny być całkowicie agregowane można ewentualnie grupować po atrybucie z tabeli wymiaru.

44 Przykład Zmaterializowana perspektywa dla naszej kostki Sprzedaż mogłaby: 1 Agregować całkowicie po piwosz. 2 Nie agregować wcale po piwo. 3 Agregować po czasie według tydzień. 4 Agregować po miasto dla barów.

45 Indeksy Tradycyjne techniki B-drzewa, tablice haszujace, R-drzewa, gridy,... Specyficzne listy odwrócone indeksy bitmapowe indeksy złaczeniowe indeksy tekstowe

46 Użycie list odwróconych Zapytanie: Podaj osoby dla których wiek = 20 i imię = Fred Lista dla age = 20: r4, r18, r34, r35 Lista dla name = Fred : r18, r52 Odpowiedzia jest przecięcie: r18

47 Użycie bitmap Zapytanie: Podaj osoby dla których wiek = 20 i imię = Fred Mapa dla age = 20: Mapa dla name = Fred : Odpowiedzia jest przecięcie: Dobre jeśli mało wartości danych. Wektory bitowe można kompresować.

48 MDX Multidimensional Expressions (MDX): język zapytań dla MOLAP, poczatkowo jako część OLE DB (Microsoft 1997). Potem w Microsoft OLAP Services 7.0 i Microsoft Analysis Services. XML for Analysis zawiera MDX jako język zapytań. Był wspierany m.in. przez Applix, Oracle, SAS, SAP, Panorama Software, Cognos i Hyperion Solutions. W 2001 XMLA Council (www.xmla.org) publikuje standard XML for Analysis, z językiem zapytań mdxml (MDX obudowany znacznikiem <Statement> z XML.

49 Przykład zapytania w MDX SELECT { [Measures].[Sprzedaż w sklepach] } ON COLUMNS, { [Date].[2002], [Date].[2003] } ON ROWS FROM Sprzedaż WHERE ( [Sklep].[Europa].[Polska] ) Klauzula SELECT określa osie zapytania jako Sprzedaż w sklepach z wymiaru Measures oraz 2002 i 2003 z wymiaru Date. Klauzula FROM wskazuje, że źródłem danych jest kostka Sprzedaż. Klauzula WHERE definiuje przekrój jako element Polska wymiaru Sklep.

50 Perspektywy rozwojowe Oracle: Essbase (po przejęciu firmy Hyperion), BI Server. IBM: Cognos 8 BI (wraz z PowerPlay Studio ), baza danych TM1 (Applix). Microsoft: baza danych Panorama (właczona w SQL Server 7), dwa narzędzia analizy (Maximal i ProClarity), integracja z Excelem, SharePoint i Visio. W planach in-memory narzędzie Gemini.

51 Data Mining Automatyczne poszukiwanie interesujacych wzorców i trendów w danych. Terminu data mining używa się popularnie dla określenia sumaryzacji dużych zbiorów danych w użyteczny sposób. Wskazanie regularności, często zapisywanych regułami W odróżnieniu od dedukcyjnych baz danych (np. Datalog) stosuje się metody indukcyjne Konsekwencja: otrzymane wnioski nigdy nie sa gwarantowane, moga być skutkiem szczególnej chwilowej zawartości bazy danych.

52 Przykłady : Grupowanie wszystkich stron WWW według tematyki. Zapobieganie nadużyciom kredytowym: znajdowanie charakterystycznych cech nielegalnych transakcji z użyciem kard kredytowych. Wyszukiwanie asocjacji, np. znajdowanie towarów często kupowanych razem. Wyszukiwanie podobnych sekwencji zachowań, np. akcji o podobnych wahaniach obserwowanych wartości.

53 Charakterystyka Polega na nietrywialnym automatycznym wydobyciu nieznanej dotychczas i potencjalnie użytecznej informacji zawartej implicite w bazie danych. Oparte jest na poszukiwaniu wzorców w danych, bez uprzedniego generowania hipotez to odróżnia je od klasycznego podejścia statystycznego, gdzie analityk buduje hipotezę i próbuje ja potwierdzić na próbce z bazy danych Kłopoty z sytuacjami, gdy wzorce otrzymuje się w iteracyjnym procesie decyzyjnym. Informacja w bazie danych często zaburzona lub niekompletna, dlatego częste wykorzystanie metod statystycznych.

54 Technologia Ogólnie sztuczna inteligencja, uczenie maszynowe, sieci neuronowe, reguły asocjacji, zbiory rozmyte (rough sets). Klasyfikacja i przewidywanie: dla podanych z góry kategorii buduje się klasyfikator. Analiza klastrów (inaczej analiza czynnikowa?): samodzielne definiowanie kategorii. Rozpoznawanie i wyszukiwanie wzorców. Drzewa decyzyjne

55 Drzewa decyzyjne Przewidywanie wartości jakiegoś atrybutu na podstawie innych atrybutów, których wartości możemy testować. Przykład: Przeprowadzono badania (np. ankietowe) jakich cech oczekuja klienci w nowym modelu samochodu. Cel: wybrać grupę klientów do kampaniii marketingowej.

56 Zagadnienia Drzewo decyzyjne nie może być zbyt głębokie. W dolnych warstwach zbyt małe zbiory danych (nieistotne statystycznie) dla podjęcia decyzji Przy ograniczeniu głębokości należy dażyć do maksymalnej niezawodności.

57 Klastrowanie: zagadnienia Dzielenie danych na automatycznie generowane kategorie Czy podana oczekiwana liczba grup? Jak znajdować najlepsze grupy? Czy grupy sa znaczace semantycznie? np. yuppies

58 Analiza koszyka zakupów Koszyki zakupów = zbiory towarów kupowanych razem przez klienta podczas jednej wizyty w sklepie. Podsumowanie koszyków zakupów to częste zbiory towarów zbiory towarów często występujacych wspólnie.

59 Przykład koszyka zakupów Jeśli klienci często kupuja parówki i keczup, sklep może: Umieścić parówki i keczup blisko siebie, a między nimi chrupki ziemniaczane. Ogłosić przecenę na parówki równocześnie podnoszac cenę keczupu.

60 Znajdowanie częstych par W najprostszym przypadku chcemy znaleźć częste pary towarów. Załóżmy, że dana jest relacja Koszyki(koszyk, towar) Wsparcie zbioru towarów: liczba koszyków, w których towary te współwystępuja. Próg wsparcia pw to minimalna liczba koszyków, w których para musi wystapić, aby wzbudziła nasze zainteresowanie.

61 Częste pary w SQL Algorytm: 1 Szukaj par wierszy z Koszyki o takim samym koszyku i innych towarach. Pierwszy towar musi poprzedzać drugi (aby nie liczyv tej samej pary dwukrotnie). 2 Dla takiej każdej pary towarów utwórz osobna grupę. 3 Wyrzuć grupy zawierajace mniej niż pw elementów. SELECT k1.towar, k2.towar FROM Koszyki k1, Koszyki k2 WHERE k1.koszyk = k2.koszyk AND k1.towar < k2.towar GROUP BY k1.towar, k2.towar HAVING COUNT(*) >= pw;

62 Algorytm A-Priori (1) Próg wsparcia pw powinien wysoki taki aby otrzymać niewiele par. Przyśpieszenie w algorytmie a-priori opiera się na obserwacji, że zbiór towarów ma wsparcie przekraczajace pw tylko wtedy, gdy ma je każdy jego podzbiór. A więc para towarów {i, j} ma wsparcie przekraczajace pw tylko gdy ma je osobno każdy z towarów {i} i {j}.

63 Algorytm A-Priori (2) Umieścimy w zmaterializowanej perspektywie tylko informację o częstych towarach. INSERT INTO Koszyki1(koszyk, towar) SELECT * FROM Koszyki WHERE towar IN ( SELECT towar FROM Koszyki GROUP BY towar HAVING COUNT(*) >= pw);

64 Algorytm A-Priori (3) Nowa wersja poprzedniego zapytania SELECT I.towar, J.towar, COUNT(I.koszyk) FROM Koszyki1 I, Koszyki1 J WHERE I.koszyk = J.koszyk AND I.towar < J.towar GROUP BY I.towar, J.towar HAVING COUNT(I.koszyk) >= s;

65 Algorytm A-Priori (4) Zmaterializuj perspektywę Koszyki1. Uruchom poprzednie zapytanie, używajac Koszyki1 zamiast Koszyki. Obliczenie perspektywy Koszyki1 jest tanie, bo nie zawiera ona złaczenia. Perspektywa Koszyki1 zapewne ma dużo mniej wierszy niż tabela Koszyki. Czas realizacji zapytania maleje z kwadratem liczby wierszy podlegajacych złaczeniu.

66 A-Priori: przykład Sklep sprzedaje różnych towarów. Przeciętnie koszyk zawiera 20 towarów. Baza danych przechowuje (milion) koszyków. Tabela Koszyki zawiera 20 milionów wierszy. Podczas złaczenia powstanie 195 milionów wierszy. Załóżmy, że poziom wsparcia to 1% liczby koszyków, czyli Wtedy towarów o tym wsparciu będzie co najwyżej Przeciętnie podczas złaczenia powstanie 45 milionów wierszy, czyli osiagamy 4-krotne przyspieszenie.

67 Narzędzia Weka: Nowa Zelandia Rses i Rses-lib: MIMUW. SAS

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH Wstęp. Architektura hurtowni. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH B. Inmon, 1996: Hurtownia to zbiór zintegrowanych, nieulotnych, ukierunkowanych

Bardziej szczegółowo

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach. http://zajecia.jakubw.

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach. http://zajecia.jakubw. Hurtownie danych Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach. http://zajecia.jakubw.pl/hur UZASADNIENIE BIZNESOWE Po co nam hurtownia danych? Jakie mogą

Bardziej szczegółowo

Hurtownie danych. Przetwarzanie zapytań. http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU

Hurtownie danych. Przetwarzanie zapytań. http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU Hurtownie danych Przetwarzanie zapytań. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU Magazyny danych operacyjnych, źródła Centralna hurtownia danych Hurtownie

Bardziej szczegółowo

Wielowymiarowy model danych

Wielowymiarowy model danych Plan wykładu Wielowymiarowy model danych 1. Model danych 2. Analiza wielowymiarowa 3. Model wielowymiarowy: koncepcja wymiarów i faktów 4. Operacje modelu wielowymiarowego 5. Implementacje modelu wielowymiarowego:

Bardziej szczegółowo

Hurtownie danych a transakcyjne bazy danych

Hurtownie danych a transakcyjne bazy danych Hurtownie danych a transakcyjne bazy danych Materiały źródłowe do wykładu: [1] Jerzy Surma, Business Intelligence. Systemy wspomagania decyzji, Wydawnictwo Naukowe PWN, Warszawa 2009 [2] Arkadiusz Januszewski,

Bardziej szczegółowo

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego http://www.jakubw.pl/zajecia/hur/bi.pdf http://www.jakubw.pl/zajecia/hur/dw.pdf http://www.jakubw.pl/zajecia/hur/dm.pdf http://www.jakubw.pl/zajecia/hur/

Bardziej szczegółowo

Wstęp do Business Intelligence

Wstęp do Business Intelligence Wstęp do Business Intelligence Co to jest Buisness Intelligence Business Intelligence (analityka biznesowa) - proces przekształcania danych w informacje, a informacji w wiedzę, która może być wykorzystana

Bardziej szczegółowo

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Systemy OLAP I Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania Semestr zimowy 2008/09 Studia

Bardziej szczegółowo

OLAP i hurtownie danych c.d.

OLAP i hurtownie danych c.d. OLAP i hurtownie danych c.d. Przypomnienie OLAP -narzędzia analizy danych Hurtownie danych -duże bazy danych zorientowane tematycznie, nieulotne, zmienne w czasie, wspierjące procesy podejmowania decyzji

Bardziej szczegółowo

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych 1 Plan wykładu 2 Hurtownie danych Integracja danych za pomocą hurtowni danych Przetwarzanie analityczne OLAP Model wielowymiarowy Implementacje modelu wielowymiarowego ROLAP MOLAP Odświeżanie hurtowni

Bardziej szczegółowo

Część I Istota analizy biznesowej a Analysis Services

Część I Istota analizy biznesowej a Analysis Services Spis treści Część I Istota analizy biznesowej a Analysis Services 1 Analiza biznesowa: podstawy analizy danych... 3 Wprowadzenie do analizy biznesowej... 3 Wielowymiarowa analiza danych... 5 Atrybuty w

Bardziej szczegółowo

Bazy analityczne (hurtownie danych, bazy OLAP)

Bazy analityczne (hurtownie danych, bazy OLAP) Bazy analityczne (hurtownie danych, bazy OLAP) Materiały pomocnicze. Bazy produkcyjne (transakcyjne) i analityczne Większość systemów baz danych to systemy produkcyjne, inaczej nazywane transakcyjnymi,

Bardziej szczegółowo

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego BD2 BazyDanych2 dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego ³ Copyright c Tomasz Traczyk Instytut Automatyki i Informatyki Stosowanej Politechniki Warszawskiej Materiały dydaktyczne

Bardziej szczegółowo

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot Alberto Ferrari i Marco Russo Przekład: Marek Włodarz APN Promise Warszawa 2014 Spis treści Wprowadzenie............................................................

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services Spis treści Wstęp... ix Odkąd najlepiej rozpocząć lekturę?... ix Informacja dotycząca towarzyszącej ksiąŝce płyty CD-ROM... xi Wymagania systemowe... xi Instalowanie i uŝywanie plików przykładowych...

Bardziej szczegółowo

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38 Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem zajęcia 1 dr Jakub Boratyński pok. A38 Program zajęć Bazy danych jako podstawowy element systemów informatycznych wykorzystywanych

Bardziej szczegółowo

Spis tre±ci. Przedmowa... Cz ± I

Spis tre±ci. Przedmowa... Cz ± I Przedmowa.................................................... i Cz ± I 1 Czym s hurtownie danych?............................... 3 1.1 Wst p.................................................. 3 1.2 Denicja

Bardziej szczegółowo

Wprowadzenie do hurtowni danych

Wprowadzenie do hurtowni danych Wprowadzenie do hurtowni danych przygotował: Paweł Kasprowski Kostka Kostka (cube) to podstawowy element hurtowni Kostka jest wielowymiarowa (od 1 do N wymiarów) Kostka składa się z: faktów wektora wartości

Bardziej szczegółowo

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1) Hurtownie danych dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki Maciej Zakrzewicz (1) Plan wykładu Wprowadzenie do Business Intelligence (BI) Hurtownia danych Zasilanie hurtowni

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Plan wykładów Wprowadzenie - integracja

Bardziej szczegółowo

Hurtownie danych - przegląd technologii

Hurtownie danych - przegląd technologii Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Plan wykład adów Wprowadzenie - integracja

Bardziej szczegółowo

Co to jest Business Intelligence?

Co to jest Business Intelligence? Cykl: Cykl: Czwartki z Business Intelligence Sesja: Co Co to jest Business Intelligence? Bartłomiej Graczyk 2010-05-06 1 Prelegenci cyklu... mariusz@ssas.pl lukasz@ssas.pl grzegorz@ssas.pl bartek@ssas.pl

Bardziej szczegółowo

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów Przeznaczenie szkolenia Szkolenie dla osób chcących: Profesjonalnie przygotowywać dane do dalszej

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2008 Zagadnienia do omówienia 1. 2. Przegląd architektury HD 3. Warsztaty

Bardziej szczegółowo

Hurtownie danych w praktyce

Hurtownie danych w praktyce Hurtownie danych w praktyce Fakty i mity Dr inż. Maciej Kiewra Parę słów o mnie... 8 lat pracy zawodowej z hurtowniami danych Projekty realizowane w kraju i zagranicą Certyfikaty Microsoft z Business Intelligence

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

Systemy GIS Tworzenie zapytań w bazach danych

Systemy GIS Tworzenie zapytań w bazach danych Systemy GIS Tworzenie zapytań w bazach danych Wykład nr 6 Analizy danych w systemach GIS Jak pytać bazę danych, żeby otrzymać sensowną odpowiedź......czyli podstawy języka SQL INSERT, SELECT, DROP, UPDATE

Bardziej szczegółowo

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Usługi analityczne budowa kostki analitycznej Część pierwsza. Usługi analityczne budowa kostki analitycznej Część pierwsza. Wprowadzenie W wielu dziedzinach działalności człowieka analiza zebranych danych jest jednym z najważniejszych mechanizmów podejmowania decyzji.

Bardziej szczegółowo

Baza danych. Modele danych

Baza danych. Modele danych Rola baz danych Systemy informatyczne stosowane w obsłudze działalności gospodarczej pełnią funkcję polegającą na gromadzeniu i przetwarzaniu danych. Typowe operacje wykonywane na danych w systemach ewidencyjno-sprawozdawczych

Bardziej szczegółowo

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com Media Partners Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com Adrian Chodkowski Konsultant Business Intelligence w Jcommerce S.A Certyfikowany

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2012 Zagadnienia do omówienia 1. Miejsce i rola w firmie 2. Przegląd architektury

Bardziej szczegółowo

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych Plan wykładu Bazy Wykład 14: Hurtownie Bazy operacyjne i analityczne Architektura hurtowni Projektowanie hurtowni Małgorzata Krętowska, Agnieszka Oniśko Wydział Informatyki PB Bazy (studia dzienne) 2 Rodzaje

Bardziej szczegółowo

Informatyzacja przedsiębiorstw

Informatyzacja przedsiębiorstw Informatyzacja przedsiębiorstw Izabela Szczęch Politechnika Poznańska Plan wykładu Elementy Business Intelligence Model wielowymiarowy Modelowanie hurtowni danych podstawowe schematy logiczne Operacje

Bardziej szczegółowo

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa Budowa systemu wspomagającego podejmowanie decyzji Metodyka projektowo wdrożeniowa Agenda Systemy wspomagające decyzje Business Intelligence (BI) Rodzaje systemów BI Korzyści z wdrożeń BI Zagrożenia dla

Bardziej szczegółowo

Kostki OLAP i język MDX

Kostki OLAP i język MDX Kostki OLAP i język MDX 24 kwietnia 2015 r. Opis pliku z zadaniami Wszystkie zadania na zajęciach będą przekazywane w postaci plików PDF sformatowanych jak ten. Będą się na nie składały różne rodzaje zadań,

Bardziej szczegółowo

Systemy OLAP. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Systemy OLAP. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania Semestr zimowy 2005/06 Plan wykładu Ewolucja

Bardziej szczegółowo

Wprowadzenie do hurtowni danych

Wprowadzenie do hurtowni danych Wprowadzenie do hurtowni danych przygotował: Paweł Kasprowski Informacje ogólne ( pawel@kasprowski.pl ) Wykładowca: Paweł Kasprowski Temat: Wprowadzenie do hurtowni danych Umiejętności wymagane: Znajomość

Bardziej szczegółowo

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego.

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego. 77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego. Przy modelowaniu bazy danych możemy wyróżnić następujące typy połączeń relacyjnych: jeden do wielu, jeden do jednego, wiele

Bardziej szczegółowo

Schematy logiczne dla hurtowni danych

Schematy logiczne dla hurtowni danych Schematy logiczne dla hurtowni danych 26 Plan rozdziału 27 Model biznesowy, logiczny i fizyczny hurtowni danych Podstawowe pojęcia w modelu logicznym, logiczny model wielowymiarowy Implementacje ROLAP/MOLAP

Bardziej szczegółowo

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1) Hurtownie danych 1 Problematyka hurtowni danych Wykład przygotował: Robert Wrembel ZSBD wykład 12 (1) 1 Plan wykładu Problematyka integracji danych Integracja danych za pomocą hurtowni danych Przetwarzanie

Bardziej szczegółowo

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP WYKŁAD 12: OLAP Plan Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP Motywacja: Zaawansowane metody ekstrakcji danych i techniki przechowywania danych Rozwój wielu dziedzin zastosowań

Bardziej szczegółowo

DMX DMX DMX DMX: CREATE MINING STRUCTURE. Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski

DMX DMX DMX DMX: CREATE MINING STRUCTURE. Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski DMX DMX DMX Data Mining Extensions jest językiem do tworzenia i działania na modelach eksploracji danych w Microsoft SQL Server Analysis Services SSAS. Za pomocą DMX można tworzyć strukturę nowych modeli

Bardziej szczegółowo

Wstęp wprowadzający do laboratorium 2. mgr inż. Rafał Grycuk

Wstęp wprowadzający do laboratorium 2. mgr inż. Rafał Grycuk Wstęp wprowadzający do laboratorium 2 mgr inż. Rafał Grycuk Plan prezentacji 1. Czym jest T-SQL i czym się różni od standardu SQL 2. Typy zapytań 3. Zapytanie typu SELECT 4. Słowo o indeksach T-SQL (1)

Bardziej szczegółowo

www.comarch.pl/szkolenia Operacja PIVOT w języku SQL w środowisku Oracle 21.11.2012

www.comarch.pl/szkolenia Operacja PIVOT w języku SQL w środowisku Oracle 21.11.2012 Operacja PIVOT w języku SQL w środowisku Oracle 21.11.2012 Zakres Wprowadzenie Idea przestawiania danych Możliwe zastosowania Przestawianie danych bez klauzuli PIVOT Konstrukcja klauzuli Korzyści ze stosowania

Bardziej szczegółowo

Wykład XII. optymalizacja w relacyjnych bazach danych

Wykład XII. optymalizacja w relacyjnych bazach danych Optymalizacja wyznaczenie spośród dopuszczalnych rozwiązań danego problemu, rozwiązania najlepszego ze względu na przyjęte kryterium jakości ( np. koszt, zysk, niezawodność ) optymalizacja w relacyjnych

Bardziej szczegółowo

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu Podstawy baz danych PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

OnLine Analytical Processing (OLAP) Kostki OLAP i zapytania MDX

OnLine Analytical Processing (OLAP) Kostki OLAP i zapytania MDX OnLine Analytical Processing (OLAP) Kostki OLAP i zapytania MDX 24 kwietnia 2014 Opis pliku z zadaniami Wszystkie zadania na zajęciach będą przekazywane w postaci plików PDF sformatowanych jak ten. Będą

Bardziej szczegółowo

Oracle11g: Wprowadzenie do SQL

Oracle11g: Wprowadzenie do SQL Oracle11g: Wprowadzenie do SQL OPIS: Kurs ten oferuje uczestnikom wprowadzenie do technologii bazy Oracle11g, koncepcji bazy relacyjnej i efektywnego języka programowania o nazwie SQL. Kurs dostarczy twórcom

Bardziej szczegółowo

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL ORACLE System Zarządzania Bazą Danych Oracle Oracle Advanced SQL wersja 1.0 Politechnika Śląska 2008 Raportowanie z wykorzystaniem fraz rollup, cube Frazy cube, rollup, grouping sets umożliwiają rozszerzoną

Bardziej szczegółowo

1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4

1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4 1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4 2 Tabele przestawne, wykresy przestawne i formatowanie warunkowe 11 Co to

Bardziej szczegółowo

BAZY DANYCH LABORATORIUM. Studia niestacjonarne I stopnia

BAZY DANYCH LABORATORIUM. Studia niestacjonarne I stopnia BAZY DANYCH LABORATORIUM Studia niestacjonarne I stopnia Gdańsk, 2011 1. Cel zajęć Celem zajęć laboratoryjnych jest wyrobienie praktycznej umiejętności tworzenia modelu logicznego danych a nastepnie implementacji

Bardziej szczegółowo

Alicja Marszałek Różne rodzaje baz danych

Alicja Marszałek Różne rodzaje baz danych Alicja Marszałek Różne rodzaje baz danych Rodzaje baz danych Bazy danych można podzielić wg struktur organizacji danych, których używają. Można podzielić je na: Bazy proste Bazy złożone Bazy proste Bazy

Bardziej szczegółowo

Bazy danych. Plan wykładu. Diagramy ER. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych

Bazy danych. Plan wykładu. Diagramy ER. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych Plan wykładu Bazy danych Wykład 9: Przechodzenie od diagramów E/R do modelu relacyjnego. Definiowanie perspektyw. Diagramy E/R - powtórzenie Relacyjne bazy danych Od diagramów E/R do relacji SQL - perspektywy

Bardziej szczegółowo

Integracja i Eksploracja Danych

Integracja i Eksploracja Danych Integracja i Eksploracja Danych Laboratorium nr 4 Wprowadzenie do języka MDX. Zadania: 1) Analogicznie do przykładu zawartego na poprzednich zajęciach, korzystając z SQL Server Business Intelligence Development

Bardziej szczegółowo

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. http://zajecia.jakubw.pl/hur INTEGRACJA DANYCH ETL

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. http://zajecia.jakubw.pl/hur INTEGRACJA DANYCH ETL Hurtownie danych Ładowanie, integracja i aktualizacja danych. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur INTEGRACJA DANYCH Źródła danych ETL Centralna hurtownia danych Do hurtowni

Bardziej szczegółowo

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI Bazy danych Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI Wszechnica Poranna Trzy tematy: 1. Bazy danych - jak je ugryźć? 2. Język SQL podstawy zapytań. 3. Mechanizmy wewnętrzne baz danych czyli co

Bardziej szczegółowo

Bazy danych i usługi sieciowe

Bazy danych i usługi sieciowe Bazy danych i usługi sieciowe Wstęp do problematyki baz danych Paweł Daniluk Wydział Fizyki Jesień 2014 P. Daniluk (Wydział Fizyki) BDiUS w. I Jesień 2014 1 / 17 Plan wykładu 1 Bazy danych 1 Motywacja

Bardziej szczegółowo

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K. HURTOWNIE DANYCH Krzysztof Goczyła Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska kris@eti.pg.gda.pl # 1 Część I. Tworzenie hurtowni danych 1. Co to jest hurtownia danych? 2. Model

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d.

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d. TECHNOLOGIE BAZ DANYCH WYKŁAD 1 Wprowadzenie do baz danych. Normalizacja. (Wybrane materiały) Dr inż. E. Busłowska Definicja bazy danych Uporządkowany zbiór informacji, posiadający własną strukturę i wartość.

Bardziej szczegółowo

opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje nazwy tabel lub widoków warunek (wybieranie wierszy)

opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje nazwy tabel lub widoków warunek (wybieranie wierszy) Zapytania SQL. Polecenie SELECT jest używane do pobierania danych z bazy danych (z tabel lub widoków). Struktura polecenia SELECT SELECT FROM WHERE opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje

Bardziej szczegółowo

SQL Server. 2012 Analysis Services Model tabelaryczny BISM

SQL Server. 2012 Analysis Services Model tabelaryczny BISM Marco Russo Alberto Ferrari Chris Webb Microsoft SQL Server 2012 Analysis Services Model tabelaryczny BISM Przekład: Jakub Niedźwiedź, Witold Sikorski APN Promise, Warszawa 2012 Skrócony spis treści Przedmowa....

Bardziej szczegółowo

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania Przedmiot: Bazy danych Rok: III Semestr: V Rodzaj zajęć i liczba godzin: Studia stacjonarne Studia niestacjonarne Wykład 30 21 Ćwiczenia Laboratorium 30 21 Projekt Liczba punktów ECTS: 4 C1 C2 C3 Cel przedmiotu

Bardziej szczegółowo

Specjalizacja magisterska Bazy danych

Specjalizacja magisterska Bazy danych Specjalizacja magisterska Bazy danych Strona Katedry http://bd.pjwstk.edu.pl/katedra/ Prezentacja dostępna pod adresem: http://www.bd.pjwstk.edu.pl/bazydanych.pdf Wymagania wstępne Znajomość podstaw języka

Bardziej szczegółowo

- język zapytań służący do zapisywania wyrażeń relacji, modyfikacji relacji, tworzenia relacji

- język zapytań służący do zapisywania wyrażeń relacji, modyfikacji relacji, tworzenia relacji 6. Język SQL Język SQL (Structured Query Language): - język zapytań służący do zapisywania wyrażeń relacji, modyfikacji relacji, tworzenia relacji - stworzony w IBM w latach 70-tych DML (Data Manipulation

Bardziej szczegółowo

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego 1 85-240 Bydgoszcz www.softmaks.pl kontakt@softmaks.pl

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego 1 85-240 Bydgoszcz www.softmaks.pl kontakt@softmaks.pl Paweł Gołębiewski Softmaks.pl Sp. z o.o. ul. Kraszewskiego 1 85-240 Bydgoszcz www.softmaks.pl kontakt@softmaks.pl Droga na szczyt Narzędzie Business Intelligence. Czyli kiedy podjąć decyzję o wdrożeniu?

Bardziej szczegółowo

Plan prezentacji 0 Wprowadzenie 0 Zastosowania 0 Przykładowe metody 0 Zagadnienia poboczne 0 Przyszłość 0 Podsumowanie 7 Jak powstaje wiedza? Dane Informacje Wiedza Zrozumienie 8 Przykład Teleskop Hubble

Bardziej szczegółowo

Tabele przestawne jako narzędzie analizy biznesowej

Tabele przestawne jako narzędzie analizy biznesowej Firma szkoleniowa 2014 roku. TOP 3 w rankingu firm szkoleniowych zaprasza na szkolenie: Tabele przestawne jako narzędzie analizy biznesowej warsztaty komputerowe 24-25 września 2015 r. Warszawa Ekspert:

Bardziej szczegółowo

Relacyjne bazy danych. Podstawy SQL

Relacyjne bazy danych. Podstawy SQL Relacyjne bazy danych Podstawy SQL Język SQL SQL (Structured Query Language) język umożliwiający dostęp i przetwarzanie danych w bazie danych na poziomie obiektów modelu relacyjnego tj. tabel i perspektyw.

Bardziej szczegółowo

Bartłomiej Graczyk MCT,MCITP,MCTS

Bartłomiej Graczyk MCT,MCITP,MCTS Praktyczne wykorzystanie elementów raportowania (SSRS, Performance Point Service, Excel Services, Visio Services) w Microsoft Project 2010 Bartłomiej Graczyk 2012-11-05 Bartłomiej Graczyk MCT,MCITP,MCTS

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

SQL (ang. Structured Query Language)

SQL (ang. Structured Query Language) SQL (ang. Structured Query Language) SELECT pobranie danych z bazy, INSERT umieszczenie danych w bazie, UPDATE zmiana danych, DELETE usunięcie danych z bazy. Rozkaz INSERT Rozkaz insert dodaje nowe wiersze

Bardziej szczegółowo

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Wprowadzenie do technologii Business Intelligence i hurtowni danych Wprowadzenie do technologii Business Intelligence i hurtowni danych 1 Plan rozdziału 2 Wprowadzenie do Business Intelligence Hurtownie danych Produkty Oracle dla Business Intelligence Business Intelligence

Bardziej szczegółowo

Ewelina Dziura Krzysztof Maryański

Ewelina Dziura Krzysztof Maryański Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence Marcin Adamczak Jakub Gruszka MSP Business Intelligence Plan Prezentacji Definicja Podział Zastosowanie Wady i zalety Przykłady Historia W październiku 1958 Hans Peter Luhn pracownik działu badań w IBM

Bardziej szczegółowo

OPIS PRZEDMIOTU ZAMÓWIENIA

OPIS PRZEDMIOTU ZAMÓWIENIA Załącznik nr 1 OPIS PRZEDMIOTU ZAMÓWIENIA Licencja Microsoft Windows SQL Server Standard 2012 (nie OEM) lub w pełni równoważny oraz licencja umożliwiająca dostęp do Microsoft Windows SQL Server Standard

Bardziej szczegółowo

Analiza internetowa czyli Internet jako hurtownia danych

Analiza internetowa czyli Internet jako hurtownia danych Analiza internetowa czyli Internet jako hurtownia danych Agenda 1. Hurtownie danych, eksploracja danych i OLAP 3. Internet 5. Analiza Internetowa 7. Google Analytics 9. Podsumowanie Hurtownie danych (definicja)

Bardziej szczegółowo

DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna&

DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna& DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna& Artur Wroński" Priorytety rozwoju technologii Big Data& Analiza większych zbiorów danych, szybciej& Łatwość użycia& Wsparcie

Bardziej szczegółowo

Przestrzenne bazy danych Podstawy języka SQL

Przestrzenne bazy danych Podstawy języka SQL Przestrzenne bazy danych Podstawy języka SQL Stanisława Porzycka-Strzelczyk porzycka@agh.edu.pl home.agh.edu.pl/~porzycka Konsultacje: wtorek godzina 16-17, p. 350 A (budynek A0) 1 SQL Język SQL (ang.structured

Bardziej szczegółowo

2010-10-21 PLAN WYKŁADU BAZY DANYCH MODEL DANYCH. Relacyjny model danych Struktury danych Operacje Integralność danych Algebra relacyjna HISTORIA

2010-10-21 PLAN WYKŁADU BAZY DANYCH MODEL DANYCH. Relacyjny model danych Struktury danych Operacje Integralność danych Algebra relacyjna HISTORIA PLAN WYKŁADU Relacyjny model danych Struktury danych Operacje Integralność danych Algebra relacyjna BAZY DANYCH Wykład 2 dr inż. Agnieszka Bołtuć MODEL DANYCH Model danych jest zbiorem ogólnych zasad posługiwania

Bardziej szczegółowo

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS WARSZTATY Grupa warsztatowa nr 1 System bilingowy operator telekomunikacyjny od środka Uczestnikom warsztatów zostanie przedstawiona specyfika działalności operatora telekomunikacyjnego ze szczególnym

Bardziej szczegółowo

Oracle PL/SQL. Paweł Rajba. pawel@ii.uni.wroc.pl http://www.kursy24.eu/

Oracle PL/SQL. Paweł Rajba. pawel@ii.uni.wroc.pl http://www.kursy24.eu/ Paweł Rajba pawel@ii.uni.wroc.pl http://www.kursy24.eu/ Zawartość modułu 6 Wprowadzenie Definiowanie wyzwalaczy DML Metadane wyzwalaczy Inne zagadnienia, tabele mutujące Wyzwalacze INSTEAD OF Wyzwalacze

Bardziej szczegółowo

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Instalacja SQL Server Express. Logowanie na stronie Microsoftu Instalacja SQL Server Express Logowanie na stronie Microsoftu Wybór wersji do pobrania Pobieranie startuje, przechodzimy do strony z poradami. Wypakowujemy pobrany plik. Otwiera się okno instalacji. Wybieramy

Bardziej szczegółowo

LITERATURA. Wprowadzenie do systemów baz danych C.J.Date; WNT Warszawa 2000

LITERATURA. Wprowadzenie do systemów baz danych C.J.Date; WNT Warszawa 2000 LITERATURA Wprowadzenie do systemów baz danych C.J.Date; WNT Warszawa 2000 Systemy baz danych. Pełny wykład H. Garcia Molina, Jeffrey D. Ullman, Jennifer Widom;WNT Warszawa 2006 Wprowadzenie do systemów

Bardziej szczegółowo

INFORMATYKA Pytania ogólne na egzamin dyplomowy

INFORMATYKA Pytania ogólne na egzamin dyplomowy INFORMATYKA Pytania ogólne na egzamin dyplomowy 1. Wyjaśnić pojęcia problem, algorytm. 2. Podać definicję złożoności czasowej. 3. Podać definicję złożoności pamięciowej. 4. Typy danych w języku C. 5. Instrukcja

Bardziej szczegółowo

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: JAKIE PROBLEMY ROZWIĄZUJE BI 1 S t r o n a WSTĘP Niniejszy dokument to zbiór podstawowych problemów, z jakimi musi zmagać się przedsiębiorca, analityk,

Bardziej szczegółowo

Część I Rozpoczęcie pracy z usługami Reporting Services

Część I Rozpoczęcie pracy z usługami Reporting Services Spis treści Podziękowania... xi Wprowadzenie... xiii Część I Rozpoczęcie pracy z usługami Reporting Services 1 Wprowadzenie do usług Reporting Services... 3 Platforma raportowania... 3 Cykl życia raportu...

Bardziej szczegółowo

QlikView Business Intelligence, a system ERP SAP Użytkownicy systemów ERP firmy SAP przez wiele lat poszukiwali skutecznych i łatwych sposobów dotarcia do swych danych. Używali arkuszy kalkulacyjnych,

Bardziej szczegółowo

TP1 - TABELE PRZESTAWNE od A do Z

TP1 - TABELE PRZESTAWNE od A do Z TP1 - TABELE PRZESTAWNE od A do Z Program szkolenia 1. Tabele programu Excel 1.1. Wstawianie tabeli 1.2. Style tabeli 1.3. Właściwości tabeli 1.4. Narzędzia tabel 1.4.1. Usuń duplikaty 1.4.2. Konwertuj

Bardziej szczegółowo

Portale raportowe, a narzędzia raportowe typu self- service

Portale raportowe, a narzędzia raportowe typu self- service Portale raportowe, a narzędzia raportowe typu self- service Bartłomiej Graczyk Kierownik Projektów / Architekt rozwiązań Business Intelligence E mail: bartek@graczyk.info.pl Site: www.graczyk.info.pl Agenda

Bardziej szczegółowo

Bazy danych SQL Server 2005

Bazy danych SQL Server 2005 Bazy danych SQL Server 2005 TSQL Michał Kuciapski Typ zadania: Podstawowe zapytania Select Zadanie 1: Wyświetl następujące informacje z bazy: A. 1. Wyświetl informacje o klientach: nazwa firmy, imie, nazwisko,

Bardziej szczegółowo

Język SQL. instrukcja laboratoryjna. Politechnika Śląska Instytut Informatyki. laboratorium Bazy Danych

Język SQL. instrukcja laboratoryjna. Politechnika Śląska Instytut Informatyki. laboratorium Bazy Danych Politechnika Śląska Instytut Informatyki instrukcja laboratoryjna laboratorium Bazy Danych przygotowali: mgr inż. Paweł Kasprowski (Kasprowski@zti.iinf.polsl.gliwice.pl) mgr inż. Bożena Małysiak (bozena@ivp.iinf.polsl.gliwice.pl)

Bardziej szczegółowo

Podstawowe zagadnienia z zakresu baz danych

Podstawowe zagadnienia z zakresu baz danych Podstawowe zagadnienia z zakresu baz danych Jednym z najważniejszych współczesnych zastosowań komputerów we wszelkich dziedzinach życia jest gromadzenie, wyszukiwanie i udostępnianie informacji. Specjalizowane

Bardziej szczegółowo

Transformacja wiedzy w budowie i eksploatacji maszyn

Transformacja wiedzy w budowie i eksploatacji maszyn Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces

Bardziej szczegółowo

Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych

Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych Rodzaj zajęć: Wszechnica Popołudniowa Tytuł: Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych Autor: mgr inż.

Bardziej szczegółowo