(duzo, przeczytac raz i zrozumiec powinno wystarczyc. To jest proste.)



Podobne dokumenty
Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki

Indeksy. Indeks typu B drzewo

"Kilka słów" o strojeniu poleceń SQL w kontekście Hurtowni Danych wprowadzenie. Krzysztof Jankiewicz

Hurtownie danych - przegląd technologii

Zarządzanie sieciami telekomunikacyjnymi

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Hurtownie danych - przegląd technologii

Rozpoznawanie twarzy metodą PCA Michał Bereta 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów

Jakub Pilecki Szymon Wojciechowski

Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis

Systemy OLAP II. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

< K (2) = ( Adams, John ), P (2) = adres bloku 2 > < K (1) = ( Aaron, Ed ), P (1) = adres bloku 1 >

Indeksy w hurtowniach danych

Bazy danych - BD. Indeksy. Wykład przygotował: Robert Wrembel. BD wykład 7 (1)

Logika rozmyta typu 2

Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego.

Wykaz linii kolejowych, które są wyposażone w urządzenia systemu ETCS

Wykaz linii kolejowych, które są wyposażone w urzadzenia systemu ETCS

Stargard Szczecinski i okolice (Polish Edition)

Optymalizacja poleceń SQL Metody dostępu do danych

Hard-Margin Support Vector Machines

Helena Boguta, klasa 8W, rok szkolny 2018/2019

Tychy, plan miasta: Skala 1: (Polish Edition)

OpenPoland.net API Documentation

Systemowe aspekty baz

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Podstawa prawna: Art. 70 pkt 1 Ustawy o ofercie - nabycie lub zbycie znacznego pakietu akcji

Instrukcja konfiguracji usługi Wirtualnej Sieci Prywatnej w systemie Mac OSX

Revenue Maximization. Sept. 25, 2018

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Indeksowanie w bazach danych

Modele danych - wykład V

Raport bieżący: 44/2018 Data: g. 21:03 Skrócona nazwa emitenta: SERINUS ENERGY plc

ARNOLD. EDUKACJA KULTURYSTY (POLSKA WERSJA JEZYKOWA) BY DOUGLAS KENT HALL

SubVersion. Piotr Mikulski. SubVersion. P. Mikulski. Co to jest subversion? Zalety SubVersion. Wady SubVersion. Inne różnice SubVersion i CVS

UPDATE Studenci SET Rok = Rok + 1 WHERE Rodzaj_studiow =' INŻ_ST'; UPDATE Studenci SET Rok = Rok 1 WHERE Nr_albumu IN ( '111345','100678');

Weronika Mysliwiec, klasa 8W, rok szkolny 2018/2019

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science

How to share data from SQL database table to the OPC Server? Jak udostępnić dane z tabeli bazy SQL do serwera OPC? samouczek ANT.

Indeksy. Rozdział 18. Indeksy. Struktura indeksu. Adres rekordu

Systemowe aspekty baz danych

MaPlan Sp. z O.O. Click here if your download doesn"t start automatically

INDEKSY. Biologiczne Aplikacje Baz Danych. dr inż. Anna Leśniewska

Optymalizacja poleceń SQL Indeksy

Plan wykładu. Klucz wyszukiwania. Pojęcie indeksu BAZY DANYCH. Pojęcie indeksu - rodzaje indeksów Metody implementacji indeksów.


kdpw_stream Struktura komunikatu: Status komunikatu z danymi uzupełniającymi na potrzeby ARM (auth.ste ) Data utworzenia: r.

Wprowadzenie do hurtowni danych

deep learning for NLP (5 lectures)

Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2

OSI Network Layer. Network Fundamentals Chapter 5. Version Cisco Systems, Inc. All rights reserved. Cisco Public 1

SNP SNP Business Partner Data Checker. Prezentacja produktu

Extraclass. Football Men. Season 2009/10 - Autumn round

ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS.

SSW1.1, HFW Fry #20, Zeno #25 Benchmark: Qtr.1. Fry #65, Zeno #67. like

Modelowanie wymiarów

Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering

Struktury proponowane dla unikalnych rozwiązań architektonicznych.

ITIL 4 Certification

MAGNESY KATALOG d e s i g n p r o d u c e d e l i v e r

Zestawienie czasów angielskich

Kostki OLAP i język MDX

Installation of EuroCert software for qualified electronic signature

SHP / SHP-T Standard and Basic PLUS

Tadeusz Pankowski

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1

wykład Organizacja plików Opracował: dr inż. Janusz DUDCZYK

Optymalizacja poleceń SQL

Życie za granicą Studia

Sargent Opens Sonairte Farmers' Market

Język SQL. Rozdział 10. Perspektywy Stosowanie perspektyw, tworzenie perspektyw prostych i złożonych, perspektywy modyfikowalne i niemodyfikowalne.

Miedzy legenda a historia: Szlakiem piastowskim z Poznania do Gniezna (Biblioteka Kroniki Wielkopolski) (Polish Edition)

OSI Network Layer. Network Fundamentals Chapter 5. ITE PC v4.0 Chapter Cisco Systems, Inc. All rights reserved.

STAŁE TRASY LOTNICTWA WOJSKOWEGO (MRT) MILITARY ROUTES (MRT)

Country fact sheet. Noise in Europe overview of policy-related data. Poland

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Strona główna > Produkty > Systemy regulacji > System regulacji EASYLAB - LABCONTROL > Program konfiguracyjny > Typ EasyConnect.


THE ADMISSION APPLICATION TO PRIVATE PRIMARY SCHOOL. PART I. Personal information about a child and his/her parents (guardians) Child s name...

& portable system. Keep the frame, change the graphics, change position. Create a new stand!

Blow-Up: Photographs in the Time of Tumult; Black and White Photography Festival Zakopane Warszawa 2002 / Powiekszenie: Fotografie w czasach zgielku

Angielski bezpłatne ćwiczenia - gramatyka i słownictwo. Ćwiczenie 4

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction

WYŁĄCZNIK CZASOWY OUTDOOR TIMER

SNP Business Partner Data Checker. Prezentacja produktu


Uchwały podjęte przez Nadzwyczajne WZA w dniu 28 października 2014 roku

Marzec: food, advertising, shopping and services, verb patterns, adjectives and prepositions, complaints - writing

Indeksy. Wprowadzenie. Indeksy jednopoziomowe indeks podstawowy indeks zgrupowany indeks wtórny. Indeksy wielopoziomowe

Standardized Test Practice

Procedury wyzwalane. (c) Instytut Informatyki Politechniki Poznańskiej 1

POLITYKA PRYWATNOŚCI / PRIVACY POLICY

17-18 września 2016 Spółka Limited w UK. Jako Wehikuł Inwestycyjny. Marek Niedźwiedź. InvestCamp 2016 PL

strukturalny język zapytań używany do tworzenia i modyfikowania baz danych oraz do umieszczania i pobierania danych z baz danych

DO MONTAŻU POTRZEBNE SĄ DWIE OSOBY! INSTALLATION REQUIRES TWO PEOPLE!

HAPPY ANIMALS L01 HAPPY ANIMALS L03 HAPPY ANIMALS L05 HAPPY ANIMALS L07

Transkrypt:

39. Typy indeksowania w hurtowniach danych. (duzo, przeczytac raz i zrozumiec powinno wystarczyc. To jest proste.) Po co inne niŝ B-Tree? Bo B-Tree w hurtowniach danych jest zbyt mało efektywny. Oprócz materializowanych perspektyw i przepisywania zapytań, do optymalizacji zapytań analitycznych stosuje się róŝnego rodzaju specjalizowane struktury indeksowe. Najczęściej stosowanymi w praktyce są: indeksy połączeniowe, indeksy bitmapowe i bitmapowe indeksy połączeniowe.

Indeks połączeniowy (ang. join index) łączy z sobą rekordy z róŝnych tabel posiadające tę samą wartość atrybutu połączeniowego, jest więc strukturą zawierającą zmaterializowane połączenie wielu tabel. Indeks taki posiada strukturę B drzewa zbudowanego na atrybucie połączeniowym tabeli (bądź na wielu takich atrybutach). Liście indeksu zawierają wspólne wartości atrybutu połączeniowego tabel wraz z listami adresów rekordów w kaŝdej z łączonych tabel. Slajd przedstawia strukturę indeksu połączeniowego zdefiniowanego na atrybucie sklep_id tabeli Sklepy. W tym przypadku, liście indeksu zawierają: - wskaźniki do rekordów opisujących kaŝdy ze sklepów - adresy wszystkich rekordów z tabeli SprzedaŜ opisujących sprzedaŝ danego sklepu. W przykładzie liść z wartością indeksowanego atrybutu sklep_id równą 1010 zawiera wskaźnik do rekordu w tabeli Sklepy opisującego sklep o tym numerze i listę wskaźników do rekordów tabeli SprzedaŜ opisujących sprzedaŝ w sklepie o numerze 1010. Ten przykładowy indeks przyspiesza wyszukiwanie danych na temat sprzedaŝy wskazanego sklepu.

Ideą indeksu bitmapowego (ang. bitmap index) jest wykorzystanie pojedynczych bitów do zapamiętania informacji o tym, Ŝe dana wartość atrybutu występuje w określonym rekordzie tabeli. Dla kaŝdej unikalnej wartości atrybutu jest przechowywana tablica bitów, zwana mapą bitową. KaŜdy bit mapy odpowiada jednemu rekordowy w tabeli R bit pierwszy odpowiada pierwszemu rekordowi w tabeli R, bit drugi drugiemu rekordowi itp. Dla mapy A = zielony bit n przyjmuje wartość jeden, jeśli wartością atrybutu A rekordu o numerze n jest zielony. W przeciwnym przypadku bit n przyjmuje wartość zero.

Liczba bitów mapy bitowej odpowiada liczbie rekordów tabeli R. Indeks bitmapowy jest zbiorem map bitowych dla wszystkich unikalnych wartości danego atrybutu. Indeks tego typu (w zaleŝności od implementacji) moŝe równieŝ posiadać strukturę B drzewa, w którego liściach zamiast adresów rekordów są przechowywane mapy bitowe.

Przykład indeksu bitmapowego dla atrybutu typ przedstawiono na slajdzie. PoniewaŜ atrybut typ moŝe przyjąć jedną z czterech wartości, tj. 'coupe', 'limuzyna', 'sedan', 'sport', więc indeks bitmapowy składa się z czterech map - po jednej mapie dla kaŝdej wartości. Przykładowo, pierwszy bit mapy bitowej opisującej samochody 'coupe' przyjmuje wartość 0. Oznacza to, Ŝe wartością atrybutu typ pierwszego rekordu nie jest 'coupe'. Drugi bit tej mapy przyjmuje wartość 1, co oznacza, Ŝe wartością atrybutu typ drugiego rekordu jest 'coupe'.

Bitmapowy indeks połączeniowy (ang. bitmap join index) łączy w sobie koncepcję indeksu połączeniowego i bitmapowego. Na slajdzie przedstawiono przykład koncepcji bitmapowego indeksu połączeniowego zdefiniowanego na atrybucie kategoria tabeli Produkty. PoniewaŜ atrybut ten przyjmuje dwie róŝne wartości (kosmetyki, alkohole), więc indeks będzie się składał z dwóch map bitowych. KaŜda z map będzie opisywała rekordy z tabeli SprzedaŜ. Mapa o nazwie 'kosmetyki' będzie opisywała sprzedaŝ kosmetyków, a mapa 'alkohole' - sprzedaŝ alkoholi. Pierwszy bit mapy 'kosmetyki' przyjmuje wartość 1, co oznacza, Ŝe pierwszy rekord w tabeli SprzedaŜ dotyczy kosmetyku. Drugi bit tej mapy przyjmuje równieŝ wartość 1, co równieŝ oznacza, Ŝe drugi rekord tabeli SprzedaŜ dotyczy kosmetyku. Podobnie jest w przypadku bitu 3 i 6 mapy 'kosmetyki'. Implementacyjnie, bitmapowy indeks połączeniowy posiada strukturę B-drzewa, w którego liściach znajdują się mapy bitowe opisujące łączone rekordy.

40. Reguły Codda dotyczące OLAP. Multidimensional conceptual view. OLAP operates with CUBEs of data that represent multidimensional construct of data. Event though the name implies three dimensional data, the number of possible dimensions is practically unlimited. Transparency. OLAP systems should be part of an open system that supports heterogeneous data sources. Accessibility. The OLAP should present the user with a single logical schema of the data. Consistent reporting performance. Performance should not degrade as the number of dimensions in the model increases. Client/server architecture. Should be based on open, modular systems. Generic dimensionality. Not limited to 3-D and not biased toward any particular dimension. A function applied to one dimension should also be able to be applied to another. Dynamic sparse-matrix handling. Related both to the idea of nulls in relational databases and to the notion of compressing large files, a sparse matrix is one in which not every cell contains data. OLAP systems should accommodate varying storage and data-handling options. Multiuser support. OLAP systems should support more than one user at the time. Unrestricted cross-dimensional operations. Similar to rule of generic dimensionality; all dimensions are created equal, and operations across data dimensions should not restrict relationships between cells. Intuitive data manipulation. Ideally, users shouldn't have to use menus or perform complex multiple-step operations when an intuitive drag-and-drop action will do. Flexible reporting. Save a tree. Users should be able to print just what they need, and any changes to the underlying financial model should be automatically reflected in reports. Unlimited dimensional and aggregation levels. The OLAP cube can be built with unlimited dimensions, and aggregation of the contained data also does not have practical limits.