Wielowmiarowe baz danch
Wielowmiarowe baz danch Dziedzin zastosowań Multimedialne baz danch dane medialne przechowwane jako wielowmiarowe wektor danch Sstem geograficzne, sstem wspomagania projektowania (VLSI CAD, mechanical CAD), medczne baz danch dane w bazie danch mają charakterstkę przestrzenną droga działka Przetwarzanie OLAP analiza danch w przestrzeni wielowmiarowej bezrobotni miejsce zamieszkania Gniezno Leszno Poznań 211 124 259 120 291 165 450 523 612 2000 2001 2002 okres wższe średnie podstawowe wkształcenie Eksploracja danch wznaczanie grup danch charakterzującch się podobnmi cechami Klasczne baz danch wdajne wszukiwanie danch według kilku niezbt selektwnch atrbutów
Klas zaptań wielowmiarowch Zaptania punktowe odwołanie do dokładnch wartości w poszczególnch wmiarach; 1.D.H.G.K.J.A.C.B.F.I.E Zaptania o częściowm dopasowaniu wartości niektórch wmiarów są określone, a innch nie, np. wielowmiarowa analiza danch w magaznach danch;.d 1.H.G.K.J.A.C.B.F.I.E 1
Zaptania o zakres odwołania do zakresów wartości poszczególnch wmiarów; np. poszukiwanie zbioru figur geometrcznch znajdującch się w pewnm obszarze; 1 2.D.A.C.B.H.G.F.I.E 1 2.K.J Zaptania o najbliższego sąsiada szukanie obiektów w przestrzeni wielowmiarowej najbliższch danemu; np. szukanie obiektów geograficznch najbliższch danej lokalizacji;.x.h.k.d.g.j.a.c.b.f.i.e 1 2
Przestrzenne połączenie (ang. spatial join) łączenie obiektów z różnch zbiorów na podstawie wzajemnch odległości. Dla dwóch zbiorów obiektów przestrzennch A i B, funkcji odległości L i danej wartości odległości r operacja przestrzennego połączenia wznacza zbiór par {<a, b> a A i b B takich, że L(a,b) r}. Zaptania tpu gdzie ja jestem - poszukiwanie dla danego punktu figur, które go zawierają. A C X B
Operator danch przestrzennch Operator dla danch punktowch: >, <, =,!=, >=, <= Operator dla danch przestrzennch: droga działka droga? działka droga dochodzi do działki, droga przecina działkę,
Operator danch przestrzennch Każd obiekt przestrzenn o zawart w przestrzeni wielowmiarowej Ω ma zdefiniowane: wnętrze i(o) zbiór wszstkich punktów tworzącch wnętrze obiektu, granicę b(o) zbiór wszstkich punktów tworzącch krawędź obiektu, zewnętrze e(o) zbiór wszstkich punktów znajdującch się na zewnątrz obiektu. Dla każdego obiektu: i(o), b(o), e(o) parami są rozłączne i(o) b(o) e(o) = Ω Z definicji: dla punktów: i(o) = dla odcinków i łamanch granicami są wierzchołki będące ich końcami, a wnętrze stanowią wszstkie pozostałe ich punkt.
Definicja relacji przestrzennch Zależności międz wnętrzami, granicami i zewnętrzami danch przestrzennch definiują zachodzącą międz nimi relację przestrzenną. I(o 1 ) B(o 1 ) E(o 1 ) I(o 2 ) I(o 1 ) I(o 2 ) B(o 1 ) I(o 2 ) E(o 1 ) I(o 2 ) B(o 2 ) I(o 1 ) B(o 2 ) B(o 1 ) B(o 2 ) E(o 1 ) B(o 2 ) E(o 2 ) I(o 1 ) E(o 2 ) B(o 1 ) E(o 2 ) E(o 1 ) E(o 2 ) 0 0 1 0 0 1 1 1 1 disjoint 1 1 1 1 0 0 1 0 0 0 0 1 1 0 0 0 1 0 0 0 1 1 1 1 0 0 1 contains inside equal 0 0 1 1 1 1 1 0 0 1 1 1 0 1 1 0 1 1 1 1 0 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 meet covers coveredb overlap
Relacje przestrzenne międz wielokątem, a linią droga działka I(dr) B(dr) E(dr) I(dz) B(dz) E(dz) droga działka I(dr) B(dr) E(dr) I(dz) B(dz) E(dz)
Wielowmiarowe zaptania w SQL Dana jest baza danch punktów ulokowanch na płaszczźnie w wmiarach i. Znajdź punkt ulokowan najbliżej danego punktu o współrzędnch =100 i =100. select * from punkt p where not eists ( select * from punkt q where power(q.-100)+power(q.-100) < power(p.-100)+power(p.-100)) Dana jest baza danch prostokątów ulokowanch na płaszczźnie reprezentowanch przez współrzędne dwóch przeciwległch narożników (lg, lg, pd i pd). Znajdź wszstkie prostokąt zawierające dan punktu o współrzędnch =100 i =100. select * from prostokąt where lg >= 100 and pd <= 100 and lg >= 100 and pd <= 100 Dana jest baza danch sprzedaż opisanej wmiarami: czasu, lokalizacji i tpu asortmentu. Wznacz sumarczną sprzedaż artkułów spożwczch w roku 2006 w sklepie Biedronka. select sum(cena) from (sprzedaż natural join sklep) natural join towar where ear(data) = 2006 and sklep.nazwa = 'Biedronka' and towar.branża='spożwcza'
Ograniczenia klascznch struktur danch 1. Mała wdajność klascznch struktur danch: selektwne zaptanie o zakres w przestrzeni trójwmiarowej σ=0,001 w poszczególnch wmiarach jest mało selektwne σ=0,1. 10% 1% Przkład: 10% liczba wmiarów n=3 liczba rekordów r=1.000.000 liczba bloków b=100.000 selektwność atrbutów σ=0,1 wsokość indeksów h=4 średnie wpełnienie liści q=50 koszt = h+σ r/q+σ r = 4+2000+100000=102004 Jednowmiarowe indeks nie będą użwane przez optmalizator zaptań!!! (indeks bitmapowe)
2. Dla indeksów złożonch brak smetrii traktowania poszczególnch wmiarów. 3. Brak obsługi zaptań o relacje przestrzenne, np. znajdź najbliższego sąsiada. Szukaj najbliższch punktów w zadanch zakresach: zadan zakres może bć pust;.b.a.c.x punkt znalezion w danm zakresie może nie bć najbliżej położonm punktem. Δb<Δa.B Δb.G Δa.A
Wielowmiarowe struktur danch 1. Pliki haszowe Pliki kratowe Haszowanie podzielone 2. Struktur drzewiaste kd-drzewa wielowmiarowe drzewa binarne kdb-drzewa wielowmiarowe B-drzewa hb-drzewa modfikacja kdb-drzew Quad-drzewa R-drzewa