Bazy danych. Seminarium II.

Podobne dokumenty
Bazy danych. Plan wykładu. Rozproszona baza danych. Fragmetaryzacja. Cechy bazy rozproszonej. Replikacje (zalety) Wykład 15: Rozproszone bazy danych

Pojęcie systemu baz danych

Rozproszone bazy danych. Robert A. Kłopotek Wydział Matematyczno-Przyrodniczy. Szkoła Nauk Ścisłych, UKSW

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d.

Architektury rozproszonych baz danych. Robert A. Kłopotek Wydział Matematyczno-Przyrodniczy. Szkoła Nauk Ścisłych, UKSW

Projektowanie Systemów Informacyjnych

Rozdział 1 Wprowadzenie do baz danych. (c) Instytut Informatyki Politechniki Poznańskiej 1

1 Wstęp do modelu relacyjnego

Systemy rozproszonych baz danych 1

Jerzy Nawrocki, Wprowadzenie do informatyki

Wstęp do relacyjnych baz danych. Jan Bartoszek

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko

Wykład II Encja, atrybuty, klucze Związki encji. Opracowano na podstawie: Podstawowy Wykład z Systemów Baz Danych, J.D.Ullman, J.

Bazy danych i usługi sieciowe

SZKOLENIE: Administrator baz danych. Cel szkolenia

Chemoinformatyczne bazy danych - Wprowadzenie do technologii baz danych. Andrzej Bąk

Bazy danych. Dr inż. Paweł Kasprowski

Bazy danych Wykład zerowy. P. F. Góra

Systemy rozproszone. na użytkownikach systemu rozproszonego wrażenie pojedynczego i zintegrowanego systemu.

Rozdział 17. Zarządzanie współbieżnością zadania dodatkowe

Technologie baz danych

PODSTAWOWE PODZIAŁY SIECI KOMPUTEROWYCH

Podstawowe informacje o bazach danych. Technologie Informacyjne

Co to jest Baza Danych

Bazy danych 2. Wykład 1

Ogólny plan przedmiotu. Strony WWW. Literatura BAZY DANYCH. Materiały do wykładu:

BAZY DANYCH. Anomalie. Rozkład relacji i normalizacja. Wady redundancji

Program wykładu. zastosowanie w aplikacjach i PL/SQL;

Relacyjne bazy danych

Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik

Hbase, Hive i BigSQL

RELACYJNE BAZY DANYCH I ICH ZNACZENIE W SYSTEMACH INFORMACJI GEOGRAFICZNEJ

Model relacyjny. Wykład II

Działanie komputera i sieci komputerowej.

Wykład 2. Relacyjny model danych

MASKI SIECIOWE W IPv4

Nazwa Wydziału Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia. Kod modułu Język kształcenia Efekty kształcenia dla modułu kształcenia

Bazy danych. Dr Henryk Telega. BD 10/11 Wykład 1 1

Semestr Wykład Ćwiczenie Laboratorium Projekt Seminarium Łącznie. V Forma zaliczenia Liczba punktów ECTS

Komunikacja z bazą danych psql

Bazy danych. Dr inż. Paweł Kasprowski

Wykład I. Administrowanie szkolną siecią komputerową. dr Artur Bartoszewski

Systemy rozproszone System rozproszony

współbieżność - zdolność do przetwarzania wielu zadań jednocześnie

SIECI KOMPUTEROWE. Podstawowe wiadomości

Relacyjny model baz danych, model związków encji, normalizacje

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

K1A_W11, K1A_W18. Egzamin. wykonanie ćwiczenia lab., sprawdzian po zakończeniu ćwiczeń, egzamin, K1A_W11, K1A_W18 KARTA PRZEDMIOTU

Modelowanie hierarchicznych struktur w relacyjnych bazach danych

Informatyka I. Programowanie aplikacji bazodanowych w języku Java. Standard JDBC.

Normalizacja relacyjnych baz danych. Sebastian Ernst

Bazy danych. Bazy danych. Zapytania SELECT. Dr inż. Paweł Kasprowski.

Politechnika Śląska, Instytut Informatyki

- 307 W Oracle instrukcja SELECT Ename FROM Emp WHERE Empno=4567: [ ] zakłada blokadę do odczytu dla jednego wiersza tabeli Emp [ ] zakłada blokadę

Systemy GIS Systemy baz danych

Systemy rozproszone. Wstęp. Krzysztof Banaś Systemy rozproszone 1

Technologia informacyjna

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego.

Akademia Techniczno-Humanistyczna w Bielsku-Białej

Wstęp. Historia i przykłady przetwarzania współbieżnego, równoległego i rozproszonego. Przetwarzanie współbieżne, równoległe i rozproszone

Model relacyjny. Wykład II

Baza danych. Modele danych

mail: strona: konsultacje: na stronie (po wcześniejszym umówieniu drogą mailową)

Bazy danych. Bazy danych. Podstawy języka SQL. Dr inż. Paweł Kasprowski.

FUNKCJE SZBD. ZSE - Systemy baz danych 1

Sprawdzenie poziomu izolacji transakcji (w aktualnym połączeniu):

Bazy danych 1. Podstawowe pojęcia

Podstawy sieci komputerowych. Technologia Informacyjna Lekcja 19

BAZY DANYCH. Wykład 1: Wprowadzenie do baz danych. Marcin Czajkowski. Przygotowanie wykładu: Małgorzata Krętowska

Wykład :45 BD-1 W_3

Spis treści. Przedmowa

1. Sieć komputerowa - grupa komputerów lub innych urządzeń połączonych ze sobą w celu wymiany danych lub współdzielenia różnych zasobów.

Wprowadzenie do multimedialnych baz danych. dr inż. Piotr Suchomski

koledzy, Jan, Nowak, ul. Niecała 8/23, , Wrocław, , ,

Dwa lub więcej komputerów połączonych ze sobą z określonymi zasadami komunikacji (protokołem komunikacyjnym).

Wykład 8. SQL praca z tabelami 5

IBM DCE/DFS. Mikołaj Gierulski. 17 stycznia 2003

Spis treści. 1 Wprowadzenie. 1.1 Podstawowe pojęcia. 1 Wprowadzenie Podstawowe pojęcia Sieci komunikacyjne... 3

22. Podstawowe pojęcia baz danych. Baza Danych. Funkcje bazy danych. Właściwości bazy danych. Modele baz danych.

INFORMATYKA GEODEZYJNO- KARTOGRAFICZNA Relacyjny model danych. Relacyjny model danych Struktury danych Operacje Oganiczenia integralnościowe

Administracja bazami danych

S y s t e m y. B a z D a n y c h

Pojęcie bazy danych. Funkcje i możliwości.

PLAN WYKŁADU BAZY DANYCH MODEL DANYCH. Relacyjny model danych Struktury danych Operacje Integralność danych Algebra relacyjna HISTORIA

T-SQL dla każdego / Alison Balter. Gliwice, cop Spis treści. O autorce 11. Dedykacja 12. Podziękowania 12. Wstęp 15

Podstawowe pojęcia dotyczące sieci komputerowych

5R]G]LDï %LEOLRJUDğD Skorowidz

Hurtownie danych. 31 stycznia 2017

Zagadnienia egzaminacyjne INFORMATYKA. Stacjonarne. I-go stopnia. (INT) Inżynieria internetowa STOPIEŃ STUDIÓW TYP STUDIÓW SPECJALNOŚĆ

Informatyka I. Standard JDBC Programowanie aplikacji bazodanowych w języku Java

PRZESTRZENNE BAZY DANYCH WYKŁAD 2

Zasady transformacji modelu DOZ do projektu tabel bazy danych

Krzysztof T. Psurek Politechnika Śląska Wydział Organizacji i Zarządzania

BAZY DANYCH model relacyjny. Opracował: dr inż. Piotr Suchomski

Systemy GIS Tworzenie zapytań w bazach danych

Przestrzenne bazy danych Podstawy języka SQL

Technologie informacyjne (5) Zdzisław Szyjewski

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X

Systemy Rozproszone. Zagadnienia do egzaminu.

Transkrypt:

Bazy danych. Seminarium II. M.Tamer Ozsu, Patrick Valduriez, Principles of Distributed Database Systems rozdziały 1-4

Plan 1. DDBS wprowadzenie. 2. Relacyjne BD przypomnienie. 3. Sieci komputerowe przypomnienie. 4. Architektura DDBMS.

DDBS DBMS - Database Management System DDBS Distributed Database System

DDBS - oczekiwania Przezroczystość, transparency Niezależność danych: odporność na zmianę organizacji danych Przezroczystość położenia Przezroczystość migracji Przezroczystość istnienia kopii Przezroczystość fragmentacji: podział relacji na zbiory pod-relacji Niezawodność, reliability: rozproszone transakcje Ulepszone wykonywanie operacji: szybciej Łatwiejsza rozbudowa systemu: bez ograniczeń

DDBS - wady Duży stopień skomplikowania systemu Duży koszt: np. potrzebny dodatkowy hardware Bezpieczeństwo

Budujemy DDBS... 1. Sposób przechowywania danych: partitioned / replicated. 2. Algorytmy do rozproszonych zapytań. 3. Mechanizmy zachowania spójności przy dostępie współbieżnym do bazy danych. 4. Zapobieganie zakleszczeniom. 5. Zapewnienie niezawodności. 7. Współpraca z systemem operacyjnym. Rozwiązania tych problemów są ze sobą powiązane!

Budujemy DDBS...

Relacyjne bazy danych Baza danych: zbiór danych o pewnej strukturze odzwierciedlający fragment rzeczywistości Relacyjna baza danych: strukturę da się przedstawić jako relacje Klucz: najmniejszy niepusty podzbiór atrybutów taki, że określają one jednoznacznia każdy wiersz w relacji

Normalizacje Normalizacja: zastąpienie pewnego zbioru relacji innym zbiorem relacji o prostszej i bardziej regularnej strukturze (proces odwracalny) Anomalie: redundancja, anomalie przy update, insert, delete Postacie normalne: 1NF, 2NF, 3NF, BCNF, 4NF, 5NF

Działania na relacjach Podstawowe: Selekcja: wybór pewnych wierszy. Projekcja: wybór pewnych kolumn. Suma Różnica Produkt kartezjański

Działania na relacjach Dodatkowe: Złączenie naturalne Złączenie ogólne Zmiana nazwy kolumny

Języki zapytań SELECT ename FROM emp, dept WHERE emp.deptno = dept.deptno AND loc = 'CHICAGO'; równoważnie

Relacyjne BD - warstwy

Sieci komputerowe Różne charakterystyki transmisji: Przepustowość łącza Tryb przesyłania: simplex, halfduplex, fullduplex Dane przesyłane zwykle w ramkach:

Klasyfikacja sieci komputerowych Topologie: gwiazda, pierścień, szyna, pełne, inne Sposób transmisji: point-to-point (unicast), multi-point (broadcast) Wielkość: WAN, MAN, LAN

Model warstwowy sieci

Architektura DDBMS-ów Lata 70. - powstaje architektura ANSI/SPARC. ANSI: American National Standards Institute SPARC: Standards Planning and Requirements Committee

Architektura ANSI/SPARC Jeden ze standardów organizowania i przechowywania danych. Trzy punkt widzenia: External view: punkt widzenia użytkownika, np. programisty bazy danych Conceptual view: punkt widzenia systemu bazy danych, abstrakcyjny opis kawałka rzeczywistości Internal view: punkt widzenia rozmieszczenia danych.

Architektura ANSI/SPARC

Conceptual level, przykład RELATON EMP [ KEY = {ENO} ATTRIBUTES = { ENO : CHARACTER(9) ENAME : CHARACTER(15) TITLE : CHARACTER(10) } ] RELATON PAY [ KEY = {TITLE} ATTRIBUTES = { TITLE : CHARACTER(10) SAL : NUMERIC(6) } ] RELATON PROJ [ KEY = {PNO} ATTRIBUTES = { PNO : CHARACTER(7) PNAME : CHARACTER(20) BUDGET : NUMERIC(7) } ]

Internal level, przykład INTERNAL_REL EMPL [ INDEX ON E# CALL EMINX FIELD = { HEADER : BYTE(1) E# : BYTE(9) E:NAME : BYTE(15) TIT : BYTE(10) } ]

External level, przykład CREATE VIEW PAYROLL (ENO, ENAME, SAL) AS SELECT EMP.ENO, EMP.ENAME, PAY.SAL FROM EMP, PAY WHERE EMP.TITLE = PAY.TITLE CREATE VIEW BUDGET (PNAME, BUD) AS SELECT PNAME, BUDGET FROM PROJ

Modele architektury dla DDBMS-ów Kryteria: Autonomiczność, autonomy Stopień rozproszenia, distribution Niejednorodność, heterogeneity

Autonomiczność Jest to stopień, w jakim lokalna baza danych może działać niezależnie od innych baz: im wyższa autonomiczność, tym większa redundancja (-> centralizowanie) im niższa autonomiczność, tym większa zawodność i mniejsza elastyczność

Autonomiczność Autonomiczność projektu: lokalny SZBD może używać takiego modelu danych jakiego chce i takiego zarządzania transakcjami jakiego chce. Autonomiczność komunikacji: lokalny SZBD może decydować jaki typ informacji będzie dostarczał do innych SZBD-ów. Autonomiczność wykonania: lokalny SZBD wykonuje kierowane do niego transakcji w sposób wygodny dla niego.

Autonomiczność Pół-autonomiczność, semiautonomy: system złożony z SZBD-ów działających niezależnie, ale zrzeszonych w federację (udostępniają innym SZBD swoje lokalne dane) Całkowita niezależność, total isolation: system składa się z izolowanych SZBD, żaden SZBD nie wie o istnieniu innych SZBD brak globalnej kontroli nad wykonywaniem zapytań

Sposób rozproszenia Fizyczne rozproszenie danych pomiędzy komputery w sieci: client/server: różne funkcje peer-to-peer: każdy lokalny SZBD ma taką samą funkcję jak inne

Niejednorodność Są to ukryte różnice pomiędzy różnymi SZBD: architektury węzłów, środki transmisji, protokoły komunikacyjne, różne modele danych (te same języki zapytań), różne języki zapytań (te same modele danych). Jednorodność, homogeneity

Architektura DDBMS A = autonomy (autonomiczność) D = distribution (rozproszenie) H = heterogeneity (niejednorodność) A0 silne związanie, A1 półautonomicznośc, A2 całkowita izolacja D0 bez rozproszenia, D1 client/server, D2 peer-to-peer H0 jednorodność, H1 niejednorodność Możemy rozważać systemy (Ax, Dy, Hz), np. (A0, D0, H0) wieloprocesory (współdzielone jest wszystko) (A2, D2, H1) 2 hosty z różnych podsieci

Architektura klient/serwer Zróżnicowanie funkcji. Serwer: zarządzanie większością procesów (realizowanie zapytań, optymalizacja, transakcje, operacje na danych fizycznych). Klient: tylko wysyłanie zapytań (nawet bez optymalizacji). Multiple-client, single-server, Multiple-client, multiple-server,

Architektura klient/serwer

Architektura peer-to-peer Fizyczna organizacja danych na każdej maszynie może być (i zwykle jest) inna => każdy lokalny SZBD musi mieć swój własny internal view /schema. LIS: Local Internal Schema LCS: Local Conceptual Schema GCS: Global Conceptual Schema ES: External Schema

Architektura peer-to-peer

Architektura DDBMS

Podsumowanie Przedstawione rozwiązania są modelowe. Autorzy twierdzą, że są one dobre do pokazania idei DDBMS-ów, ale nie zawsze da się je zaimplementować.