Chemoinformatyczne bazy danych - Wprowadzenie do technologii baz danych. Andrzej Bąk



Podobne dokumenty
SIECI KOMPUTEROWE I BAZY DANYCH

Bazy danych 1. Wykład 6 Metodologia projektowania baz danych. (projektowanie logiczne - Normalizacja)

Przypomnienie najważniejszych pojęć z baz danych. Co to jest baza danych?

Obliczenia arytmetyczne. Konkatenacja pól. Aliasy kolumn. Aliasy tabel. Co dalej? Rozdział 4. Korzystanie z funkcji. Zastosowanie funkcji

Baza danych. Baza danych jest to zbiór danych powi zanych mi dzy sob pewnymi zale no ciami.

Ogólny plan przedmiotu. Strony WWW. Literatura BAZY DANYCH. Materiały do wykładu:

Projektowanie systemów baz danych

PRZESTRZENNE BAZY DANYCH WYKŁAD 2

Bazy danych. Bazy danych. Podstawy języka SQL. Dr inż. Paweł Kasprowski.

Zakupy w supermarkecie

Program szkoleniowy Efektywni50+ Moduł III Standardy wymiany danych

Bazy danych. Dr inż. Paweł Kasprowski

Projektowanie bazy danych

System Zarządzania Relacyjną Bazą Danych (SZRBD) Microsoft Access 2010

3 Przygotowali: mgr inż. Barbara Łukawska, mgr inż. Maciej Lasota

Podstawowe informacje o bazach danych. Technologie Informacyjne

JĘZYK ROSYJSKI POZIOM ROZSZERZONY

Sieci komputerowe cel

Bazy danych. Andrzej Łachwa, UJ, /15

Projektowanie Systemów Inf.

Harmonogramowanie projektów Zarządzanie czasem

Plan wykładu. Rozmyte zapytania do Baz Danych. Wstęp. Wstęp informacja rozmyta. Logika rozmyta w Bazach Danych nieprecyzyjne wartości atrybutów

Aplikacje bazodanowe. Laboratorium 1. Dawid Poªap Aplikacje bazodanowe - laboratorium 1 Luty, 22, / 37

Baza danych. Modele danych

System zarządzania bazą danych (SZBD) Proces przechodzenia od świata rzeczywistego do jego informacyjnej reprezentacji w komputerze nazywać będziemy

BAZY DANYCH. Wykład 1: Wprowadzenie do baz danych. Marcin Czajkowski. Przygotowanie wykładu: Małgorzata Krętowska

Język SQL : przyjazny podręcznik / Larry Rockoff. Wyd. 2. Gliwice, cop Spis treści

Bazy danych II. Andrzej Grzybowski. Instytut Fizyki, Uniwersytet Śląski

WARUNKI TECHNICZNE ARCHIWIZACJI DOKUMENTÓW

Instrukcja Obsługi STRONA PODMIOTOWA BIP

BAZY DANYCH PLAN WYKŁADU LITERATURA BAZA DANYCH. 1. Bazy danych wprowadzenie 2. Relacyjne bazy danych 3. Projektowanie baz danych

Funkcje systemu zarządzania bazą danych.

Warunki Oferty PrOmOcyjnej usługi z ulgą

Wprowadzenie do BD Operacje na bazie i tabelach Co poza zapytaniami? Algebra relacji. Bazy Danych i Systemy informacyjne Wykład 2.

Program wykładu. zastosowanie w aplikacjach i PL/SQL;

Symfonia Produkcja Instrukcja instalacji. Wersja 2013

Katedra Informatyki i Automatyki Politechnika Rzeszowska. Administrowanie bazą danych Oracle za pomocą programu DBA Studio. I.

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Bazy danych. Wykład IV SQL - wprowadzenie. Copyrights by Arkadiusz Rzucidło 1

EGZAMIN MATURALNY 2013 J ZYK ROSYJSKI

Bazy danych i usługi sieciowe

Ładowanie i reorganizacja

NoSQL. Technologie zarządzania treścią. dr inż. Robert Perliński

System kontroli wersji SVN

22. Podstawowe pojęcia baz danych. Baza Danych. Funkcje bazy danych. Właściwości bazy danych. Modele baz danych.

Przestrzenne bazy danych Podstawy języka SQL

Zintegrowane Systemy Zarządzania Biblioteką SOWA1 i SOWA2 SKONTRUM

Zarządzanie Zasobami by CTI. Instrukcja

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

Wykład 8 Ochrona danych wprowadzenie Sterowanie dostępem do danych Sterowanie przepływem danych Ograniczanie możliwości wnioskowania Szyfrowanie

Systemy GIS Tworzenie zapytań w bazach danych

BAZY DANYCH model relacyjny. Opracował: dr inż. Piotr Suchomski

EGZAMIN MATURALNY 2013 J ZYK NIEMIECKI

Wdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x

System Informatyczny CELAB. Przygotowanie programu do pracy - Ewidencja Czasu Pracy

Podstawa programowa kształcenia ogólnego informatyki w gimnazjum

strukturalny język zapytań używany do tworzenia i modyfikowania baz danych oraz do umieszczania i pobierania danych z baz danych

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d.

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

INSTRUKCJA RUCHU I EKSPLOATACJI SIECI DYSTRYBUCYJNEJ

Normalizacja relacyjnych baz danych. Sebastian Ernst

BEZPIECZEŃSTWO INFORMACYJNE I CYBERNETYCZNE

KOMISJA WSPÓLNOT EUROPEJSKICH. Wniosek DECYZJA RADY

Podstawowe informacje o bazach danych. Technologie Informacyjne

Platforma do obsługi zdalnej edukacji

EGZAMIN MATURALNY 2013 J ZYK ANGIELSKI

Wyzwania bezpieczeństwa nowoczesnych platform nauczania zdalnego

P o d s t a w y j ę z y k a S Q L

Charakterystyka systemów plików

Utrzymanie aplikacji biznesowych SI PSZ

Pracownia internetowa w każdej szkole. Opiekun pracowni internetowej SBS 2003 PING

Zarząd Dróg Wojewódzkich. Wytyczne Techniczne. Zbigniew Tabor Kraków,

System do kontroli i analizy wydawanych posiłków

Bazy danych Wykład zerowy. P. F. Góra

ECDL Advanced Moduł AM3 Przetwarzanie tekstu Syllabus, wersja 2.0

2) Drugim Roku Programu rozumie się przez to okres od 1 stycznia 2017 roku do 31 grudnia 2017 roku.

Warszawa, dnia 16 kwietnia 2012 r. Poz. 403

Funkcjonalność systemów zarządzania bazami danych przestrzennych w kartografii internetowej (PosrtgreSQL/PostGIS) Krzysztof Kuśnierek

Ostatnia cena sprzeda y klienta 1.0 dodatek do Symfonia Faktura dla 1 firmy

1) TUnŻ WARTA S.A. i TUiR WARTA S.A. należą do tej samej grupy kapitałowej,

PRESTASHOP INTEGRATOR XL BY CTI INSTRUKCJA

Opis modułu analitycznego do śledzenia rotacji towaru oraz planowania dostaw dla programu WF-Mag dla Windows.

Bazy danych. Plan wykładu. Diagramy ER. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych

Podstawowe definicje

Sieci komputerowe. Definicja. Elementy

Bazy danych - wykład wstępny

EGZAMIN MATURALNY 2011 J ZYK ANGIELSKI

Laboratorium nr 4. Temat: SQL część II. Polecenia DML

Procedura weryfikacji badania czasu przebiegu 1 paczek pocztowych

Regulamin organizacji przetwarzania i ochrony danych osobowych w Powiatowym Centrum Kształcenia Zawodowego im. Komisji Edukacji Narodowej w Jaworze

POWIATOWY URZĄD PRACY

Wskazówki dotyczące przygotowania danych do wydruku suplementu

Podstawy języka SQL. standardy SQL formułowanie zapytań operacje na strukturach danych manipulowanie danymi. Bazy danych s.5-1

Relacyjne bazy danych

Krzysztof Kadowski. PL-E3579, PL-EA0312,

Uniwersytet Zielonogórski Instytut Sterowania i Systemów Informatycznych Bazy Danych - Projekt. Zasady przygotowania i oceny projektów

INFORMATYKA dla gimnazjum Opis założonych osiągnięć ucznia klasy trzeciej

SIECI KOMPUTEROWE I BAZY DANYCH

Transkrypt:

Chemoinformatyczne bazy danych - Wprowadzenie do technologii baz danych Andrzej Bąk

Wstęp Zarys Co to jest baza danych? Podstawy teorii baz danych Klasyfikacja baz danych Organizacja danych w relacyjnej bazie danych Podstawy języka SQL Etapy projektowania baz danych Strukturalne bazy danych

Wstęp Świat rzeczywisty opisany przez dane i związki między nimi można przedstawić w tabeli

Baza danych - Wprowadzenie Baza danych to uporządkowany zbiór informacji, który przechowywany jest w strukturach zgodnie z założonym modelem danych. Baza danych to połączenie wiedzy i technologii, które zintegrowane zostały w wyspecjalizowanym oprogramowaniu nazywanym systemem zarządzania bazami danych (DBMS ang. database management systems) lub potocznie systemem baz danych. DBMS system zarządzania oraz przechowywania danych wraz z metadanymi (danymi opisującymi dane).

Baza danych - Schemat Typowy system bazodanowy Architektura warstwowa Klient (użytkownik) System przechowywania oraz wymiary informacji Moduł zarządzania bazy danych Programowy moduł zarządzania operacjami bazy danych Programy dostępowe dla użytkowników bazy danych Serwer

Baza danych Podstawowe cele Zalety przechowywanie danych w ujednoliconym formacie zapobieganie replikacji danych redukcja lub eliminacja redundancji danych integralność i spójność danych wieloużytkownikowy dostęp do danych dostarczenie stałego, przyjaznego dla użytkownika dostępu do danych wygodne środowisko analiz danych

Baza danych - Typy hierarchiczne bazy danych, gdzie poszczególne informacje przypisane są systematycznie do określonego poziomu tworząc swoiste drzewo w układzie rodzic/dziecko/rodzeństwo Relacja 1 do n H Sposób organizacji danych B C D E F G I J A K L M N Przeszukiwanie hierarchicznej bazy danych to sekwencyjne odwiedzanie poszczególnych węzłów struktury począwszy od korzenia (rodzica nadrzędnego).

Baza danych - Typy Model sieciowy - określony węzeł połączony może być z wieloma innymi, tworząc rodzaj struktury rozproszonej B A C brak jednolitej struktury bazy danych - ułatwiony jest jednak dostęp do informacji D E F G B H I J K L M N D H IX J

Baza danych - Typy Model relacyjny relacyjne bazy danych, zaproponowane w 1970 roku prze E.F. Codda baza złożona jest zwykle z szeregu dwuwymiarowych tabeli (relacji) oraz związków pomiędzy nimi, które umożliwiają ich wzajemne łączenie (klucze). klucz główny tabeli (PK) - kolumna lub kolumny tabeli, które umożliwiają jednoznaczną identyfikację rekordu (wiersza) klucz obcym (FK) - kolumna lub kolumny tabeli, którym odpowiada klucz innej tabeli. Klucze obce służą do zachowania więzów integralności pomiędzy tabelami.

Baza danych - Tabela Nazewnictwo

Baza danych - Typy Inna klasyfikacja baz danych w głównej mierze oparta jest za rodzaju przechowywanej informacji chemicznej. baza literaturowa baza właściwości baza strukturalna bibliograficzna patentowa numeryczna metadane katologowa struktur reakcji

Relacyjna baza danych Założenia każda relacja (tabela) ma jednoznaczną nazwę każda kolumna ma jednoznaczną nazwę w ramach relacji wszystkie wartości w kolumnie muszą być tego samego typu porządek kolumn nie jest istotny porządek wierszy nie jest istotny każdy wiersz w relacji musi być różny pole relacji musi zawierać wartość atomową

Relacyjna baza danych Słownik dla opornych relacja tabela atrybut kolumna dziedzina atrybutu typ danych krotka wiersz tabeli schemat relacji nazwa tabeli z nazwami atrybutów schemat bazy danych zbiór schematów relacji

Relacyjna baza danych - Algebra Algebra relacji operatory + operacje rzutowanie wybranie zbioru atrybutów selekcja wybranie krotek spełniających dany warunek suma iloczyn różnica iloczyn kartezjański

Instalacja serwera MySQL To nic nie kosztuje! Google MySQL, Progress

Język SQL SQL Structured Query Language IBM 1970 rok Język zapytań służący do zapisywania wyrażeń relacji, modyfikacji relacji oraz tworzenia relacji DML (data manipulation language) pobieranie danych, dopisywanie, usuwanie, modyfikacja DDL (data definition language) tworzenie nowych relacji DCL (data control language) nadzór nad prawami dostępu użytkowników, hostów itd..

Język SQL - DML Struktura SELECT * FROM osoby WHERE Wykształcenie= SO ; SELECT atrybuty FROM relacja WHERE warunek;

Język SQL - DDL SELECT Pesel, Wykształcenie FROM osoby; CREATE TABLE IF NOT EXISTS ChemComp ( Id MEDIUMINT(8) UNSIGNED ZEROFILL AUTO_INCREMENT NOT NULL, CONSTRAINT IdPk1 PRIMARY KEY (Id) )ENGINE=InnoDB;

Język SQL - DCL CREATE USER abak @ localhost IDENTIFIED by PASSWORD( **** ); GRANT SELECT, INSERT, UPDATE, DELETE ON Ligand.* TO abak @ localhost IDENTIFIED BY PASSWORD( *** ); Tutorial on-line lub pdf

Projektowanie bazy danych Koncepcja projektu użytkownik serwer RDBMS

Projektowanie bazy danych Etapy projektowania Pobranie danych Analiza danych Poprawa błędów Implementacja SQL Normalizacja Schemat relacyjny m - 1 1-1 Określenie związków w danych 1 - n m - n 1 - n

Projektowanie bazy danych Schemat relacyjny Diagram encji relacji ER

Projektowanie bazy danych Normalizacja bazy danych UNF 6 NF Cel normalizacji: uniknięcie redundacji tj. powtarzania się pól z identycznymi wartościami w różnych tabelach wyeliminowanie niewygodnych relacji wieloznacznych unikanie anomalii przy aktualizacji: modyfikacji, wstawiania, usuwania unikanie niespójności danych

Projektowanie bazy danych Zależność funkcyjna Kiedy wartość atrybutu B może zostać określona na podstawie wartości atrybutów A 1,.,A n to mówimy, że B jest funkcjonalnie zależne od atrybutów A 1,,A n I zapisujemy jako: {A 1,,A n } B zależności trywialne A 1,.,A n A i i=1,,n

Projektowanie bazy danych Zależności funkcyjne - zasady podziału A 1,,A n B 1,,B n A 1,,A n B i i=1,,n łączenia A 1,,A n B i i=1,,n A 1,,A n B 1,,B n przechodniości A B i B C to oznacza że A C

Projektowanie bazy danych Klucze Zbiór atrybutów {A 1,,A n } tworzy KLUCZ relacji jeżeli: wszystkie atrybuty są zależne funkcyjnie od tych atrybutów żaden podzbiór nie ma tej własności Klucz podstawy PK atrybut lub atrybuty umożliwiające jednoznaczną identyfikację wiersz Klucz obcy FK definiuje połączenia pomiędzy tabelami Klucz kandydujący jeżeli istnieje więcej niż 1 klucz podstawowy

Projektowanie bazy danych Normalizacja 1 NF Każda relacja spełniająca założenia E.F Codda jest w 1NF brak powtarzających się krotek/attrybutów wartości atomowe R (K1,K2, A, B, C, D, E, A, B) R1 (K1,K2, A, B, C, D, E) Powtarzające się grupy są usuwane.

Projektowanie bazy danych Relacja jest w 2NF jeżeli: jest w 1NF Normalizacja 2NF każdy atrybut niekluczowy jest w PEŁNI (NIE W CZĘŚCI) funkcjonalnie zależny od CAŁEGO klucza głównego R1 (K1,K2, A, B, C, D, E) {K1,K2} A {K1,K2} B {K2} E Argument E jest wyrzucany ponieważ jest częściowo zależny od składowej K2 klucza głównego {K1,K2} R2 (K1,K2, A, B, C, D) R2 (K2, E) {K1,K2} C {K1,K2} D

Projektowanie bazy danych Normalizacja 3N Relacja jest w 3NF jeżeli: jest w 2NF nie występują zależności przechodnie (nietrywialne) R2 (K1,K2, A, B, C) Argument C jest wyrzucany ponieważ zależy NIE TYLKO od klucza głównego Rozwiązanie: dekompozycja do dwóch tabel z PK w każdej z nich R3 (K1,K2,A, B) R3 (B, C)

Projektowanie bazy danych Normalizacja 3,5 BCNF Wciąż mogą pojawiać się anomalie relacja zawiera więcej niż jeden klucz kandydujący klucze kandydujące dzielą wspólne pole R3 (K1,K2, A, B, D) Relacja jest w postaci Boyce Codd a (3.5 lub BCNF) jeżeli: jest w 3NF każdy atrybut musi być w PEŁNI funkcyjnie zależny do klucza lub kluczy kandydujących

Projektowanie bazy danych Normalizacja 3,5 BCNF Rozwiązanie: umieścić dwa klucze kandydujące w oddzielnych tabelach umieścić atrybuty względem zależności funkcyjnych w oddzielnych tabelach R3 (K1,K2, A, B, D) R3.5 (K1,K2, B) R3.5 (K2, A, D)

Projektowanie bazy danych Normalizacja 3,5 BCNF Nieustanna dyskusja akademicka Teoria Rzeczywistość Równowaga

Projektowanie bazy danych Znormalizowana baza Ligand

Strukturalne bazy danych http://zinc.docking.org

Strukturalne bazy danych http://cdb.ics.uci.edu/

Strukturalne bazy danych http://www.rcsb.org/pdb/home/hom e.do

Dziękuję za uwagę