Język T-SQL część III programowanie bazy danych
Plan wykładu Procedury składowane Funkcje składowane Wyzwalacze
Programowanie bazy danych Zajmiemy się programami używającymi baz danych. Mogą one znajdować się w dwóch miejscach: na serwerze bazy danych jako procedury składowane i funkcje użytkownika; Po stronie klienta bazy danych lub na serwerze aplikacji (np. serwer WWW), obsługującym wielu klientów równocześnie.
Programowanie serwera bazodanowego
T-SQL Transact-SQL (T-SQL), jest rozszerzeniem języka SQL umożliwiającym tworzenie konstrukcji takich jak pętle, instrukcje warunkowe czy zmienne, a ponadto pisanie procedur i funkcji Instrukcje: BEGIN...END RETURN BREAK TRY...CATCH CONTINUE WAITFOR GOTO label WHILE IF...ELSE
Zmienne Zmienna posiada nazwę rozpoczynającą się od znaku @ oraz typ Zmienne mają typy proste albo tablicowe Przykłady: DECLARE @x VARCHAR(100); SET @x = 'Hello world!'; PRINT @x; DECLARE @rok INT; SELECT @rok = YEAR(zatrudniony) FROM Pracownicy WHERE id = 3; DECLARE @Adiunkci TABLE ( nazwisko VARCHAR(50), staz INT, zarobki MONEY ); INSERT INTO @Adiunkci SELECT nazwisko, DATEDIFF(YEAR, zatrudniony, GETDATE()), placa + ISNULL(dod_funkc, 0) FROM Pracownicy WHERE stanowisko = 'adiunkt'; SELECT * FROM @Adiunkci;
T-SQL Dla wykonywania obliczeń, których nie można wyrazić za pomocą pojedynczego wyrażenia w języku Transact-SQL (T-SQL), stosuje się: systemowe procedury pamiętane (system stored procedures), paczki (wsady) (batches) i skrypty (scripts), funkcje (functions), procedury pamiętane (składowane) (stored procedures), procedury wyzwalane (trigery) (triggers), kursory (cursors).
Paczki i skrypty Paczka stanowi grupę złożoną z jednej lub z wielu wyrażeń Transact-SQLa. Standardowym końcem paczki jest polecenie GO lub koniec pliku. Paczkę może też stanowić grupa podświetlonych czy zaznaczonych wyrażeń SQL Server kompiluje paczkę w pojedynczą jednostkę wykonywalną zwaną planem wykonania (execution plan). Wyrażenia tworzące plan wykonania wykonywane są jednorazowo w jednym czasie. W przypadku wystąpienia błędu kompilacji, żadne z wyrażeń w paczce nie zostanie wykonane. Zmienna zdefiniowana w paczce nie jest dostępna poza nią zmienne są lokalne w paczce. Nie wszystkie wyrażenia mogą występować jednocześnie w jednej paczce (np. definiowanie i wywoływanie procedury).
Skrypt przykład Przykład skryptu złożonego z dwóch paczek: USE sklep GO DECLARE @promocja int SET @promocja = 10 UPDATE towary SET cena = cena - cena * (@promocja / 100) WHERE nazwa = 'orzeszki'; GO
Procedury składowane Procedury składowane (stored procedures) są zbiorami instrukcji języka SQL zapisanymi pod wspólną nazwą i wywoływanymi jak pojedyncza instrukcja. Procedury umożliwiają: przekazywanie parametrów wywołania, wykonywanie prawie wszystkich instrukcji języka SQL, w tym wywoływania innych procedur składowanych, zwracanie dowolnej liczby wyników do programu, który wywołał procedurę, zwracanie informacji o udanej lub niewykonanej procedurze.
Procedury składowane Procedury składowane są powszechnie wykorzystywane w celu: Implementacji reguł logiki biznesowej; Zabezpieczenia obiektów bazy danych przed bezpośrednim dostępem użytkowników; Obrony przed SQL injection; Poprawy wydajności często wykonywanych instrukcji; Zminimalizowania obciążenia sieci (zamiast wysyłać całe instrukcje języka T-SQL użytkownik wywołuje jedynie procedurę, wysyłając jej nazwę i przekazując parametry jej wywołania).
Procedury składowane CRUD Typowe wykorzystanie procedur do implementacji funkcjonalności CRUD (Create, Read, Update, Delete) Warstwa składowania danych Execute procedure CRUD Warstwa dostępu do danych Warstwa logiki biznesowej Warstwa prezentacji Tabele Widoki Funkcje Procedury Wyzwalacze
Procedury składowane Składnia CREATE { PROC PROCEDURE } [ schema_name. ] procedure_name [ ; number ] ( [ { @parameter [ type_schema_name ] [ OUT OUTPUT ] [READONLY] ] [,...n] [ WITH <procedure_option> [,...n ] ] [ FOR REPLICATION ] AS { [ BEGIN ] sql_statement [;] [...n ] [ END ] } [;] <procedure_option> ::= [ ENCRYPTION ] [ RECOMPILE ] [ EXECUTE AS Clause ]
Procedury składowane Uproszczona składnia: CREATE PROCEDURE Nazwa_procedury ( @zm_wejsciowa1 typ,..., @zm_wyjsciowa typ OUTPUT ) AS DECLARE @zm_pom BEGIN ciało procedury END; typ
Procedury składowane - przykład CREATE PROCEDURE Projekty_Insert UTWORZENIE PROCEDURY ( @nazwa varchar(20), @datarozp date = null, @datazakoncz date = null, Parametry wejściowe @kierownik varchar(10), @stawka money = 100, @ProjId int output Parametr wyjściowy ) AS BEGIN INSERT INTO Projekty (nazwa, datarozp, datazakonczplan, kierownik, stawka) VALUES (@nazwa, isnull(@datarozp, getdate()), isnull(@datarozp, dateadd(yy, 1, GETDATE())), @kierownik, @stawka) END SET @ProjId = SCOPE_IDENTITY() declare @status int WYWOŁANIE PROCEDURY status zwracany przez procedurę declare @id int EXEC @status = Projekty_Insert 'nowy', default, default, 2, 150, @id output print 'status = ' + cast (@status as char(10)) print 'proj id = ' + cast (@id as char(4))
Obsługa błędów Funkcja RAISERROR() generuje komunikat o błędzie i rozpoczyna przetwarzanie błędu w sesji; np. RAISERROR('Komunikat o bledzie', 16, 1); Do przechwytywania błędów użyjemy konstrukcji: TRY... CATCH ERROR_NUMBER() zwraca numer błędu, ERROR_SEVERITY() zwraca istotność błędu, ERROR_STATE() zwraca numer stanu błędu, ERROR_PROCEDURE() zwraca nazwę procedury składowanej lub wyzwalacza, w którym wystąpił błąd, ERROR_LINE() zwraca numer linii wewnątrz procedury, która spowodowała błąd, ERROR_MESSAGE() zwraca kompletny tekst komunikatu o błędzie; tekst zawiera podane wartości dla dowolnych parametrów zastępowalnych, takich jak długości, nazwy obiektów lub czasy.
Procedury składowane przykład c.d. ALTER PROCEDURE Projekty_Insert ( @nazwa varchar(20), @datarozp date = null, @datazakoncz date = null, @kierownik varchar(10), @stawka money = 100, @ProjId int output ) AS BEGIN BEGIN TRY MODYFIKACJA PROCEDURY Dodanie obsługi wyjątków TRY CATCH INSERT INTO Projekty (nazwa, datarozp, datazakonczplan, kierownik, stawka) VALUES (@nazwa, isnull(@datarozp, getdate()), isnull(@datarozp, dateadd(yy, 1, GETDATE())), @kierownik, @stawka) SET @ProjId = SCOPE_IDENTITY() END TRY BEGIN CATCH SELECT ERROR_NUMBER() AS ErrorNumber, ERROR_MESSAGE() AS ErrorMessage; END CATCH END
Procedury składowane Usunięcie procedury DROP PROCEDURE Nazwa_procedury
Procedury składowane - wykonanie Tworzenie: sprawdzenie poprawności syntaktycznej nowo utworzonej procedury treść zostaje zapisana w tabeli systemowej syscomments, a jej nazwa w tabeli sysobjects select c.text from sysobjects o, syscomments c where o.id = c.id and o.name = 'Dochod' Pierwsze wykonanie Sprawdzenie poprawności semantycznej Optymalizacja planu wykonania procedury Kompilacja wybranego planu wykonania
Funkcje składowane (UDF) UDF User Defined Functions Zakres możliwości funkcji w SQL jest szeroki (zapytania, procedury składowane, wartości domyślne, ograniczenia sprawdzające etc..). Używane są do przetwarzania danych, celem uproszczenia zapisu zapytania. Są opakowaniem logiki aplikacyjnej w wygodny obiekt i przeniesienie jej na serwer bazodanowy. Raz utworzone, mogą być stosowane w wielu miejscach.
Funkcje składowane (UDF) Rodzaje funkcji: funkcje skalarne (scalar user-defined functions) zwracaną wartością jest pojedyncza liczba lub tekst, tj. wartość dowolnego typu z wyjątkiem typów: text, ntext i image; proste funkcje tablicowe (inline table-valued functions) zwracają wartość typu TABLE, przy czym zwracana tabela jest określona za pomocą pojedynczego wyrażenia SELECT (funkcje te nazywane są sparametryzowanymi widokami); złożone funkcje tablicowe (multi-statement tablevalued functions) zwracają zmienną typu TABLE, przy czym zwracana tabela jest dowolną tabelą utworzoną w ciele funkcji.
Funkcje skalarne - przykład CREATE FUNCTION ZarobkiRoczne ( @placa money) RETURNS money as begin return @placa*12 end UTWORZENIE FUNKCJI print dbo.zarobkiroczne(2000) WYWOŁANIE FUNKCJI select nazwisko, placa, dbo.zarobkiroczne(placa) as rocznie from Pracownicy select nazwisko from Pracownicy where dbo.zarobkiroczne(placa) > 30000
Proste funkcje tablicowe Tzw. widoki sparametryzowane Zawiera tylko blok RETURN CREATE FUNCTION prac_w_projekcie(@id int) RETURNS TABLE as RETURN (select * from pracownicy p join realizacje r on p.id = r.idprac where idproj = @id) Wykorzystanie funkcji (wywołanie funkcji występuje w roli tabeli): select * from dbo.prac_w_projekcie(20)
Złożone funkcje tablicowe CREATE FUNCTION prac_w_projekcie_multi(@id int) RETURNS @prac_proj TABLE (id int, nazwisko varchar(20), nazwa varchar(30)) as begin insert into @prac_proj select p.id, p.nazwisko, o.nazwa from pracownicy p join realizacje r on p.id = r.idprac join Projekty o on r.idproj = o.id where o.id = @id return end Wykorzystanie funkcji (wywołanie funkcji występuje w roli tabeli): select * from dbo.prac_w_projekcie_multi(20)
Funkcje - ograniczenia Funkcja wywoływana z polecenia SELECT nie może modyfikować danych relacji bazy danych. Funkcja wywoływana z poleceń INSERT, UPDATE, DELETE nie może odczytywać i modyfikować danych relacji, której dotyczy polecenie. Funkcja wywoływana z poleceń SELECT, INSERT, UPDATE i DELETE nie może zawierać poleceń sterujących sesją i transakcjami (np. COMMIT, ALTER SESSION) oraz instrukcji DDL.
Operator APPLY Złączenia typu CROSS APPLY lub OUTER APPLY stosujemy w sytuacji, gdy chcemy wielokrotnie uruchomić funkcję tabelaryczną dla parametru pobranego z tabeli: operator APPLY pozwala na połączenie dwóch wyrażeń tablicowych (table expressions), wyrażenie tablicowe jest wywoływane dla każdego wiersza z lewej strony operatora. Operator APPLY posiada dwie formy: CROSS APPLY zwraca tylko wiersze z zewnętrznej tabeli (lewa strona) jeżeli istnieje odpowiednik w tabeli wewnętrznej (prawa strona), OUTER APPLY zwraca wszystkie rekordy z tabeli zewnętrznej (lewa strona) niezależnie czy istnieje odpowiednik w tabeli wewnętrznej (prawa strona).
Operator APPLY c.d. Operator APPLY jest użyteczny m.in. do tego, aby wywołać funkcję tablicową dla każdego wiersza pewnej tabeli SELECT P.nazwa, P.id, R.nazwisko FROM Projekty P CROSS APPLY prac_w_projekcie(p.id) R;
Wyzwalacze Procedury wyzwalane (triggers): wywoływane są automatycznie w wyniku wykonania operacji: INSERT, UPDATE lub DELETE (trigery DML) CREATE, ALTER, DROP,GRANT, DENY, REVOKE lub UPDATE STATISTICS (trigery DDL) LOGON (trigery LOGON) mogą wykonać się po zajściu danego zdarzenia (AFTER/FOR) lub zamiast niego wariant INSTEAD OF, mogą być przypisane do tabeli lub widoku, wykorzystują systemowe tabele INSERTED i/lub DELETED (INSERTED zawiera dołączane krotki lub nową wersję krotek zmienianych; DELETED zawiera usuwane krotki lub starą wersję krotek zmienianych), mogą być wywoływane rekurencyjnie
Wyzwalacze - zastosowania Podstawowym zastosowaniem wyzwalaczy jest aktywne wymuszenie integralności danych, zwłaszcza ich zgodności z regułami logiki biznesowej. Wyzwalacze umożliwiają m.in.: Kaskadowe aktualizowanie danych w powiązanych tabelach. Sprawdzanie poprawności danych na podstawie wartości przechowywanych w dowolnych tabelach (w przeciwieństwie do zawężenia CHECK, za pomocą którego możemy odwołać się jedynie do bieżącej tabeli). Jednoczesne sprawdzanie danych zmodyfikowanych w dowolnej liczbie wierszy tabeli. Wywoływanie predefiniowanych lub zdefiniowanych przez użytkownika komunikatów błędu. Monitorowanie aktywności użytkowników. Modyfikacje danych w bazach niespełniających wymogów trzeciej postaci normalnej.
Wyzwalacze przykładowe zastosowania Do implementacji reguł, np.: Żaden pracownik nie może zarabiać więcej niż jego szef Pracownik może być jednocześnie przypisany co najwyżej do 3 projektów Do kaskadowej aktualizacji, np.: Modyfikując płacę szefa zmodyfikuj też płace jego podwładnych Do złożonych wartości wyliczanych, np.: Ustalając stawkę godzinową dla pracownika weź pod uwagę liczbę przepracowanych lat Do monitorowania, archiwizowania, np.: Przy każdej modyfikacji tabeli Pracownicy zapisz w tabeli logującej informacje o czasie modyfikacji, wartości starej, nowej oraz o użytkowniku
Wyzwalacze przykład 1 (AFTER) Wyzwalacz nie pozwala obniżyć płacy pracownikowi CREATE TRIGGER obnizka on pracownicy AFTER update as if (select placa from inserted) < (select placa from deleted) begin rollback end update Pracownicy set placa = placa - 100 where id = 5
Wyzwalacze przykład 2 (INSTEAD OF) Wyzwalacz nie pozwala usuwać pracowników CREATE TRIGGER nie_usuwaj on Pracownicy INSTEAD OF delete as raiserror('nie usuwaj!', 1, 1) go delete from Pracownicy where nazwisko like 'K%' nie usuwaj! Msg 50000, Level 1, State 1 (0 row(s) affected)
Wyzwalacze - uwaga Integralność referencji: Wiele wyzwalaczy można zastąpić za pomocą deklaracji DRI (Declarative Referential Integrity) w schemacie tabeli: FOREIGN KEY (<referencing table column list>) REFERENCES <referenced table name> (<referenced table column list>) [ON UPDATE ON DELETE][NO ACTION CASCADE SET NULL SET DEFAULT]
Aplikacje bazodanowe
Aplikacje bazodanowe Aplikacja bazodanowa system oparty na przechowywaniu, przetwarzaniu i udostępnianiu danych
Aplikacje bazodanowe przykłady Systemy ERP - planowanie zasobów przedsiębiorstwa. Ich podstawowym elementem jest baza danych magazynowanie; zarządzanie zapasami; śledzenie realizowanych dostaw; planowanie produkcji; zaopatrzenie; sprzedaż; zarządzanie relacjami z klientami (CRM); księgowość; finanse; zarządzanie zasobami ludzkimi (płace, kadry).
Aplikacje bazodanowe przykłady c.d. CMS systemy zarządzania treścią system CMS generuje dynamicznie strony internetowe na podstawie treści przechowywanej w bazie danych oraz odpowiednich szablonów do prezentacji Systemy e-commerce Systemy społecznościowe
Aplikacje bazodanowe budowa Aplikacja taka składa się najczęściej z następujących elementów: Składowanie danych serwer baz danych lub system plików Przetwarzanie danych Prezentacja danych interfejsy użytkowników (strona WWW, okno aplikacji, formularz)
Architektura warstwowa Architektura warstwowa aplikacji bazodanowych: architektura jednowarstwowa (1-tier) architektura dwuwarstwowa (2-tier) architektura wielowarstwowa (multi-tier, n-tier) najczęściej trójwarstowa
Architektura jednowarstowa Lokalna ( biurkowa ) aplikacja z wbudowanym systemem baz danych (np. MS Access) duże systemy komputerowe (np. typu mainframe), w których z systemem zarządzania bazą danych zintegrowano aplikacje bazodanowe, obsługujące za pośrednictwem terminali wielu użytkowników
Architektura dwuwarstwowa Model ten jest realizowany w postaci komunikacji klient/serwer, przy czym klient wysyła żądania do serwera bazodanowego i prezentuje otrzymane wyniki. Klient i serwer mogą znajdować się na jednej maszynie lub być rozdzielone. Przetwarzanie żądań może następować po stronie klienta (tzw. 'gruby klient' i 'cienki serwer') lub po stronie serwera ('cienki klient' i 'gruby serwer')
Architektura trójwarstowa Architektura wielowarstwowa rozdziela składowanie, przetwarzanie i prezentację danych pomiędzy oddzielne warstwy. Najpopularniejsza jest architektura trójwarstwowa Serwer bazodanowy SQL HTTP Przeglądarka Serwer aplikacji
Architektura trójwarstowa Zalety architektury trójwarstwowej: Poszczególne moduły mogą być modyfikowane niezależnie od siebie, a zatem: można zrównoleglić prace nad aplikacją, rozdzielić odpowiedzialność modyfikacje jednego modułu nie wymuszają modyfikacji innego modułu Wady: brak wskazówek dotyczących rozłożenia funkcjonalności, szczególnie: rozbudowanej logiki biznesowej obsługi zewnętrznych źródeł danych
Mechanizmy dostępu do baz danych OLE DB ODBC JDBC ADO ADO.NET DAO ORM
ADO.NET ADO.NET to biblioteka służąca do dostępu do danych w.net Framework Została podzielona na dwa komponenty: zestaw dostawców danych oraz uniwersalny obiekt DataSet
ADO.NET dostawcy danych W podstawowej instalacji.net Framework dostępni są następujący dostawcy danych: dostawca danych dla SQL Server dostawca danych dla OLE DB dostawca danych dla ODBC dostawca danych dla Oracle dedykowanych dostawców danych dla innych systemów baz danych można pobrać od producentów tych systemów baz danych (lepsza wydajność)
ADO.NET Cztery główne składowe Connection, Command, DataReader, DataAdapter Typowy scenariusz użycia połączenia się bazą danych, wykonywania poleceń pobierania wyników Dwa tryby działania Tryb połączeniowy: DataReader Tryb bezpołączeniowy: DataAdapter
Dostawcy Każdy dostawca danych składa się z następujących obiektów: Connection reprezentuje połączenie z konkretną bazą danych. Posiada wszystkie informacje potrzebne do połączenia się z bazą, uwierzytelnienia jako określony użytkownik i prowadzenia dalszej komunikacji, Command służy do wykonywania poleceń dotyczących danych zgromadzonych w bazie. Polecenie może zostać zdefiniowane albo jako zapytanie SQL, które ma zostać wykonane, albo jako nazwa procedury przechowywanej zapisanej w bazie. Komunikacja z bazą danych odbywa się za pośrednictwem obiektu Connection, DataReader służy do odczytu danych zwróconych w wyniku wykonania zapytania zapisanego w obiekcie Command. Dane przesyłane są porcjami po jednym wierszu, DataAdapter pośredniczy w komunikacji pomiędzy obiektem DataSet a bazą danych.
DataSet Obiekt DataSet jest buforem do przechowywania danych pobranych z różnych źródeł. Obiekt ten posiada informację o strukturze tabel, ich wzajemnych powiązaniach i nałożonych ograniczeniach W przekazywaniu danych pomiędzy źródłem danych a obiektem DataSet pośredniczy obiekt DataAdapter odpowiedniego dostawcy danych. Aby odświeżyć obiekt DataSet należy wykonać metodę Fill obiektu DataAdapter Nie ma konieczności utrzymywania otwartego połączenia z bazą - aplikacja może połączyć się z bazą danych, wczytać potrzebne informacje do obiektu DataSet i zamknąć połączenie. Po zmodyfikowaniu zawartości obiektu DataSet aplikacja może ponownie połączyć się z bazą danych i przekazać jej zmodyfikowane rekordy.
Przykład C# // dodanie przestrzeni nazw using System.Data; using System.Data.OleDb;... // konfiguracja łańcucha połączenia public string LancuchBaza= @"Provider=Microsoft.Jet.OLEDB.4.0; DataSource=..\\..\\baza.mdb"; // utworzenie obiektu Connection i otwarcie połączenia z bazą OleDbConnection PolaczBaza = new OleDbConnection(LancuchBaza); PolaczBaza.Open();... // praca z bazą danych ---> patrz następny slajd PolaczBaza.Close();
Przykład C# c.d. string Zapytanie = "SELECT IDklienta, NazwaFirmy FROM Klienci WHERE Miasto LIKE @NazwaMiasta"; OleDbCommand Polecenie = new OleDbCommand(Zapytanie, PolaczBaza); Polecenie.Parameters.Add("NazwaMiasta", Miasto); OleDbDataAdapter AdapterKlientow = new OleDbDataAdapter(Polecenie); DataSet Dane = new DataSet(); AdapterKlientow.Fill(Dane, "Klienci");
Inne technologie Language INtegrated Query (LINQ) to część technologii Microsoft.NET, umożliwia zadawanie pytań na obiektach. Składnia języka LINQ przypomina SQL. ORM - mapowanie obiektowo-relacyjne (Object- Relational Mapping) - to sposób odwzorowania obiektowej architektury systemu informatycznego na relacyjną bazę danych. Przykład: Hibernate Entity Framework https://msdn.microsoft.com/pl-pl/library/aplikacje-korzystajace-z-orm-linq-entity-framework.aspx