NoSQL & relax with CouchDB



Podobne dokumenty
Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

NoSQL Not Only SQL, CouchDB. I.Wojnicki, NoSQL. Apache CouchDB has started. Time to relax. Igor Wojnicki

CouchDB. Michał Nowikowski

MongoDB. wprowadzenie. dr inż. Paweł Boiński, Politechnika Poznańska

Wprowadzenie do NoSql. Maksymilian Wiesiołek

Hbase, Hive i BigSQL

Definicja. Not Only SQL

Technologie Informacyjne

BAZY DANYCH. NIERELACYJNE BAZY DANYCH NoSQL I ASOCJACYJNE STRUKTURY DANYCH. Adrian Horzyk. Akademia Górniczo-Hutnicza

*Grafomania z. Neo4j. Praktyczne wprowadzenie do grafowej bazy danych.

Szkolenie wycofane z oferty. Apache Cassandra - modelowanie, wydajność, analiza danych

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Bazy danych NoSQL. wprowadzenie. Szymon Francuzik Poznań,

Bazy danych NoSQL. Szymon Francuzik Poznań,

Specjalizacja magisterska Bazy danych

Hurtownie danych wykład 5

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

NoSQL: Riak. dr inż. Sebastian Ernst Katedra Informatyki Stosowanej

Big Data i 5V Nowe wyzwania w świecie danych Krzysztof Goczyła

(Apache) CouchDB. Krzysztof Kulewski 2008

Nierelacyjne bazy danych

Obiektowość BD Powtórka Czas odpowiedzi. Bazy Danych i Systemy informacyjne Wykład 14. Piotr Syga

NoSQL Not Only SQL: CouchDB. I.Wojnicki, NoSQL. Apache CouchDB has started. Time to relax. Przetwarzanie dokumentów i widoków.

CZĘŚĆ I. WARSTWA PRZETWARZANIA WSADOWEGO

Narzędzia i trendy Big Data

Bazy danych 12. Bazy NoSQL. P. F. Góra

Zaawansowany kurs języka Python

Wprowadzenie do Hurtowni Danych

Big Data to skalowalność i prostota obsługi wielkich ilości danych!

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Tworzenie aplikacji bazodanowych

Wprowadzenie do baz NoSQL

Pojęcie bazy danych. Funkcje i możliwości.

BAZY DANYCH WYKŁAD 5 NO-SQL DATABASE

Nowe technologie baz danych

Systemy rozproszone danych strukturalnych

Programowanie obiektowe

ROZWIĄZANIA PODSTAWOWYCH IDEI BAZ DANYCH TYPU NOSQL W KONTEKŚCIE BEZPIECZEŃSTWA DANYCH

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Bazy danych - wykład wstępny

Współczesne systemy baz danych

1. WPROWADZENIE PRZEBADANE TECHNOLOGIE ŚRODOWISKO BADAWCZE ZAPISYWANIE I ODCZYTYWANIE W OBRĘBIE JEDNEJ INSTANCJI...

Spis treści. Przedmowa

Oracle11g: Wprowadzenie do SQL

Bazy danych Wprowadzenie Wykład dla IV i V roku matematyki

Bazy danych i ich aplikacje

METODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI

Aktualizacja do Microsoft SQL Server Adam Rynarzewski MCT

Bazy Danych. C. J. Date, Wprowadzenie do systemów baz danych, WNT - W-wa, (seria: Klasyka Informatyki), 2000

Jarosław Kuchta Projektowanie Aplikacji Internetowych. Projektowanie warstwy danych

Technologie Informacyjne

RELACYJNE BAZY DANYCH

Projektowanie warstwy danych

Wybrane działy Informatyki Stosowanej

Encje w Drupalu. Tworzenie własnych encji i ich wpływ na poprawę wydajności

PROGRAM NAUCZANIA DLA ZAWODU TECHNIK INFORMATYK, O STRUKTURZE PRZEDMIOTOWEJ

Wst p Model Danych Saklowalno± + replikacja Spójno± Ograniczenia. Cassandra. Paweª Róg. Pozna«, maj 2011

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko

Politechnika Śląska w Gliwicach Instytut Automatyki 2005/2006

WIELOKROTNE PRZYSPIESZENIE DZIAŁANIA APLIKACJI POPRZEZ ZASTOSOWANIE TECHNOLOGII NIERELACYJNYCH BAZ DANYCH

Bazy danych 11. Systemy rozproszone, twierdzenie CAP i bazy NoSQL. P. F. Góra

SZKOLENIE: Administrator baz danych. Cel szkolenia

Programowanie w Ruby

Tworzenie komponentów logiki biznesowej i warstwy dostępu do danych w oparciu o EJB3.0/JPA lub EJB 3.1/JPA2

Rozproszone bazy danych. Robert A. Kłopotek Wydział Matematyczno-Przyrodniczy. Szkoła Nauk Ścisłych, UKSW

Seminarium Bazy Danych I. BigTable. Piotr Świgoń Uniwersytet Warszawski

Projektowanie architektury systemu rozproszonego. Jarosław Kuchta Projektowanie Aplikacji Internetowych

Metody replikacji baz danych Oracle pomiędzy ośrodkami przetwarzania danych

Hadoop i Spark. Mariusz Rafało

Projektowanie struktury danych

Iwona Milczarek, Małgorzata Marcinkiewicz, Tomasz Staszewski. Poznań,

Bazy danych. Plan wykładu. Diagramy ER. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych. Podstawy modeli relacyjnych

Aplikacje webowe z wykorzystaniem Node.js oraz Express

PHP: bazy danych, SQL, AJAX i JSON

Rozwiązania bazodanowe EnterpriseDB

010 NOSQL. Prof. dr hab. Marek Wisła

Parametry wydajnościowe systemów internetowych. Tomasz Rak, KIA

011 ASPEKTY BAZ NOSQL. Prof. dr hab. Marek Wisła

Wprowadzenie do Hurtowni Danych

Zapewnienie wysokiej dostępności baz danych. Marcin Szeliga MVP SQL Server MCT

PERSPEKTYWY ZASTOSOWANIA BAZ DANYCH NoSQL W INTELIGENTNYCH SYSTEMACH TRANSPORTOWYCH

Transformacja wiedzy w budowie i eksploatacji maszyn

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi

Bazy danych NoSQL Część II. Maciej Zakrzewicz Politechnika Poznańska, Instytut Informatyki,

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

Tworzenie bazy danych w środowisku OpenOffice.org Base tabela, formularz, kwerenda, raport

DATABASE SNAPSHOT GEEK DIVE. Cezary Ołtuszyk Blog: coltuszyk.wordpress.com

Splunk w akcji. Radosław Żak-Brodalko Solutions Architect Linux Polska Sp. z o.o.

Bazy danych 2. Wykład 1

Replikacja bazy danych polega na kopiowaniu i przesyłaniu danych lub obiektów bazodanowych między serwerami oraz na zsynchronizowaniu tych danych w

Administracja i programowanie pod Microsoft SQL Server 2000

Bazy danych. Plan wykładu. Rozproszona baza danych. Fragmetaryzacja. Cechy bazy rozproszonej. Replikacje (zalety) Wykład 15: Rozproszone bazy danych

Architektura i mechanizmy systemu

Bazy danych - ciągłość działania, spójność danych i disaster recovery. Daniel Polek-Pawlak Jarosław Zdebik

Gerard Frankowski, Zespół Bezpieczeństwa PCSS. Nowoczesne technologie bliżej nas Poznań,

Automatyzacja procesów biznesowych Andrzej Sobecki. ESB Enterprise service bus

ERDAS ADE Suite edytor baz danych Oracle Spatial

Programowanie w Ruby

Więzy integralności referencyjnej i klucze obce. PYTANIE NA EGZAMIN LICENCJACKI

Plan. Wprowadzenie. Co to jest APEX? Wprowadzenie. Administracja obszarem roboczym

Transkrypt:

NoSQL & relax with PyWaw #23 8 kwiecień 2013

Agenda 1 NoSQL - nierelacyjne systemy baz danych Wprowadzenie do NoSQL Rodzaje i porównanie baz NoSQL Polyglot persistence 2 Projekt w CERN wykorzystujacy 3 Warsaw NoSQL User Group NoSQL - podsumowanie Specjalna czastka

NoSQL nierelacyjne systemy baz danych Wprowadzenie do NoSQL Rodzaje i porównanie baz NoSQL Polyglot persistence NoSQL NoSQL = Not only SQL (nie tylko SQL) Systemy zarzadzania bazami danych, które nie opieraja się na tradycyjnym modelu relacyjnym. Cechy: rezygnacja z właściwości ACID i innych cech relacyjnych (np. złaczeń) łatwe skalowanie horyzontalne brak pojedynczego punktu awarii elastyczne schematy danych (agregaty)

Dlaczego NoSQL? Big data - wielkie zbiory danych Wprowadzenie do NoSQL Rodzaje i porównanie baz NoSQL Polyglot persistence Dynamo Cassandra Bigtable Voldemort

Wprowadzenie do NoSQL Rodzaje i porównanie baz NoSQL Polyglot persistence Teoria CAP Consistency (Spójność), Availability (Dostępność), Partition tolerance (Rozproszenie)

Wprowadzenie do NoSQL Rodzaje i porównanie baz NoSQL Polyglot persistence Rodzaje baz danych NoSQL (taksonomia) podstawowe trzy rodzaje 1. Klucz-wartość 2. Bazy dokumentowe 3. Bazy kolumnowe Bigtable Inne? (grafowe, obiektowe, hierarchiczne)

Polyglot persistence Wprowadzenie do NoSQL Rodzaje i porównanie baz NoSQL Polyglot persistence Polyglot Persistence Why now? http://bit.ly/zhdq1b

Polyglot persistence Wprowadzenie do NoSQL Rodzaje i porównanie baz NoSQL Polyglot persistence http://bit.ly/12w8xys

- główne komponenty RELAX, Ubuntu One, BBC, CERN Projekt w CERN wykorzystujacy Apache has started. Time to relax.

- główne komponenty budowa wewnętrzna Projekt w CERN wykorzystujacy

- główne komponenty od strony użytkownika Projekt w CERN wykorzystujacy

- wewnętrzna struktura drzewo B+, plik append-only Projekt w CERN wykorzystujacy zapisy nie blokuja odczytów dowolna liczba odczytów trwały zapis danych duża zajętość dysku - baza wymaga kompresji

Konsekwencje pliku append-only Ciekawostka Projekt w CERN wykorzystujacy 4 dokumenty w bazie (rozmiar w bajtach - czerwony kolor) -rw-r r 1 adam adam 16479 2012-06-04 18:25 adam.couch po usunięciu dokumentów: 0 dokumentów -rw-r r 1 adam adam 36962 2012-06-04 18:27 adam.couch po kompresji (compaction) -rw-r r 1 adam adam 4188 2012-06-04 18:29 adam.couch

Futon administracja, replikacja, kompresja Projekt w CERN wykorzystujacy

Design documents MapReduce: liczba slotów PDU-s Projekt w CERN wykorzystujacy function(doc) { if (doc.doc_type == pdu && doc.slotcount) { emit(doc._id, doc.slotcount); } } function(keys, values, rereduce) { return sum(values); } incremental views: funkcje MapReduce (~ perspektywy zmaterializowane) validation functions: sprawdź wymagane pola shows functions: konwertuj dokument do wybranego formatu (np. HTML)

Jak Python rozmawia z? moduły biblioteki Projekt w CERN wykorzystujacy couchdb.client administracja: tworzenie bazy, usuwanie, replikacja, compaction (usuwanie poprzednich wersji dokumentów) couchdb.mapping odwzorowanie dokumentów w formacie JSON na obiekty w języku Python (uwaga na pole _rev - artyfakt) couchdb.design zarzadzanie design document (funkcje walidacji, formatowanie) couchdb.views tworzenie zapytań do bazy w formie funkcji MapReduce

NoSQL - nierelacyjne systemy baz danych Projekt w CERN wykorzystujacy Konfiguracja urzadze n : PDU (Power Distribution Unit)

Schemat danych dla konfiguracja urzadzenia <-> dokument w bazie Projekt w CERN wykorzystujacy DOCUMENT * _id * title * doc_type o hardware_model o serial_number o vendor DEVICE RACK * cooling_system_type TAPE_LIBRARY * is_active * ping_timeout TEMPERATURE_SENSOR UPS EOD o dip_address o plc_address RACK_MEMBER PDU RMS * is_active * ping_timeout DISK_ARRAY BLADE_ENCLOSURE SERVER * firmware_version * mac_address * smtp_server_name * smtp_server_port * email_from_address * syslog_primary_host * syslog_secondary_host * syslog_port * email_notifications_enabled * email_primary_to o email_secondary_to o dhcp_fqdn o autofw_updates o temp_humid_sensor_oid o outlet_power_oid o %_oid (% - can be replaced) NETWORK_DEVICE ROUTER SWITCH

Warsaw NoSQL User Group NoSQL - podsumowanie Specjalna czastka Warsaw NoSQL User Group CASE Co należy zrobić? ANALIZA Która bazę wybrano i dlaczego? UŻYCIE Model danych, wydajność, rozmiar danych. DOŚWIADCZENIE Moje wnioski z użycia danej bazy.

NoSQL - podsumowanie Warsaw NoSQL User Group NoSQL - podsumowanie Specjalna czastka bazy danych NoSQL dla wielkich zbiorów danych i specjalnych form danych (graf, częsta replikacja) teoria CAP i rozproszone bazy danych rodzaje baz NoSQL klucz-wartość dokumentowe kolumnowe wykorzystanie bazy dokumentowej bazy relacyjne wciaż użyteczne w ok. 90% przypadkach polyglot persistence - właściwa baza do danego problemu

Warsaw NoSQL User Group NoSQL - podsumowanie Specjalna czastka Dziękuję za uwagę