Przegląd grafowych baz danych. Paweł Bednarz

Podobne dokumenty
*Grafomania z. Neo4j. Praktyczne wprowadzenie do grafowej bazy danych.

Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

REFERAT PRACY DYPLOMOWEJ

CouchDB. Michał Nowikowski

Grafowe języki zapytań. Anna Kosieradzka

Analiza porównawcza wybranych własności systemów zarządzania bazami danych

IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH ALGORYTMÓW GRAFOWYCH W WARUNKACH OBLICZEŃ RÓWNOLEGŁYCH

Firebird Alternatywa dla popularnych darmowych systemów bazodanowych MySQL i Postgres

Bazy danych NoSQL. wprowadzenie. Szymon Francuzik Poznań,

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

Zabbix -Monitoring IT bez taśmy klejącej. Paweł Tomala Barcamp 15 czerwca 2015

Netdisco. Maciej Łabędzki, grudzień 2006

Grafowe bazy danych - przegl d technologii

Rozwiązania bazodanowe EnterpriseDB

Politechnika Poznańska TWO

Obiektowy model dokumentu. Katedra Mikroelektroniki i Technik Informatycznych

BAZY DANYCH. NIERELACYJNE BAZY DANYCH NoSQL I ASOCJACYJNE STRUKTURY DANYCH. Adrian Horzyk. Akademia Górniczo-Hutnicza

Program nauczania informatyki w gimnazjum Informatyka dla Ciebie. Modyfikacja programu klasy w cyklu 2 godzinnym

QualitySpy moduł reports

Informacje wstępne Autor Zofia Kruczkiewicz Wzorce oprogramowania 4

NoSQL & relax with CouchDB

Wprowadzenie do Apache Spark. Jakub Toczek

Pojęcie bazy danych. Funkcje i możliwości.

Administracja bazami danych

MongoDB. wprowadzenie. dr inż. Paweł Boiński, Politechnika Poznańska

Grafy w MATLABie. LABORKA Piotr Ciskowski

Iwona Milczarek, Małgorzata Marcinkiewicz, Tomasz Staszewski. Poznań,

Tematy prac dyplomowych inżynierskich

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

DVD MAKER USB2.0 Instrukcja instalacji

MAXDATA VMX. Model PCMD/ Intel Celeron D CPU 3.46GHz Socket 775 LGA System operacyjny: MS Windows XP Professional

Semantyczne Wiki na przykładzie Semantic MediaWiki

OpenLaszlo. OpenLaszlo

Bazy danych. Dr inż. Paweł Kasprowski

Informatyka I. Standard JDBC Programowanie aplikacji bazodanowych w języku Java

Bazy danych NoSQL. Szymon Francuzik Poznań,

Platforma informacyjno-szkoleniowa z kursami językowymi Rosetta Stone zakres usługi:

Semantyczne Wiki! na przykładzie! Semantic MediaWiki!

Parametry techniczne. Testy

Wybrane działy Informatyki Stosowanej

Grafy i sieci w informatyce - opis przedmiotu

OPROGRAMOWANIE KEMAS zbudowane jest na platformie KEMAS NET

Informatyka I. Programowanie aplikacji bazodanowych w języku Java. Standard JDBC.

Wymagania dotyczące oprogramowania bazodanowego

Wprowadzenie db4o - podstawy db4o - technikalia Przydatne wiadomości. Wprowadzenie. db4o. Norbert Potocki. 1 czerwca Norbert Potocki db4o

Tworzenie aplikacji bazodanowych

Home Software Hardware Benchmarks Services Store Support Forums About Us

Paweł Rajba

Systemy rozproszone danych strukturalnych

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko

Nowoczesne bazy danych, czyli przetwarzanie in-memory

Linux -- u mnie działa!

Metody indeksowania dokumentów tekstowych

Zapytanie o cenę nr 1

Instytut Technik Innowacyjnych Semantyczna integracja danych - metody, technologie, przykłady, wyzwania

Zarządzanie sieciami telekomunikacyjnymi

ASP.NET MVC. Grzegorz Caban 20 stycznia 2009

Wpływ ustawień parametru wieloblokowego sekwencyjnego czytania danych na czas wykonywania zapytania SQL w bazie danych Oracle 11g

Projektowanie: architektura baz danych

Hurtownie danych wykład 5

(Apache) CouchDB. Krzysztof Kulewski 2008

Programowanie obiektowe

Wstęp do JUNG. Omówione elementy wykorzystane w Edge Color Project

Cloud Customers Relationships Wymagania wersja systemu:

Hbase, Hive i BigSQL

ANYSHOP PRIME Power and Style at Your Space

INFORMATYKA Pytania ogólne na egzamin dyplomowy

Tadeusz Kufel Uniwersytet Mikołaja Kopernika w Toruniu

ZAPYTANIE OFERTOWE NR 6

Aplikacje webowe z wykorzystaniem Node.js oraz Express

Podstawy frameworka Spring

Monitorowanie Sieci nonblocking content packet filtering

DATABASE SNAPSHOT GEEK DIVE. Cezary Ołtuszyk Blog: coltuszyk.wordpress.com

JavaFX. Technologie Biznesu Elektronicznego. Wydział Informatyki i Zarządzania Politechnika Wrocławska

Database Connectivity

Wprowadzenie do NoSql. Maksymilian Wiesiołek

Grafowa baza danych. Joanna Kącka, Paweł Barszcz, Marcin Lewandowski Krystian Lieber, Jakub Pawłot Michał Staroń, Maciej Szawłowski

Budowanie interfejsów do baz danych

Tomasz Grześ. Systemy zarządzania treścią

Open Source na Uniwersytecie Łódzkim

Praca Magisterska "System zdalnego składania ofert kupna i sprzedaży za pośrednictwem Internetu" AUTOR PROMOTOR

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

Red Hat Network Satellite Server

PRZEGLĄD WYBRANYCH BAZ NOSQL. Sławomir Dadas

Technologie Informacyjne

Indeksowanie full text search w chmurze

GS2TelCOMM. Rozszerzenie do TelCOMM 2.0. Opracował: Michał Siatkowski Zatwierdził: IMIĘ I NAZWISKO

Przykłady zastosowao rozwiązao typu mapserver w Jednostkach Samorządu Terytorialnego

Definicja. Not Only SQL

Strona wizytówka od 400 zł

Rozproszona grafowa baza danych

NoSQL. Technologie zarządzania treścią. dr inż. Robert Perliński

Dokumentacja aplikacji Szachy online

Programowanie Komponentowe WebAPI

WorkingDoc CostControl: Precyzyjna kontrola kosztów wydruku na urządzeniach Grupy Ricoh

Raport Hurtownie Danych

Informatyka (10) dr inż. Katarzyna Palikowska Katedra Transportu Szynowego i Mostów p. 4 Hydro

Wymagania techniczne

Transkrypt:

Przegląd grafowych baz danych Paweł Bednarz

Porządek prezentacji: Wstęp Po co nam grafowe bazy danych? Reprezentacja danych, interfejsy Do jakich problemów je stosować? Porównanie grafowych baz danych OrientDB Dex InfiniteGraph

Po co kolejny rodzaj baz danych? Argumenty Dane a powiązania między danymi Zmniejszenie impendance mismatch Dobre skalowanie poziome Brak problemów z denormalizacją Łatwiejsze formułowanie zapytań przechodzących po krawędziach

Kto ich używa? FlockDB Twitter social graphs, 13+ billion edges and sustains peak traffic of 20k writes/second and 100k reads/second Pregel

Struktura bazy Jakie grafy chcemy przechowywać?

Jakie grafy chcemy przechowywać?

Jakie grafy chcemy przechowywać?

Jakie grafy chcemy przechowywać?

Struktura bazy Jakie grafy chcemy przechowywać? Jaki wybrać interfejs do przeszukiwania grafów?

Interfejsy do przeszukiwania grafów (wariant 1):

Interfejsy do przeszukiwania grafów (wariant 2):

Klasyczne obszary zastosowań: Sieci transportowe, GIS Systemy reprezentacji wiedzy Sieci semantyczne

Zastosowania w sieciach złożonych: Sieci informacji Sieci społecznościowe Sieci biologiczne

Porównanie baz danych:

Dex: Wersja demo - do 1M rekordów darmowa Wersja >1M rekordów płatna w zależności od ilości rekordów w bazie

Dex - performance: Benchmark #nodes #edges Raw(GB) Dex(GB) Load IMDB 13338793 22259869 1.5 2.4 21m 8s Social network 90873017 663546226 11 32 298m Scopus 15107484 113294315 7 8 115m 50s Wikipedia 1949048 180230453 5.5 7.6 129m 53s Xmark_25 4970162 9848812 1.9 2 15m

Dex - performance: SF Nodes Edges Load Edges /s GB Q1 Traver sals T/s 25 29M 0.2B 1.2h 61K 11 24m 0.5B 361K 26 58M 0.5B 2.6h 57K 21 52m 1B 337K 27 116M 1.1B 5.6h 53K 41 1.9h 2.1B 307K 28 230M 2.1B 15h 40K 83 4h 4.2B 295K Note: The experiments are performed using a computer with two quadcore Intel(R) Xeon(R) E5440 at 2.83 GHz. The memory hierarchy is organized as follows: 6144 KB second level cache, a 64 GB main memory and a Disk with 1.7 TB. The operating system is Linux Debian etch 4.0.

Dex - cechy: API do javy Core w C++ Reader csv, jdbc Writer csv, graphml Shell API

Dex - cechy: ACID tylko częściowo wspierany (Consistency and Isolation) Wbudowane algorytmy do działania na grafach (BFS, DFS, najkrótsze ścieżki, spójne składowe) DBgraph, Rgraph Statystyki atrybutów Id factory

Dex - braki: Kiepski manual Nie ma logowania Nie ma indexów Nie ma klienta, nawet konsolowego Nie ma kontroli nad dostępem do zasobów

OrientDB Open source Apache license 2.0

OrientDB - performance: can store up to 150,000 records per second on common hardware Intel 2.40Ghz, 3 GB RAM and HD 5.400rpm, Windows Vista 1M records Bez tx 1.91s, 510K req/s Z tx 15s, 66K req/s Podobno szybszy niż neo4j RB+Tree

OrientDB - cechy: Object-Document database Transakcje ACID Konsola interaktywna i wsadowa Indeksy Interfejsy binarne do javy, C, PHP, JRuby Interfejsy RESTowe do JS, pythona Przezroczyste mapowanie na obiekty javowe

OrientDB - cechy: Limitowany dostęp do zasobów na zasadzie użytkowników i ról Wbudowany SQLowy język zapytań (rozszerzony o find references, traverse) Triggery Logowanie

OrientDB - cechy: Bardzo rozbudowane API Dobry manual Dołączona spora testowa baza danych

OrientDB - cechy: Problem z pisaniem zapytań Tutoriale tylko po włosku

InfiniteGraph Darmowa wersja 60-dniowa Darmowy dla studentów:) Darmowy dla startupów do 1M$ obrotu Poza tym płatny 1K$ rocznie / developer

InfiniteGraph - cechy: Proste i przyjazne API Indeksy wbudowane Indeks Lucene Transakcje

InfiniteGraph - trawersowanie: Navigator Guide PathQualifier ResultQualifier NavigationResultHandler

InfiniteGraph - wady: Mało informacji na stronie producenta Uciążliwa instalacja Brak logowania Brak klienta Brak kontroli nad dostępem do zasobów Brak możliwości wczytywania i zapisywania grafów do innych formatów

Bazy danych, które mi się nie spodobały: vertexdb - napisane w C, api jak w FUSE, zapytania wysyła się jej po http, opowiedzi dostaje się w JSONie sones język zapytań bazuje na GQLu - grafowym rozszerzeniu SQLa, API do.net, C#, RESTa, Javy, tragiczne WWW allegro - RDF, semantyczny internet, ontologie

Czego nie zdążyłem porównać: HypergraphDB open source'owa baza danych, póki co w wersji 1.1, ale wygląda obiecująco InfoGrid AGPL3