Tematy projektów Edycja 2014

Podobne dokumenty
Tematy projektów Edycja 2017

Hurtownie danych i przetwarzanie analityczne - projekt

Tematy projektów HDiPA 2015

Tematy projektów Edycja 2019

Specjalizacja magisterska Bazy danych

Iwona Milczarek, Małgorzata Marcinkiewicz, Tomasz Staszewski. Poznań,

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Multi-wyszukiwarki. Mediacyjne Systemy Zapytań wprowadzenie. Architektury i technologie integracji danych Systemy Mediacyjne

Integracja systemów transakcyjnych

Parametry wydajnościowe systemów internetowych. Tomasz Rak, KIA

PROJEKT Z BAZ DANYCH

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Tematy prac dyplomowych inżynierskich

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

Zaawansowane bazy danych i hurtownie danych Wydział Informatyki Politechnika Białostocka

Ekspert MS SQL Server Oferta nr 00/08

Architektury i technologie integracji danych

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Hurtownie danych - przegląd technologii

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Bazy danych i ich aplikacje

Podrozdziały te powinny zawierać informacje istotne z punktu widzenia przyjętego celu pracy

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Tworzenie aplikacji bazodanowych

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hbase, Hive i BigSQL

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

Wprowadzenie do Hurtowni Danych

Splunk w akcji. Radosław Żak-Brodalko Solutions Architect Linux Polska Sp. z o.o.

Przesłanki powstania książki... xvi Dla kogo przeznaczona jest ta książka?... xvi Co znajdziemy wewnątrz książki?... xvii

Spis tre±ci. Przedmowa... Cz ± I

Hurtownie danych. 31 stycznia 2017

Technologia HD w IBM DB2

AKADEMIA GÓRNICZO-HUTNICZA im. Stanisława Staszica w Krakowie. Wydział Geologii, Geofizyki i Ochrony Środowiska. Bazy danych 2

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownia danych praktyczne zastosowania

PRZEWODNIK PO PRZEDMIOCIE

Sylabus do programu kształcenia obowiązującego od roku akademickiego 2014/15

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych - przegląd technologii

Badania marketingowe. Badania marketingowe. Materiały do wykładu Prowadzący: dr Krzysztof Hejduk Szkoła Główna Handlowa w Warszawie

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Oracle11g: Wprowadzenie do SQL

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

FORMULARZ OFERTOWY. 8. Społeczeństwo informacyjne zwiększanie innowacyjności gospodarki

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Shapefile, GeoPackage czy PostGIS. Marta Woławczyk (QGIS Polska)

DLA SEKTORA INFORMATYCZNEGO W POLSCE

Pracowania Projektowania Zespołowego

Tematy dyplomów inżynierskich 2009 Katedra Inżynierii Oprogramowania

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Technologie wyszukiwania pełnotekstowego

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Opis wdrożenia Platformy Technologicznej epodreczniki.pl na zasobach Poznańskiego Centrum Superkomputerowo-Sieciowego

"Administrowanie Sieciami Komputerowymi"

CZĘŚĆ I. WARSTWA PRZETWARZANIA WSADOWEGO

Projekt przejściowy 2015/2016 BARTOSZ JABŁOŃSKI, TOMASZ JANICZEK

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Szkolenie wycofane z oferty. Apache Cassandra - modelowanie, wydajność, analiza danych

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) niestacjonarne (stacjonarne / niestacjonarne)

Fundusze inwestycyjne i emerytalne W A R U N K I Z A L I C Z E N I A P R Z E D M I O T U

Usługa: Testowanie wydajności oprogramowania

Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

MongoDB. wprowadzenie. dr inż. Paweł Boiński, Politechnika Poznańska

udokumentowanych poprzez publikacje naukowe lub raporty, z zakresu baz danych

"Administrowanie Sieciami Komputerowymi"

Rozwiązanie Compuware dynatrace

Optymalizacja poleceń SQL

Hurtownie danych wykład 5

Modele bezpieczeństwa logicznego i ich implementacje w systemach informatycznych / Aneta Poniszewska-Marańda. Warszawa, 2013.

Spis treści. Przedmowa

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/17

Wprowadzenie do Hurtowni Danych

KARTA PRZEDMIOTU 1,5 1,5

PRZEWODNIK PO PRZEDMIOCIE

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Grzegorz Ruciński. Warszawska Wyższa Szkoła Informatyki Promotor dr inż. Paweł Figat

Studia podyplomowe w zakresie zarządzanie projektami Project Management

Systemy GIS Systemy baz danych

ZARZĄDZANIE WYMAGANIAMI ARCHITEKTONICZNYMI

Istnieje możliwość prezentacji systemu informatycznego MonZa w siedzibie Państwa firmy.

Big Data to skalowalność i prostota obsługi wielkich ilości danych!

Skalowalna Platforma dla eksperymentów dużej skali typu Data Farming z wykorzystaniem środowisk organizacyjnie rozproszonych

Uniwersytet Zielonogórski Instytut Sterowania i Systemów Informatycznych Bazy Danych - Projekt. Zasady przygotowania i oceny projektów

Rozwiązania wspomagające przetwarzanie wielkich zbiorów danych (VLDB) we współczesnych systemach zarządzania bazami danych

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Pomagamy firmom podejmować trafne decyzje biznesowe. Dostarczamy korzystne i nowoczesne rozwiązania IT. HURO Sp. z o.o.

Wizja platformy ITS w koncepcji sieciocentrycznej. dr inż. Mikołaj Sobczak

Szkolenie: Testowanie wydajności (Performance Testing)

Wykorzystanie wolnego oprogramowania do modelowania informacji geograficznej

Kontraktor - Analityk Biznesowy

Projekt epuap obecny stan realizacji i plany na przyszłość

Zakład Ubezpieczeń Społecznych Departament Zamówień Publicznych ul. Szamocka 3, 5, Warszawa

KARTA PRZEDMIOTU. 1) Nazwa przedmiotu: INŻYNIERIA SYSTEMÓW I ANALIZA SYSTEMOWA. 2) Kod przedmiotu: ROZ-L3-20

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Dane bezpieczne w chmurze

Transkrypt:

Tematy projektów Edycja 2014 Robert Wrembel Poznan University of Technology Institute of Computing Science Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Reguły Projekty zespołowe max. 4 osoby w zespole Zaliczenie studium dyplom 60% egzamin pisemny 40% projekt Zaliczenie projektu prezentacja końcowa (obrona): ocenie podlega zawartość struktura sposób prezentacji raport techniczny: ocenie podlega jakość produktu projektu zawartość raportu struktura raportu język (czytelność prezentacji) 2

Reguły Realizacja projektu metodyka (Scrum, Prince2,...) manager zespół cykliczne prezentacje na zajęciach postęp problemy 3 Tematy 1. Efektywność clustering index i MDC w zapytaniach analitycznych w IBM DB2 (2 osoby) 2. Analiza jakościowa i ilościowa zmian w strukturach źródeł danych (2 lub 3 osoby) 3. Porównanie wydajności HBase i Cassandra (3 osoby) 4. Porównanie wydajności Storm i Kafka (3 osoby) 5. Efektywność przeszukiwania dokumentów ze wsparciem Elasticsearch (3 osoby) 6. Wirtualna integracja danych sektora publicznego (open data, linked data) i ich analiza (4 osoby) 7. Test funkcjonalności Splice Machine (2 osoby) 4

1. Clustering index i MDC System: IBM DB2 Star Schema Benchmark (SSB) Porównanie, w oparciu o SSB, efektywności wykonywania zapytań dla następujących testowych scenariuszy obciążenia standardowe indeksy na atrybutach połączeniowych i występujących w klauzuli WHERE MDC o strukturach odpowiednich do zapytań clustering index o strukturach odpowiednich do zapytań Analiza planów wykonania zapytań kosztów wykonania zapytań (liczba operacji dyskowych, całkowity czas wykonania zapytania) Wnioski dot. wykorzystania ww. struktur dla scenariuszy obciążenia 5 2. Analiza zmian w źródłach Rzeczywisty system informatyczny Analiza zmian struktury źródeł danych jakościowa - klasyfikacja zmian ilościowa - jak często się pojawiały Analiza wpływu zmian na warstwę ETL hurtownię danych aplikacje 6

3. Wydajność HBase i Cassandra Opracowanie benchmarku opartego na analizie tweet'ów schemat repozytorium zapytania rozmiar repozytorium Wczytanie nowych tweet'ów do istniejącego repozytorium Wykonanie eksperymentów pomiaru wydajności obu systemów w oparciu o opracowany benchmark 7 4. Wydajność Storm i Kafka Opracowanie benchmarku przepustowość systemu w zależności od rozmiaru przetwarzanej paczki danych skalowalność dla parametryzowanej liczby spout/producer i bolt/consumer Wczytanie nowych tweet'ów do istniejącego repozytorium Wykonanie eksperymentów pomiaru wydajności obu systemów w oparciu o opracowany benchmark 8

5. Wydajność Elasticsearch Opracowanie benchmarku dokumentowej bazy danych schemat repozytorium zapytania rozmiar repozytorium struktury indeksowe Wykonanie eksperymentów mierzących efektywność wykonania zapytań z benchmarku 9 6. Wirtualna integracja danych Dane sektora publicznego (open data, linked data) Implementacja architektury integracji o nast. funkcjonalności: odkrywanie źródeł danych integrowanie wybranych źródeł danych możliwość wykonywania prostych zapytań Proponowane źródła danych: transport publiczy, np. MPK dane demograficzne, np. aglomeracja poznańska dane geograficzne, np. system GEOPOZ 10

7. Splice Machine Instalacja systemu Ocena funkcjonalności architektura instalacja wparcie SQL transakcyjność wsparcie struktur NoSQL i relacyjnych wsparcie języków proceduralnych współbieżność administrowanie 11