Tematy projektów Edycja 2019

Podobne dokumenty
Tematy projektów Edycja 2017

Tematy projektów Edycja 2014

Tematy projektów HDiPA 2015

Hurtownie danych i przetwarzanie analityczne - projekt

Hurtownie danych - przegląd technologii

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

PROJEKT Z BAZ DANYCH

Kurs MATURA Z INFORMATYKI

Metody automatyzacji sprawozdawczości w systemie asist. Agnieszka Hołownia-Niedzielska

METODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Tematy dyplomów inżynierskich 2009 Katedra Inżynierii Oprogramowania

CouchDB. Michał Nowikowski

Ekspert MS SQL Server Oferta nr 00/08

Zaawansowane programowanie w języku C++

Tworzenie aplikacji bazodanowych

Specjalizacja magisterska Bazy danych

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Pierwsze wdrożenie SAP BW w firmie

Międzyplatformowy interfejs systemu FOLANessus wykonany przy użyciu biblioteki Qt4

Bazy danych i ich aplikacje

Tematy prac dyplomowych inżynierskich

Integracja systemów transakcyjnych

Katedra Inżynierii Oprogramowania Tematy prac dyplomowych inżynierskich STUDIA NIESTACJONARNE (ZAOCZNE)

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

>>> >>> Ćwiczenie. Cloud computing

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

PLAN WYNIKOWY PROGRAMOWANIE APLIKACJI INTERNETOWYCH. KL III TI 4 godziny tygodniowo (4x30 tygodni =120 godzin ),

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

REFERAT PRACY DYPLOMOWEJ

Spis treści. Przedmowa

WYMAGANIA EDUKACYJNE NA POSZCZEGÓLNE STOPNIE Z INFORMATYKI W KLASIE 8 opracowane na podstawie podręcznika

Organizacja zajęć BAZY DANYCH II WYKŁAD 1. Plan wykładu. SZBD Oracle

Część I Istota analizy biznesowej a Analysis Services

Liczba godzin 1,2 Organizacja zajęć Omówienie programu nauczania 2. Tematyka zajęć

Programowanie obiektowe

OFERTA. w odpowiedzi na zapytanie ofertowe z dnia r.

Migracja do PostgreSQL za pomocą narzędzi Enterprise DB

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Splunk w akcji. Radosław Żak-Brodalko Solutions Architect Linux Polska Sp. z o.o.

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Szkolenie: Jak mieć więcej czasu na wyciąganie wniosków

IBM SPSS Statistics - Essentials for R: Instrukcje instalacji dla Windows

Rok szkolny 2015/16 Sylwester Gieszczyk. Wymagania edukacyjne w technikum. ADMINISTROWANIE BAZAMI DANYCH kl. 4c

CASE STUDIES TEST FACTORY

Tworzenie bazy danych w środowisku OpenOffice.org Base tabela, formularz, kwerenda, raport

Uniwersytet Zielonogórski Instytut Sterowania i Systemów Informatycznych Bazy Danych - Projekt. Zasady przygotowania i oceny projektów

IBM SPSS Statistics - Essentials for R: Instrukcje instalacji dla System Mac OS

Hurtownie Danych i Business Intelligence: przegląd technologii

Architektury i technologie integracji danych

Prezentacja. Global Property. system zarządzania nieruchomościami komercyjnymi

Scenariusz lekcji. scharakteryzować elementy bazy danych; opisać sposób zaprojektowania bazy danych;

Analiza porównawcza wybranych własności systemów zarządzania bazami danych

Krótka Historia. Co to jest NetBeans? Historia. NetBeans Platform NetBeans IDE NetBeans Mobility Pack Zintegrowane moduły. Paczki do NetBeans.

Metody eksploracji danych Laboratorium 2. Weka + Python + regresja

COMARCH DATA WAREHOUSE MANAGER 6.2

OPIS PRZEDMIOTU ZAMÓWIENIA

Korporacyjna Magistrala Usług na przykładzie Mule ESB

Projekty wdrożenia ITS CASE STUDIES

Część II. Zadanie 3.2. (0 3)

IBM SPSS Statistics - Essentials for R: Instrukcje instalacji dla Linux

Kurs ASP.NET ASP.NET CORE APLIKACJE WEBOWE

Standaryzacja danych w projekcie MICORE

Szkolenie: Testowanie wydajności (Performance Testing)

BAZY DANYCH LABORATORIUM. Studia niestacjonarne I stopnia

Szkolenie: Automatyzacja testowania

PLANY DOTYCZĄCE ZAMÓWIEŃ DLA GMIN W ZAKRESIE TWORZENIA ZBIORÓW DANYCH PRZESTRZENNYCH

PRZEWODNIK PO PRZEDMIOCIE

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Dokumentacja projektu QUAIKE Architektura oprogramowania

Hurtownie danych wykład 5

Piotr Bubacz Cloud Computing

nr sprawy: BZP ML Wrocław, dn. 29 stycznia 2014 r. INFORMACJA DLA WYKONAWCÓW NR 6

Opracowanie protokołu komunikacyjnego na potrzeby wymiany informacji w organizacji

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

1. Szczegółowy opis przedmiotu zamówienia

ZAŁĄCZNIK NR 5 - GRUPA PRODUKTÓW 5: OPROGRAMOWANIE BAZODANOWE

Załącznik nr 1 do Zapytania ofertowego: Opis przedmiotu zamówienia

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

PRZEWODNIK PO PRZEDMIOCIE

W A R S Z A W S K A W Y Ż S Z A S Z K O Ł A I N F O R M A T Y K I

Narzędzie do pozyskiwania, analizy i prezentowania informacji.

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

Tematy prac dyplomowych w roku akademickim 2012/2013 zgłoszone w Zakładzie Systemów Rozproszonych

Kielce, dn MICRON Sp. z o.o. Ul. Silniczna 15/ Kielce ZAPYTANIE OFERTOWE NR 1/2014/PARP/POIG

Zajęcia prowadzone przez MCT, auditora wiodącego systemów bezpieczeństwa informacji.

ICD Wprowadzenie. Wprowadzenie. Czym jest In-Circuit Debugger? 2. O poradniku 3. Gdzie szukać dodatkowych informacji? 4

BI: przegląd, ETL, raportowanie i analizy

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

Optymalizacja programów Open Source. Profilery wysokiego poziomu część 2. Krzysztof Lichota

Zamawiający dysponuje szerokim spektrum rozwiązań infrastrukturalnych. Wykonawca uzyska dostęp do infrastruktury w niezbędnym zakresie.

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2013/2014

Szczegółowy opis przedmiotu zamówienia

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Zakres tematyczny dotyczący kursu PHP i MySQL - Podstawy pracy z dynamicznymi stronami internetowymi

Włodzimierz Dąbrowski, Przemysław Kowalczuk, Konrad Markowski. Bazy danych ITA-101. Wersja 1

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Transkrypt:

Tematy projektów Edycja 2019 Robert Wrembel Poznan University of Technology Institute of Computing Science Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Temat 1 Implementacja modelu predykcji w Netezza Założenia: implementacja w R przykładowe modele predykcji random forrest, SVM epsilon regression, SVM nu regression LS-SVM, feedforward neural network, bayesian additive regression trees, bayesian regularized neural networks dane dot. zużycia energii https://trynthink.github.io/buildingsdatasets/show.html?title_ id=long-term-energy-environment-data-for-ornl-researchhouse-3 2

Temat 2 (Santander) Hurtownia danych w chmurze przygotowanie środowiska developerskiego w chmurze na potrzeby hurtowni danych uruchomić Teradata lub Snowflake przygotować bazę danych przygotować i uruchomić mechanizm do przenoszenia schematu i danych do chmury sprawdzenie wydajności rozwiązania opracowanie mechanizmu automatyzacji i skryptów przygotowanie prezentacji i dokumentacji Opiekun: Marcin Kurek (Santander) Uwagi: projekt realizowany w środowisku Santander 3 Temat 3 (Santander) System Snowflake przygotowanie środowiska lokalnego lub chmurowego Snowflake przygotowanie struktur bd załadowanie danych wykonanie testów wydajnościwych rozpoznanie możliwości bazy analiza języka i składni SQL analiza connectorów analiza porównawcza z Teradata (preferowane) lub Oracle przygotowanie prezentacji i dokumentacji Opiekun: tbd (Santander) Uwagi: projekt realizowany w środowisku Santander 4

Temat 4 (Santander) Profilowanie danych w AbInitio zapoznanie się z Ab Initio Data Profiler zapoznanie się i przygotowanie algorytmów do profilowania danych przygotowanie paczek danych testowych profilowanie danych i przetestowanie algorytmów przygotowanie prezentacji i dokumentacji Opiekun: Hubert Półtorak (Santander) Uwagi: projekt realizowany w środowisku Santander 5 Temat 5 (Roche) Profilowanie danych w formacie JSON przygotowanie narzędzia bądź (preferowane) rozwinięciu biblioteki pandas-profiling dla plików w formacie JSON parsowanie JSON wyznaczanie charakterystyk (ich lista do uzgodnienia) wizualizacja minimum to obecny kształt raportu, idealnie rozwiązanie takie jak proponuje Attacama bądź parsery oparte o xml-a (do ustalenia) Opiekun: Fabian Wiktorowski (Roche) Wymagania: laptop z zainstalowanym środowiskiem Python (anaconda) nie jest wymagany dostęp do środowiska Roche L. osób: 4 6

Temat 6 (Roche) Konwersja pliku JSON do postaci tabelarycznej z uwzględnieniem tablic Jsonowych przygotowanie narzędzia/frameworku, które mając zadany plik JSON przygotuje wstępnie zestaw tabel płaskich (relacyjnych) które można zasilić źródłowym JSONem szczególne istotne jest rozparsowanie tabel JSON (Array) Opiekun: Krzysztof Walkiewicz laptop z zainstalowanym środowiskiem Python (anaconda) nie jest wymagany dostęp do środowiska Roche L. osób: 2 7 Temat 7 Ocena narzędzi open-source do profilowania danych przegląd narzędzi wybór narzędzi do testów opracowanie testów wykonanie testów na danych rzeczywistych zanieczyszczenie powietrza w Lombardii (1968-2019) https://dati.lombardia.it/stories/s/auv9-c2sj ocena narzędzi Uwagi należy przetestować top-4 narzędzia L. osób: 4 8

Temat 8 Profilowanie danych w Netezza zainstalowanie emulatora Netezza przygotowanie bazy danych opracowanie zapytań profilujących wykonanie profilowania na danych rzeczywistych zanieczyszczenie powietrza w Lombardii (1968-2019) https://dati.lombardia.it/stories/s/auv9-c2sj w szczególności: min-max czas odczytu danych, z podziałem na lata min-max czas odczytu danych, z podziałem na mierniki wykres czasu pracy poszczególnych mierników w latach Uwagi: implementacja w SQL i j. proceduralnym L. osób: 2 9 Temat 9 (PKO BP) Ocena technik i narzędzi de-duplikacji danych przegląd technik i narzędzi wybór narzędzi open-source do testów opracowanie testów przygotowanie zbioru danych testowych wykonanie testów ocena narzędzi Uwagi należy przetestować top-6 narzędzi L. osób: 6 10

Temat 10 (Kogeneracja Zachód) Ocena algorytmów predykcji zużycia energii analiza istniejących rozwiązań wybór 2 algorytmów do testowania wykonanie testów jakość predykcji wydajność opracowanie wyników Uwagi: impementacja: Python, R,.Net L.osób: 2 11