KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angieskim Obowiązuje od roku akademickiego 015/016 Z-ID-608b Bazy danych typu Big Data Big Data Databases A. USYTUOWANIE MODUŁU W SYSTEMIE STUDIÓW Kierunek studiów Poziom kształcenia Profi studiów Forma i tryb prowadzenia studiów Specjaność Jednostka prowadząca moduł Koordynator modułu Inżynieria danych I stopień Praktyczny Studia stacjonarne Inżynieria zasobów danych Katedra Informatyki i Matematyki Stosowanej Dr hab. Marzena Nowakowska Zatwierdził B. OGÓLNA CHARAKTERYSTYKA PRZEDMIOTU Przynaeżność do grupy/boku przedmiotów Status modułu Język prowadzenia zajęć Usytuowanie modułu w panie studiów - semestr Usytuowanie reaizacji przedmiotu w roku akademickim Wymagania wstępne Egzamin (TAK/NIE) Liczba punktów ECTS 4 Specjanościowy Obowiązkowy Poski Semestr VI Semestr etni Bazy danych, Programowanie baz danych w środowisku RAD, Zarządzanie bazami danych - SQL NIE Forma prowadzenia zajęć Liczba godzin w semestrze wykład w ćwiczenia ć aboratorium 10 30 projekt p inne i 1
C. EFEKTY KSZTAŁCENIA I METODY SPRAWDZANIA EFEKTÓW KSZTAŁCENIA Ce modułu Zapoznanie z kuczowymi technoogiami informatycznymi stosowanymi do składowania, przetwarzania i anaizowania dużych zbiorów danych typu Big data. Nabycie praktycznych umiejętności w zakresie budowania prostych apikacji anaitycznych na patformach typu Big Data oraz stosowania podstawowych narzędzi do wizuaizacji dużych zbiorów danych. Symbo efektu W_01 Efekty kształcenia Student ma podstawową wiedzę na temat środowisk programistycznych używanych do budowy rozproszonych baz danych i przetwarzania rozproszonego danych. Forma prowadzenia zajęć w kierunkowych K_W1 K_W13 obszarowych T1P_W04 T1P_W06 T1P_W07 X1P_W04 inzp_w01 inzp_w0 inzp_w03 inzp_w04 W_0 U_01 U_0 U_03 K_01 Student ma wiedzę na temat narzędzi programowych do wizuaizacji danych. Student potrafi pozyskiwać informacje z artykułów naukowych, podręczników i opracowań dotyczących technoogii typu Big Data oraz integrować uzyskane informacje w ceu dokonania ich interpretacji i oceny, a także wyciągać wnioski oraz formułować i uzasadniać opinie. Student potrafi posługiwać się narzędziami programowymi do wizuaizacji dużych zbiorów danych. Student potrafi posługiwać się patformami programistycznymi do budowy rozproszonych baz danych i przetwarzania rozproszonego danych, potrafi dobrać odpowiednie narzędzia programistyczne do zadanego probemu. Ma świadomość odpowiedzianości za pracę własną oraz gotowość podporządkowania się zasadom pracy w zespoe i ponoszenia odpowiedzianości za wspónie reaizowane zadania Rozumie potrzebę ciągłego doskonaenia i podnoszenia kompetencji zawodowych. K_W13 K_U01 K_U06 K_U1 K_U09 K_K04 w, K_K01 T1P_W04 T1P_W06 X1P_W04 inzp_w01 inzp_w0 inzp_w03 T1P_U01 T1P_U03 T1P_U06 X1P_U07 T1P_U05 T1P_U08 T1P_U09 T1P_U13 T1P_U16 inzp_u0 inzp_u07 T1P_U14 T1P_U15 T1P_U16 T1P_U17 inzp_u06 inzp_u07 inzp_u08 T1P_K03 T1P_K04 X1P_K0 InzP_K0 T1P_K01 X1P_K01 X1P_K05 InzP_K01 InzP_K0
Treści kształcenia 1. Treści kształcenia w zakresie wykładu Nr wykładu 1 3-4 5 Treści kształcenia Wprowadzenie do Big Data Źródła danych masowych. Nowe technoogie i trendy w przetwarzaniu danych masowych. Perspektywy anaiz biznesowych z wykorzystaniem danych masowych. Wstępne przetwarzanie danych Znaczenie jakości danych. Oczyszczanie i standaryzacja danych. Podstawowe techniki i narzędzia. Wizuaizacja danych. Wprowadzenie do przetwarzania rozproszonego Obiczenia rozproszone jako szczegóny przypadek obiczeń równoegłych. Mode programowania map-reduce. Projekt Apache Hadoop jako wona (open source) impementacja paradygmatu map-reduce. Stos programowy Hadoop a. Hadoop MapReduce: cechy, interfejsy, przykłady zadań typu map i reduce. Zarządzanie przetwarzaniem danych Piki wsadowe, potoki danych, zarządzanie cykami zadań przetwarzania wsadowego na patformie Hadoop. Dane ustrukturyzowane a dane semistrukturane. Ograniczenia reacyjnych baz danych w przetwarzaniu danych typu Big Data. Hbase - impementacja rozproszonej bazy danych typu NoSQL na patformie Hadoop. Architektura i właściwości. kształcenia da modułu W_01, W_01, W_0, W_01, W_0 W_01, W_0. Treści kształcenia w zakresie ćwiczeń. 3. Treści kształcenia w zakresie zadań aboratoryjnych. Nr ab. Treści kształcenia 1 Wstępna anaiza danych. Czyszczenie danych. Ćwiczenia praktyczne. 3 4 Standaryzacja danych. Wizuaizacja danych da ceów raportowania anaitycznego. Ćwiczenia praktyczne. Rozproszony systemu pików na patformie Hadoop (Hadoop Distributed Fie System - HDFS). Cechy, dostęp, architektura. Ćwiczenia praktyczne. Hadoop MapReduce: interfejsy użytkownika i konfiguracja. Ćwiczenia praktyczne. 5-6 Hadoop MapReduce: programowanie. Ćwiczenia praktyczne. Zarządzanie kastrem Apache Hadoop. Typy instaacji. Instaacja wybranej 7 dystrybucji. Konfiguracja. Formatowanie HDFS. Uruchomienie. Podłączanie do HBase za pomoca Java API. Ćwiczenia praktyczne w pisaniu prostych apikacji da HBase. 8-9 Programowanie zadań przetwarzania potokowego z użyciem języka Pig 9-10 Latin. Ćwiczenia praktyczne w programowaniu operacji typu agregowanie, fitrowanie, sortowanie, łączenie danych. System magazynu danych Hive. Architektura i właściwości. Ćwiczenia 11-1 praktyczne w tworzeniu zapytań i programowaniu zadań MapReduce w języku HivQL. Integracja systemu SAS z patformą Hadoop. Ładowanie danych z HDFS. 13-14 Wizuaizacja dużych zbiorów danych. 15 Kookwium zaiczeniowe. kształcenia da modułu U_01, U_0, U_03, K_01, U_01, U_0, U_03, K_01, 3
4. Charakterystyka zadań projektowych. 5. Charakterystyka zadań w ramach innych typów zajęć dydaktycznych. Metody sprawdzania efektów kształcenia Symbo efektu W_01 W_0 U_01 U_0 U_03 K_01 Metody sprawdzania efektów kształcenia (sposób sprawdzenia, w tym da umiejętności odwołanie do konkretnych zadań projektowych, aboratoryjnych, itp.) Kookwium zaiczeniowe w formie testu. Zadanie do samodzienego wykonania w grupie, dyskusja na ćwiczeniach aboratoryjnych. Kookwium zaiczeniowe w formie testu. Zadanie do samodzienego wykonania w grupie, dyskusja na ćwiczeniach aboratoryjnych. Zadanie do samodzienego wykonania w grupie, dyskusja na ćwiczeniach aboratoryjnych. Zadanie do samodzienego wykonania w grupie, dyskusja na ćwiczeniach aboratoryjnych. Zadanie do samodzienego wykonania w grupie, dyskusja na ćwiczeniach aboratoryjnych. Zadanie do samodzienego wykonania w grupie, dyskusja na ćwiczeniach aboratoryjnych. 4
D. NAKŁAD PRACY STUDENTA Bians punktów ECTS Lp. Rodzaj aktywności Obciążenie studenta Jednostka 1. Udział w wykładach 10 h. Udział w ćwiczeniach 3. Udział w aboratoriach 30 h 4. Udział w zajęciach projektowych 5. Udział w konsutacjach (-3 razy w semestrze) 5 h 6. Konsutacje projektowe 7. Udział w egzaminie 8. 9. Liczba godzin reaizowanych przy bezpośrednim udziae nauczyciea akademickiego 45 h Liczba punktów ECTS, którą student uzyskuje na zajęciach 10. wymagających bezpośredniego udziału nauczyciea akademickiego 1,7 ECTS (1 punkt ECTS=7 godzin obciążenia studenta) 11. Samodziene studiowanie tematyki wykładów 6 h 1. Samodziene przygotowanie się do ćwiczeń 13. Samodziene przygotowanie się do kookwiów 10 h 14. Samodziene przygotowanie się do aboratoriów 16 h 15. Wykonanie sprawozdań 18 h 16. Przygotowanie do kookwium końcowego z aboratorium 1 h 17. Wykonanie projektu ub dokumentacji 18. Przygotowanie do egzaminu 19. 0. Liczba godzin samodzienej pracy studenta 6 h Liczba punktów ECTS, którą student uzyskuje w ramach 1. samodzienej pracy,3 ECTS (1 punkt ECTS=7 godzin obciążenia studenta). Sumaryczne obciążenie pracą studenta 107 h 3. Punkty ECTS za moduł 1 punkt ECTS=7 godzin obciążenia studenta 4 ECTS 4. 5. Nakład pracy związany z zajęciami o charakterze praktycznym Suma godzin związanych z zajęciami praktycznymi Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym 1 punkt ECTS=7 godzin obciążenia studenta E. LITERATURA Wykaz iteratury Witryna WWW modułu/przedmiotu 91 h 3,4 ECTS 1. Caprioo E., Programming Hive, O Reiy 01, ISBN 978-1449319335.. George L., HBase: The Definitive Guide, O Reiy 011, ISBN 978-1449396107 3. Russe J., Zwinna anaiza danych. Apache Hadoop da każdego, Heion, Katowice 015, ISBN 978834699445. 4. Summer E., Hadoop operations, O Reiy 01, ISBN 978-144937057. 5. The Apache Software Foundation [onine]. URL: apache.org. 5