Informacje organizacyjne:
|
|
- Karolina Marszałek
- 6 lat temu
- Przeglądów:
Transkrypt
1 Informacje organizacyjne: 1. Zaliczenie przedmiotu zostanie przeprowadzone w formie testu, z którego będzie można zdobyć maksymalnie 100 punktów. Skala ocen: punktów: punktów: punktów: 3, punktów: punktów: 4, punktów: 5 2. Symbol oznacza listę wyboru, w której należy zaznaczyć tylko JEDNĄ PRAWIDŁOWĄ odpowiedź. Zaznaczenie odpowiedzi prawidłowej = 1 punkt. Zaznaczenie odpowiedzi nieprawidłowej lub zaznaczenie kilku odpowiedzi = 0 punktów. 3. Symbol oznacza listę wyboru, w której należy zaznaczyć WSZYSTKIE PRAWIDŁOWE odpowiedzi. Punktacja jest obliczana na podstawie wzoru = MAX(0, 3*(liczba_zaznaczonych_odpowiedzi_prawidłowych - 2*liczba_zaznaczonych_odpowiedzi_nieprawidłowych ) / liczba_odpowiedzi_prawidłowych ). Za zadanie można otrzymać od 0 do 3 punktów. Przykładowe pytania (i listy odpowiedzi): Dokończyć zdanie: Problem Big data... dotyczy jedynie najniższego (systemowego)poziomu przetwarzania danych. dotyczy jedynie przetwarzania danych na poziomie aplikacji analitycznych. dotyczy wszystkich poziomów przetwarzania, od systemowego, do aplikacyjnego. dotyczy innych technologii informatycznych, niż przetwarzanie danych. Dlaczego rozwiązywanie problemu Big data stało się obecnie naglącą koniecznością? Ponieważ wcześniej nie było tak obszernych masywów danych. Ponieważ wcześniej nie było zaawansowanych technologii. Ponieważ wcześniej nie istniały tak bogate źródła interesujących informacji analitycznych o odpowiedniej objętości, płynności i różnorodnych postaciach. Ponieważ nikt wcześniej nie wpadł na ten pomysł. Dokończyć zdanie: Informacje typu Open data... są synonimem określenia Big Data. stanowią podzbiór danych Big Data. są danymi dostępnymi powszechne i bez ograniczeń. są zbiorem danych powiązanych w formacie RDF (Resource Description Framework) Co oznacza określenie Veracity : Dane, które jednocześnie spełniają trzy podstawowe kryteria wielkości ( Volume, Variety, Velocity ). Dane, generowane przez administracje miast city, które spełniają dwa podstawowe kryteria wielkości ( Velocity, Variety ). Poziom ufności - przekonania o prawidłowości danych. (tzn. że nie zawierają błędów) Żadne z powyższych.
2 Co oznacza określenie 3V : Vast, Velocity, Veracity Variable, Veracity, Velocity Volume, Variety, Velocity Volume Variety Veracity Dlaczego istniejące technologie relacyjnych baz danych nie sprawdzają się w przetwarzaniu zbiorów typu Big Data : Ponieważ mają różne typy danych Ponieważ dane nie są stale dostępne. Ponieważ nie są wystarczająco szybkie. Ponieważ nie radzą sobie z tak dużą różnorodnością objętości i zmiennością danych. Jaki podstawowy format danych jest odczytywany i generowany przez funkcje modelu przetwarzania MapReduce: Key/Value format. Text format. Graph format. XML format Jak wygląda typowy klaster HDFS: Jeden węzeł Namenode i zbiór węzłów Datanode. Jeden węzeł Namenode i jeden węzeł Datanode. Jeden węzeł JobTracker i jeden węzeł TaskTracker Jeden węzeł JobTracker i zbiór węzłów TaskTracker. Jaką funkcję w systemie MapReduce v2 (MR2) pełni węzeł YARN ResourceManager: JobTracker. TaskTracker. Datanode. namenode. Które stwierdzenia dotyczące Apache Spark są prawdziwe: Spark przechowuje i przetwarza dane w zbiorach rozproszonych, przechowywanych w pamięci operacyjnej komputerów klastra, nazywanych Resilient Distributed Datasets (RDD). Spark jest szybszy niż Hadoop Spark SQL wykorzystuje interfejs i bazę metadanych serwera Hive Biblioteka GraphX wykorzystuje Resilient Distributed Datasets (RDD) do przetwarzania danych graficznych Firma Krzak musi na bieżąco (online) obsługiwać zamówienia, które są przysyłane co kilka sekund. Chociaż zbiory zamówień są względnie małe i posiadają stałą strukturę, to jednak mamy tu do czynienia z problemem typu "Big Data". Dlaczego? Zamówienia charakteryzuje wysoka wartość Velocity -prędkości przyjmowania. Zamówienia charakteryzuje wysoka wartość Variety -różnorodności formatów. Zamówienia charakteryzuje wysoka wartość Volume -objętości danych. To nie jest problem typu Big Data, bo nie występują wszystkie trzy 'V' jednocześnie. Jakiego narzędzia używa Google do przechowywania danych podczas katalogowania Internetu? Bigtable Hadoop Distributed File System MapReduce
3 Jakiej wielkości jest typowy klaster Hadoop? Megabajty Gigabajty Terabajty Petabajty / exabajty Co jest akronimem nazwy grupy urządzeń, połączonych przez Internet, które automatycznie przesyłają dane, rejestrowane przez posiadane czujniki? SQL IoT ETL Co oznacza skrót 3V w przypadku systemów Big Data? Variation, Value, Visualization Volume, Value, Vertex Visualization, velocity, Virtual Velocity, Variety, Volume Administrujesz bazą danych w szpitalu. Twoja baza zawiera zbiory badań RTG pacjentów, roszczeń ubezpieczeniowych i danych płacowych. Każdy zbiór posiada odmienne struktury i formaty. Do której grupy zaliczysz swoją bazę? Wysoka wartość prędkości przepływu -Velocity Wysoka różnorodność -Variety Wysoka objętość -Volume Wysokie wartości -Value Jaka cecha systemu plików GFS (Google File System) umożliwia rozwiązywanie problemów klasy Big Data? Normalizuje dane do postaci wspólnego typu. Przyspiesza dane w celu skrócenia czasu zasilania bazy. Dzieli dane na fragmenty, umożliwiające sprawne przetwarzanie. Kompresuje dana do mniejszej objętości. Który typ danych jest niestrukturalny ( unstructured)? Plik Video Plik JSON Plik CSV Tabela Parquet Które typy danych są strukturalne (structured)? Plik Video Plik JSON Plik CSV Tabela Parquet Który typ danych jest semistrukturalny (semi-structured)? Plik Video Plik JSON Plik CSV Tabela Parquet
4 Co oznacza skrót ETL? Estimated Time to Load Escape Tabulate Log Extract Transform Load Explain Table Logs Które zadania wykonuje Administrator Systemu? Normalizacja danych dla algorytmów ML Instalowanie nowych programów dla potrzeb pracowników organizacji Tworzenie infografik i innych prezentacji Wdrażanie protokołów bezpieczeństwa baz danych Które zadania wykonuje Deweloper? Budowanie i testowanie nowych aplikacji zasilania danych. Instalowanie i konfigurowanie baz danych. Przeszukiwanie danych (Querying) w celu znajdowania korelacji. Utrzymanie i aktualizowanie bibliotek oprogramowania. Które zadania wykonuje Analityk Danych? Pisze skrypty do automatyzacji procesu ETL. Przewiduje zachowanie klientów przy pomocy algorytmów ML. Prezentuje złożone informacje przy pomocy wykresów kołowych. Nadaje uprawnienia systemowe dla nowych pracowników. Analiza różnorodności (Variety) danych, przed rozpoczęciem nowego projektu, służy do? planowania wielkości potrzebnej przestrzeni danych. planowania procesów ETL. podjęcia decyzji o potrzebie przetwarzanie w czasie rzeczywistym (real-time processing). podjęcia decyzji o potrzebie rozdzielania (split) lub próbkowania (sample) danych. Analiza prędkości (Velocity) danych, przed rozpoczęciem nowego projektu, służy do? podjęcia decyzji czy wymagane jest przetwarzanie w czasie rzeczywistym (real-time processing). planowania wielkości potrzebnej przestrzeni danych. planowania procesów ETL podjęcia decyzji o potrzebie rozdzielania (split) lub próbkowania (sample) danych. Kto jest odpowiedzialny za programowanie procesów zasilania i wstępnego przetwarzania danych? Deweloper/Programista Administrator Analityk danych Architekt danych Kto jest odpowiedzialny za planowanie odzyskiwania danych po awarii? Analityk danych Architekt danych Administrator Deweloper/Programista Kto jest odpowiedzialny za pozyskiwanie wiedzy biznesowej z danych? Architekt danych Administrator Analityk danych Deweloper/Programista
5 Rozproszone systemy plików typu HDFS różnią się od lokalnych systemów plików, takich jak FAT lub NTFS, bo? nie używają fizycznych nośników danych, bowiem znajdują się w chmurze. automatycznie replikują dane w celu uzyskania odporności na uszkodzenia. dzielą dane na małe fragmenty i rozpraszają w systemie. umożliwiają jedynie odczyt danych, w celu zabezpieczenia przed błędami popełnianymi przez użytkowników podczas zapisu. Jaka domyślna operacja jest wykonywana automatycznie podczas zapisu pliku w HDFS? Kompresja Kopia lustrzana (Mirroring) Replikacja Migawki (Snapshots) Jaka jest prawidłowa kolejność faz procesu MapReduce? Map, Split, Reduce Map, Shuffle, Reduce Split, Map, Reduce Shuffle, Map, Reduce W jakim celu tworzy sie lustrzane kopie danych w chmurze (cloud mirrors)? Dla ochrony przed kradzieżą lub zniszczeniem. W celu uzyskania mniejszego opóźnienia w sieci. W celu uzyskania krótszego czasu przetwarzania. W celu zapewnienia większej przestrzeni dyskowej. W jaki sposób najlepiej zabezpieczyć system przed skutkami takich błędów użytkowników, jak przypadkowe skasowanie danych? Regularnie wykonywać kopie przyrostowe (incremental backups). Zamontować dodatkowe dyski z macierzy RAID. Skonfigurować dyski do pracy lustrzanej (local mirror). Regularnie wykonywać kopię bieżącego obrazu dysku na zdalnym nośniku. Jaka domyślna liczba replikacji bloku danych w HDFS? 2 3 Nie ma wartości domniemanej, trzeba ją definiować każdorazowo podczas zapisu pliku. 5 Plan rozmieszczenia dysków komputerów, osprzętu i szaf serwerowych w klastrze jest przykładem? Topologii logicznej Topologii fizycznej Współczynnika replikacji Lokalnego systemu plików Drugim etapem szablonu MapReduce jest? Shuffle Split Reduce Partition
6 Jaka jest podstawowa korzyść z dzielenia plików na bloki danych(splitting) przez MapReduce.? Równoległe przetwarzanie rozległych masywów danych. Stosowanie wysokiego współczynnika replikacji zapewnia ochronę danych przed zniszczeniem. Agregacja mniejszych bloków danych generuje mniejsze opóźnienia (latency) Używanie małych bloków danych umożliwia uzyskanie wysokich wartości prędkości danych (Velocity). Co to jest Hadoop Ecosystem? Metoda generowania prognoz (predictions) na podstawie danych. Metoda organizowania danych na platformie. Zbiór narzędzi do zasilania (ingesting) i przetwarzania (processing) danych. Zbiór narzędzi do bardziej efektywnego wykonywania Mapreduce. Które narzędzie Hadoop Ecosystem jest zwykle wykorzystywane do wczytywania plików logów do systemu Hadooop? Flume Oozie YARN Sqoop Które narzędzie Hadoop Ecosystem jest zwykle wykorzystywane do iteracyjnego przetwarzania danych? Pig Oozie HBase Spark Jaka funkcjonalność daje przewagę Apache Drill względem Apache Hive? Drill współpracuje z HDFS, podczas gdy Hive nie. Drill jest kompatybilne z ANSI-SQL, podczas gdy Hive nie. Drill wykorzystuje Mapreduce, podczas gdy Hive nie. Drill jest nowszą technologią, podczas gdy Hive nie jest już wspierane. Dlaczego Hadoop Ecosystem zawiera tak wiele komponentów? W celu zapewnienia obsługi wielką różnorodność (Variety) źródeł i typów danych. Żeby umożliwić sprawne przechowanie rozległych masywów danych (Volume). W celu zapewnienia wymaganej prędkości (Velocity) przetwarzania danych. Wszystkie, powyższe powody. Które narzędzie Hadoop Ecosystem jest wykorzystywane do organizacji i administrowania przepływem pracy (workflows) w Hadooop.? Apache Pig Apache Machout Apache Flume Apache Oozie Co daje przewagę Apache Spark w stosunku do standardowego szablonu MapReduce? Buforowanie danych w RAM jest szybsze niż odczyt/zapis w HDFS. Przenoszenie danych pomiędzy zewnętrznymi magazynami (data stores). Posiadanie własnego języka skryptowego, który ułatwia pisanie zadań MapReduce. Jest łatwiejszy do nauki z powodu zgodności z ANSI-SQL.
7 Które z narzędzi Hadoop Ecosystem jest zgodne z ANSI-SQL? Apache Drill Apache Hive Apache HBase Apache Spark Hadoop Hurtowni Danych? Wczytuje i przechowuje dane źródłowe w ich oryginalnych -pierwotnych formatach. W krótkim czasie Hadoop całkowicie zastąpi repozytoria relacyjne, jako nowocześniejsza i tańsza alternatywa. Dzięki HDFS dostarcza większą i tańszą przestrzeń do przechowywania danych żródłowych. Umożliwia zachowanie do późniejszego wykorzystania danych źródłowych, po zakończeniu procesu ETL, zamiast ich niszczenia, które występuje w typowych systemach DWH. Jaka jest pozytywna cecha migracji danych z tradycyjnego środowiska DWH (relacyjnego - opartego na SQL), do klastra Hadoop Ecosystem? Hadoop automatycznie skonwertuje wszystkie dane do formatu SQL. Hadoop pozwoli analitykom i deweloperom, na wykorzystanie wcześniej stworzonego oprogramowania. Hadoop przechowa jedynie dane czyste (clean), wymuszając skasowanie starych plików. Hadoop zmniejszy koszty systemu, przez ograniczenie maksymalnego rozmiaru plików. Dlaczego Hadoop Ecosystem stanowi efektywną platformę do przechwytywania i analizowania danych z logów.? Hadoop umożliwia wczytywanie różnorodnych danych wejściowych. Hadoop umożliwia tanie składowanie surowych danych źródłowych (ang. raw data). Hadoop dostarcza wiele metod i algorytmów przetwarzania danych. Które narzędzia z Hadoop Ecosystem mogą być wykorzystane do zasilania systemu DWH.? Apache Zookeeper Apache pig Apache Flume Apache Mahout Które narzędzia z Hadoop Ecosystem mogą być wykorzystane do eksploracji nieznanych plików logów.? Apache ZooKeeper Apache Flume Apache Mahout Apache Drill Czy uważasz, że przedstawiony poniżej relacyjny system informacyjny (baza danych i oprogramowanie), kwalifikuje się do konwersji na Hadoop Ecosystem? Scenariusz: a) Posiadasz bazę danych o wielkości 500 GB b) Wielkość bazy nie wzrosła drastycznie w czasie minionych 6 miesięcy. c) Prognozy nie przewidują drastycznego wzrostu wielkości bazy w przyszłości. TAK NIE
8 Skoro Hadoop jest systemem o dostępie wsadowym (ang. batch), czy zasadna będzie zatem konwersja systemu i wsparcie relacyjnej bazy danych MySQL przy pomocy bazy typu NoSQL? Opis problemu: a) Z uwagi na szybko powiększającą się objętość bazy danych i drastyczne obniżenie wydajności przetwarzania informacji, poproszono Cię o wykonanie re-inżynierii systemu sklepu internetowego, który obecnie oparty jest na serwerze MySQL ( czyli system raczej nisko budżetowy). b) Portal sklepu internetowego nieprzerwanie pobiera dane z bazy MySQL i generuje w niej nowe rekordy informacyjne. c) Po przebudowie portalu, obsługa klientów powinna być sprawna i płynna, niezależnie od stale powiększającej się objętości bazy i rosnącej liczby jednoczesnych użytkowników. TAK NIE Czy zainstalowanie dodatkowych serwerów bazy danych rozwiąże problem? Opis problemu: a) Wykonanie zadania ETL, w systemie opartym na serwerze RDBMS Oracle, zajmuje 2 godziny. b) Użytkownicy biznesowi wymagają od Ciebie zmniejszenia czasu wykonania tego zadania do 1 godziny. TAK NIE Dlaczego w systemie plików HDFS nie używa się dysków stałych (SSD) w celu zmniejszenia czasu dostępu do danych? Dyski SSD są mało wiarygodne Dyski SSD są drogie Dyski SSD są niskiej jakości Jak zrealizujesz ochronę przed przed utratą danych w klastrze? Przy pomocy replikacji bloków danych w kilku różnych węzłach klastra. Nie jest możliwe zabezpieczenie przed utratą danych w klastrze. Co stanie sią z lokalnym systemem plików komputera, po zainstalowaniu HDFS? Lokalny system plików będzie współistniał z HDFS. Lokalny system plików zostanie zastąpiony przez HDFS. Jaka jest najlepsza metoda rozwiązania problemu? W sytuacji, gdy programy działające w wielu węzłach klastra żądają dostępu do zdalnych danych, następuje zablokowanie sieci i drastyczne spowolnienie transferu danych. Zwiększenie przepustowości sieci Przechowywanie danych w tych samych węzłach klastra, w których odbywa się ich przetwarzanie. Do czego potrzebny jest HDFS, jeżeli tradycyjne systemy plików są w stanie przechowywać pliki wielkości exabajtów? Tradycyjne systemy plików są zawodne. Tradycyjne systemy plików nie nadają się do rozproszonego przetwarzania danych. Które polecenie systemu HDFS służy do kontroli lokalizacji i prawidłowości przechowywania bloków danych? chmod fsck
9 Namenode aktualizuje mapę lokalizacji bloków danych na lokalnym dysku. PRAWDA KŁAMSTWO Który parametr służy do zmiany współczynnika replikacji bloków danych podczas zapisu pliku w HDFS? dfs.update.replica dfs.replication changereplicationfactor Który węzeł jest ważniejszy w klastrze HDFS? Namenode Datanode Zaznacz twierdzenia prawidłowe? HBase jest bazą typu kolumnowego. MongoDB jest wysoko skalowalną bazą typu klucz-wartość. Neo4J posiada format grafu. Redis jest bazą typu kolumnowego. Szablon (framework) Akka jest: Szablonem opartym na metodzie agentowej. Szablonem bazującym na aktorach. Szablonem silnie rozproszonym. API języka Java W HDFS plik jest dzielony na bloki o stałym rozmiarze plik jest dzielony na bloki o różnych rozmiarach bloki są replikowane przynajmniej trzy razy bloki są replikowane przynajmniej jeden raz SPARK Resilient Distributed Datasets (RDDs) są przechowywane w HDFS są przechowywane lokalnie w pamięciach RAM węzłów klastra pozwalają aplikacjom na przechowywanie rozproszonych zbiorów danych w pamięciach RAM węzłów klastra automatycznie odtwarzają partycje utracone w wyniku awarii Zaznacz prawidłowe twierdzenia o HBase? HBase działa w oparciu o system plików HDFS HBase działa w oparciu o Resilient Distributed Datasets HBase umożliwia swobodny dostęp (random access) do zasobów Big Data HTable może dowolnie powiększać objętość, bowiem jest dzielona na wiele HRegions Systemy NoSQL Są wykorzystywane WYŁĄCZNIE do przetwarzania danych niestrukturalnych (unstructured). Nie obsługują funkcji Strukturalnego Języka Zapytań (SQL). Umożliwiają szybszy dostęp do informacji niż relacyjna baza danych (RDBMS). Są użyteczne do zarządzania rozległymi zbiorami rozproszonych danych.
10 Który system jest otwartą wersją (open-source) patentu MapReduce Google'a? Hive Cassandra Hadoop? MongoDB System Big Data może być zdefiniowany przy pomocy trzech kluczowych parametrów, których nazwy rozpoczynają się od litery 'V'. Która z przedstawionych poniżej nazw nie jest parametrem określającym system Big Data? Value Volume Velocity Variety Co to jest Hadoop? Rozproszony system plików. Platforma SaaS, udostępniająca dane typu Big Data w postaci serwisu. Kolekcja technologii, umożliwiających przetwarzanie informacji typu Big Data. Projekt Apache, dedykowany do danych o wysokiej dostępności i krytycznym znaczeniu. Co oznacza NoSQL? None or SQL No SQL Never Open SQL Not Only SQL Który system NIE JEST przykładem bazy NoSQL? Column Store Relational Document Store Key-Value Hadoop jest strukturą (framework), zbudowaną z wielu powiązanych narzędzi. Do podstawowego zestawu należą: MapReduce, Hive, HBase MapReduce, MySQL, Google Apps MapReduce, Hummer, Iguana MapReduce, Heron, Trumpet Jaka jest domniemana wielkość bloku w systemie plików HDFS? 512 bytes 64 MB 1024 KB Żadne z powyższych. Czym jest Mongo DB? document database graph database key-value store relational database
11 HBase jest bazą dokumentów. bazą o strukturze kolumnowej (column-oriented) składnicą typu klucz-wartość (key-value store). bazą relacyjną. Co oznacza pojęcie otwartych danych (Open Data)? Big Data Linked Data Dane RDF udostępniane przez instytucje administracji publicznej. Dane dostępne powszechnie I nieodpłatnie. W systemie plików HDFS dane są podzielone na Bloki o wielkości definiowanej przez użytkownika. Bloki o różnych wielkościach. Zbiór bloków zrównoważonych. Stałą liczbę bloków.
Wprowadzenie do Hurtowni Danych
Wprowadzenie do Hurtowni Danych BIG DATA Definicja Big Data Big Data definiowane jest jako składowanie zbiorów danych o tak dużej złożoności i ilości danych, że jest to niemożliwe przy zastosowaniu podejścia
Bardziej szczegółowoProjektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family
Kod szkolenia: Tytuł szkolenia: HADOOP Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family Dni: 5 Opis: Adresaci szkolenia: Szkolenie jest adresowane do programistów, architektów oraz
Bardziej szczegółowoOrganizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)
Big Data Organizacyjnie Prowadzący: dr Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl (hasło: BIG) Automatyzacja Automatyzacja przetwarzania: Apache NiFi Źródło: nifi.apache.org 4 Automatyzacja
Bardziej szczegółowoHadoop i Spark. Mariusz Rafało
Hadoop i Spark Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl WPROWADZENIE DO EKOSYSTEMU APACHE HADOOP Czym jest Hadoop Platforma służąca przetwarzaniu rozproszonemu dużych zbiorów danych. Jest
Bardziej szczegółowoOrganizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)
Big Data Organizacyjnie Prowadzący: dr Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl (hasło: BIG) Zaliczenie: Praca na zajęciach Egzamin Projekt/esej zaliczeniowy Plan zajęć # TEMATYKA ZAJĘĆ
Bardziej szczegółowoWprowadzenie do Apache Spark. Jakub Toczek
Wprowadzenie do Apache Spark Jakub Toczek Epoka informacyjna MapReduce MapReduce Apache Hadoop narodziny w 2006 roku z Apache Nutch open source składa się z systemu plików HDFS i silnika MapReduce napisany
Bardziej szczegółowoOrganizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)
Big Data Organizacyjnie Prowadzący: dr Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl (hasło: BIG) Data Camp Architektura Data Lake Repozytorium służące składowaniu i przetwarzaniu danych o
Bardziej szczegółowoProjektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family
Kod szkolenia: Tytuł szkolenia: HADOOP Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family Dni: 5 Partner merytoryczny Opis: Adresaci szkolenia: Szkolenie jest adresowane do programistów,
Bardziej szczegółowoHbase, Hive i BigSQL
Hbase, Hive i BigSQL str. 1 Agenda 1. NOSQL a HBase 2. Architektura HBase 3. Demo HBase 4. Po co Hive? 5. Apache Hive 6. Demo hive 7. BigSQL 1 HBase Jest to rozproszona trwała posortowana wielowymiarowa
Bardziej szczegółowoOrganizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)
Big Data Organizacyjnie Prowadzący: dr Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl (hasło: BIG) DANE W CZASIE RZECZYWISTYM 3 Tryb analizowania danych 4 Okno analizowania 5 Real-time: Checkpointing
Bardziej szczegółowoHadoop : kompletny przewodnik : analiza i przechowywanie danych / Tom White. Gliwice, cop Spis treści
Hadoop : kompletny przewodnik : analiza i przechowywanie danych / Tom White. Gliwice, cop. 2016 Spis treści Przedmowa 17 Wprowadzenie 19 Kwestie porządkowe 20 Co nowego znajdziesz w wydaniu czwartym? 20
Bardziej szczegółowoDni: 2. Partner merytoryczny. Opis: Adresaci szkolenia
Kod szkolenia: Tytuł szkolenia: BIGDATA/STR Strumieniowe przetwarzanie Big Data Dni: 2 Partner merytoryczny Opis: Adresaci szkolenia Szkolenie jest przeznaczone głównie dla programistów i analityków danych,
Bardziej szczegółowoHurtownie danych wykład 5
Hurtownie danych wykład 5 dr Sebastian Zając SGH Warszawa 7 lutego 2017 1 Współbieżność i integracja Niezgodność impedancji 2 bazy danych Współbieżność i integracja Niezgodność impedancji Bazy relacyjne
Bardziej szczegółowoArchitektura rozproszonych magazynów danych
Big data Big data, large data cloud. Rozwiązania nastawione na zastosowanie w wielkoskalowych serwisach, np. webowych. Stosowane przez Google, Facebook, itd. Architektura rozproszonych magazynów danych
Bardziej szczegółowoCZĘŚĆ I. WARSTWA PRZETWARZANIA WSADOWEGO
Spis treści Przedmowa Podziękowania O książce Rozdział 1. Nowy paradygmat dla Big Data 1.1. Zawartość książki 1.2. Skalowanie tradycyjnej bazy danych 1.2.1. Skalowanie za pomocą kolejki 1.2.2. Skalowanie
Bardziej szczegółowoPrzetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24
Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24 Agenda Serp24 NoSQL Integracja z CMS Drupal Przetwarzanie danych Podsumowanie Serp24 Darmowe narzędzie Ułatwia planowanie
Bardziej szczegółowoOracle Log Analytics Cloud Service
ORACLE DANE TECHNICZNE Zastrzeżenie: Niniejszy dokument służy wyłącznie celom informacyjnym. Nie stanowi on zobowiązania do dostarczenia żadnych materiałów, kodu ani funkcjonalności i nie należy go brać
Bardziej szczegółowoBig Data to skalowalność i prostota obsługi wielkich ilości danych!
Obsługa aplikacji, które operują na ogromnych zbiorach danych, czyli na przykład portali społecznościowych, przekracza możliwości zwykłych relacyjnych baz. Praca ze złożonymi zbiorami danych wymaga architektury
Bardziej szczegółowoNarzędzia i trendy Big Data
Narzędzia i trendy Big Data 1 Zamiast wstępu Model relacyjny 1970: podwaliny teoretyczne modelu 1980: SQL hype 1990: upowszechnienie standardu i narzędzi Model map-reduce 1995: koncepcja przetwarzania
Bardziej szczegółowoSzkolenie: Jak mieć więcej czasu na wyciąganie wniosków
Szkolenie: Jak mieć więcej czasu na wyciąganie wniosków 14 listopada 2018 r 8:45-12:45 Warszawa https://alterdata.evenea.pl "Dzisiaj praca analityka składa się w 15% z analizowania. Cała reszta czynności
Bardziej szczegółowoHurtownie danych - przegląd technologii
Hurtownie danych - przegląd technologii Problematyka zasilania hurtowni danych - Oracle Data Integrator Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel
Bardziej szczegółowoWprowadzenie do technologii Business Intelligence i hurtowni danych
Wprowadzenie do technologii Business Intelligence i hurtowni danych 1 Plan rozdziału 2 Wprowadzenie do Business Intelligence Hurtownie danych Produkty Oracle dla Business Intelligence Business Intelligence
Bardziej szczegółowo*Grafomania z. Neo4j. Praktyczne wprowadzenie do grafowej bazy danych.
*Grafomania z Neo4j Praktyczne wprowadzenie do grafowej bazy danych. Jak zamodelować relacyjną bazę danych reprezentującą następujący fragment rzeczywistości: Serwis WWW opisuje pracowników różnych firm
Bardziej szczegółowoJarosław Kuchta. Administrowanie Systemami Komputerowymi. System plików
Jarosław Kuchta System plików Partycja a wolumin Partycja część dysku podstawowego (fizycznego) Wolumin część dysku dynamicznego (wirtualnego) System plików 2 Rodzaje dysków Dyski podstawowe partycjonowane
Bardziej szczegółowoSystemy plików FAT, FAT32, NTFS
Systemy plików FAT, FAT32, NTFS SYSTEM PLIKÓW System plików to sposób zapisu informacji na dyskach komputera. System plików jest ogólną strukturą, w której pliki są nazywane, przechowywane i organizowane.
Bardziej szczegółowoAnalityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017
Analityka danych w środowisku Hadoop Piotr Czarnas, 5 czerwca 2017 Pytania stawiane przez biznes 1 Jaka jest aktualnie sytuacja w firmie? 2 Na czym jeszcze możemy zarobić? Które procesy możemy usprawnić?
Bardziej szczegółowoPROGRAM PRAKTYKI ZAWODOWEJ. Technikum Zawód: technik informatyk
PROGRAM PRAKTYKI ZAWODOWEJ Technikum Zawód: technik informatyk 351203 Lp. Temat 1 Zajęcia wprowadzające. Zapoznanie z zakładem, regulaminem pracy, przepisami BHP oraz instruktaż bhp. 2 Montaż i eksploatacja
Bardziej szczegółowo1. Instalacja jednostanowiskowa...3 2. Instalacja sieciowa...4 3. Instalacja w środowisku rozproszonym...5 4. Dodatkowe zalecenia...
SYBILLA WYMAGANIA TECHNICZNE 1. Instalacja jednostanowiskowa...3 2. Instalacja sieciowa...4 3. Instalacja w środowisku rozproszonym...5 4. Dodatkowe zalecenia...6 1998 2005 TELEPORT.PL WYMAGANIA TECHNICZNE
Bardziej szczegółowoBaza danych. Baza danych to:
Baza danych Baza danych to: zbiór danych o określonej strukturze, zapisany na zewnętrznym nośniku (najczęściej dysku twardym komputera), mogący zaspokoić potrzeby wielu użytkowników korzystających z niego
Bardziej szczegółowoSAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik
SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop Piotr Borowik Wyzwania związane z Big Data Top Hurdles with Big data Source: Gartner (Sep 2014), Big Data Investment Grows
Bardziej szczegółowoTeraz bajty. Informatyka dla szkół ponadpodstawowych. Zakres rozszerzony. Część 1.
Teraz bajty. Informatyka dla szkół ponadpodstawowych. Zakres rozszerzony. Część 1. Grażyna Koba MIGRA 2019 Spis treści (propozycja na 2*32 = 64 godziny lekcyjne) Moduł A. Wokół komputera i sieci komputerowych
Bardziej szczegółowoDefinicja. Not Only SQL
Definicja Not Only SQL Baza danych NoSQL to program zapewniający szybki dostęp do danych różniący się w jakiś sposób od stadardowych baz RDBMS. Baza NoSQL to szereg różnych rozwiązań nazwanych jednym określeniem.
Bardziej szczegółowoALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Map-Reduce system Single-node architektura 3 Przykład Googla 4 10 miliardów stron internetowych Średnia
Bardziej szczegółowoPartition Wizard Home Edition Aplikacja przeznaczona do partycjonowania dysków twardych, obsługująca również macierze RAID oraz dyski o pojemności
10 najlepszych darmowych programów do partycjonowania i zarządzania dyskami Odpowiedni podział dysku pozytywnie wpływa na działanie systemu. Prezentujemy 10 najlepszych darmowych programów do partycjonowania
Bardziej szczegółowoAUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7
AUREA BPM Oracle TECNA Sp. z o.o. Strona 1 z 7 ORACLE DATABASE System zarządzania bazą danych firmy Oracle jest jednym z najlepszych i najpopularniejszych rozwiązań tego typu na rynku. Oracle Database
Bardziej szczegółowoProgram szkolenia KURS SPD i PD Administrator szkolnej pracowni internetowej Kurs MD1 Kurs MD2 Kurs MD3 (dla szkół ponadgimnazjalnych)
Miejsce prowadzenia szkolenia Program szkolenia KURS SPD i PD Administrator pracowni internetowej Kurs MD1 Kurs MD2 Kurs MD3 (dla szkół ponadgimnazjalnych) Pracownie komputerowe znajdujące się w wyznaczonych
Bardziej szczegółowoMongoDB. wprowadzenie. dr inż. Paweł Boiński, Politechnika Poznańska
MongoDB wprowadzenie dr inż. Paweł Boiński, Politechnika Poznańska Plan Historia Podstawowe pojęcia: Dokument Kolekcja Generowanie identyfikatora Model danych Dokumenty zagnieżdżone Dokumenty z referencjami
Bardziej szczegółowoHurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie
Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2012 Zagadnienia do omówienia 1. Miejsce i rola w firmie 2. Przegląd architektury
Bardziej szczegółowoSeminarium Bazy Danych I. BigTable. Piotr Świgoń Uniwersytet Warszawski
Seminarium Bazy Danych I BigTable Piotr Świgoń Uniwersytet Warszawski Rzędy wielkości Miliardy URL'i i linków, wiele wersji stron Setki milionów użytkowników Tysiące zapytań na sekundę 2.7 3.3 GB rozmiar
Bardziej szczegółowodziennik Instrukcja obsługi
Ham Radio Deluxe dziennik Instrukcja obsługi Wg. Simon Brown, HB9DRV Tłumaczenie SP4JEU grudzień 22, 2008 Zawartość 3 Wprowadzenie 5 Po co... 5 Główne cechy... 5 baza danych 7 ODBC... 7 Który produkt
Bardziej szczegółowoActiveXperts SMS Messaging Server
ActiveXperts SMS Messaging Server ActiveXperts SMS Messaging Server to oprogramowanie typu framework dedykowane wysyłaniu, odbieraniu oraz przetwarzaniu wiadomości SMS i e-mail, a także tworzeniu własnych
Bardziej szczegółowoAnalityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017
Analityka danych w środowisku Hadoop Piotr Czarnas, 27 czerwca 2017 Hadoop i Business Intelligence - wyzwania 1 Ładowane danych do Hadoop-a jest trudne 2 Niewielu specjalistów dostępnych na rynku Dostęp
Bardziej szczegółowoWprowadzenie do Hurtowni Danych. Mariusz Rafało
Wprowadzenie do Hurtowni Danych Mariusz Rafało mrafalo@sgh.waw.pl WARSTWA PREZENTACJI HURTOWNI DANYCH Wykorzystanie hurtowni danych - aspekty Analityczne zbiory danych (ADS) Zbiór danych tematycznych (Data
Bardziej szczegółowoInstalacja SQL Server Express. Logowanie na stronie Microsoftu
Instalacja SQL Server Express Logowanie na stronie Microsoftu Wybór wersji do pobrania Pobieranie startuje, przechodzimy do strony z poradami. Wypakowujemy pobrany plik. Otwiera się okno instalacji. Wybieramy
Bardziej szczegółowoCo to jest GASTRONOMIA?
Co to jest GASTRONOMIA? Program Gastronomia to w pełni zintegrowana aplikacja, która znajduje zastosowanie w obsłudze punktu sprzedaży produktów gastronomicznych i może być dostosowana do indywidualnych
Bardziej szczegółowoSpecjalizacja magisterska Bazy danych
Specjalizacja magisterska Bazy danych Strona Katedry http://bd.pjwstk.edu.pl/katedra/ Prezentacja dostępna pod adresem: http://www.bd.pjwstk.edu.pl/bazydanych.pdf Wymagania wstępne Znajomość podstaw języka
Bardziej szczegółowoSystem Kancelaris. Zdalny dostęp do danych
Kancelaris krok po kroku System Kancelaris Zdalny dostęp do danych Data modyfikacji: 2008-07-10 Z czego składaj adają się systemy informatyczne? System Kancelaris składa się z dwóch części: danych oprogramowania,
Bardziej szczegółowoAE/ZP-27-16/14. Oprogramowanie do wykonywania kopii zapasowych oraz zarządzania maszynami wirtualnymi
AE/ZP-27-16/14 Załącznik B Oprogramowanie do wykonywania kopii zapasowych oraz zarządzania maszynami wirtualnymi Wykonywanie kopii zapasowych Oprogramowanie do archiwizacji musi współpracować z infrastrukturą
Bardziej szczegółowoZAŁĄCZNIK NR 1.8 do PFU Serwery wraz z system do tworzenia kopii zapasowych i archiwizacji danych - wyposażenie serwerowni
ZAŁĄCZNIK NR 1.8 do PFU Serwery wraz z system do tworzenia kopii zapasowych i archiwizacji danych - wyposażenie serwerowni 1. Serwer główny 1 szt. Komponent Obudowa Płyta główna Wydajność Pamięć RAM Karta
Bardziej szczegółowoLiczba godzin 1,2 Organizacja zajęć Omówienie programu nauczania 2. Tematyka zajęć
rzedmiot : Systemy operacyjne Rok szkolny : 015/016 Klasa : 3 INF godz. x 30 tyg.= 60 godz. Zawód : technik informatyk; symbol 35103 rowadzący : Jacek Herbut Henryk Kuczmierczyk Numer lekcji Dział Tematyka
Bardziej szczegółowo1 Implementowanie i konfigurowanie infrastruktury wdraŝania systemu Windows... 1
Spis treści Wstęp... xi Wymagania sprzętowe (Virtual PC)... xi Wymagania sprzętowe (fizyczne)... xii Wymagania programowe... xiii Instrukcje instalowania ćwiczeń... xiii Faza 1: Tworzenie maszyn wirtualnych...
Bardziej szczegółowoBazy danych - ciągłość działania, spójność danych i disaster recovery. Daniel Polek-Pawlak Jarosław Zdebik
Bazy danych - ciągłość działania, spójność danych i disaster recovery Daniel Polek-Pawlak Jarosław Zdebik Plan Prezentacji Wprowadzenie - podstawy. Co oznacza utrata danych dla niedużego sklepu. Czy dostępność
Bardziej szczegółowoBazy danych - wykład wstępny
Bazy danych - wykład wstępny Wykład: baza danych, modele, hierarchiczny, sieciowy, relacyjny, obiektowy, schemat logiczny, tabela, kwerenda, SQL, rekord, krotka, pole, atrybut, klucz podstawowy, relacja,
Bardziej szczegółowoRozwiązania HPE Storage jak zapewnić pełne bezpieczeństwo Twoich danych?
Rozwiązania HPE Storage jak zapewnić pełne bezpieczeństwo Twoich danych? Marek Kozicki, Storage Solutions Architect, HPE 19 maja 2016 r. Przed czym powinniśmy zabezpieczyć nasze dane? Architektura sprzętowo-programowa
Bardziej szczegółowoReferat pracy dyplomowej
Referat pracy dyplomowej Temat pracy: Wdrożenie intranetowej platformy zapewniającej organizację danych w dużej firmie na bazie oprogramowania Microsoft SharePoint Autor: Bartosz Lipiec Promotor: dr inż.
Bardziej szczegółowoOpis przedmiotu zamówienia: Przedmiotem zamówienia na potrzeby Miejskiego Ośrodka Pomocy Społecznej w Mikołowie jest zakup, dostawa oprogramowania (
Opis przedmiotu zamówienia: Przedmiotem zamówienia na potrzeby Miejskiego Ośrodka Pomocy Społecznej w Mikołowie jest zakup, dostawa oprogramowania ( 2 licencji) do tworzenia kopii zapasowych oraz ich przywracania
Bardziej szczegółowoTechnologia informacyjna (IT - Information Technology) dziedzina wiedzy obejmująca:
1.1. Podstawowe pojęcia Technologia informacyjna (IT - Information Technology) dziedzina wiedzy obejmująca: informatykę (włącznie ze sprzętem komputerowym oraz oprogramowaniem używanym do tworzenia, przesyłania,
Bardziej szczegółowoModuł 2 Użytkowanie komputerów i zarządzanie plikami wymaga od kandydata znajomości obsługi komputera osobistego.
Moduł 2 Użytkowanie komputerów i zarządzanie plikami wymaga od kandydata znajomości obsługi komputera osobistego. Kandydat winien wykazać się wiedzą i umiejętnościami w zakresie: - korzystania z głównych
Bardziej szczegółowoSzkolenie wycofane z oferty. Apache Cassandra - modelowanie, wydajność, analiza danych
Szkolenie wycofane z oferty Program szkolenia: Apache Cassandra - modelowanie, wydajność, analiza danych Informacje: Nazwa: Kod: Kategoria: Grupa docelowa: Czas trwania: Forma: Apache Cassandra - modelowanie,
Bardziej szczegółowoProgram Rejestr zużytych materiałów. Instrukcja obsługi
Program Rejestr zużytych materiałów. Instrukcja obsługi Autor: Andrzej Woch Tel. 663 772 789 andrzej@awoch.com www.awoch.com Spis treści Wstęp... 1 Informacje dla administratora i ADO... 1 Uwagi techniczne...
Bardziej szczegółowoPodręcznik administratora systemu
Podręcznik administratora systemu Medtronic MiniMed Northridge, CA 91325 USA 800-646-4633 (800-MiniMed) 818.576.5555 www.minimed.com Przedstawiciel w Unii Europejskiej Medtronic B.V. Earl Bakkenstraat
Bardziej szczegółowoInstrukcja do panelu administracyjnego. do zarządzania kontem FTP WebAs. www.poczta.greenlemon.pl
Instrukcja do panelu administracyjnego do zarządzania kontem FTP WebAs www.poczta.greenlemon.pl Opracowanie: Agencja Mediów Interaktywnych GREEN LEMON Spis treści 1.Wstęp 2.Konfiguracja 3.Konto FTP 4.Domeny
Bardziej szczegółowoCZY TWOJE ŚRODOWISKO PLIKOWE RÓWNIEŻ ROŚNIE SZYBCIEJ NIŻ BAZODANOWE?
1 CZY TWOJE ŚRODOWISKO PLIKOWE RÓWNIEŻ ROŚNIE SZYBCIEJ NIŻ BAZODANOWE? STAN OBECNY I WYZWANIA Z informacji otrzymanych od naszych Klientów wynika, że dotychczasowe rozwiązania w zakresie przechowywania
Bardziej szczegółowoWindows Serwer 2008 R2. Moduł 8. Mechanizmy kopii zapasowych
Windows Serwer 2008 R2 Moduł 8. Mechanizmy kopii zapasowych Co nowego w narzędziu Kopia zapasowa? 1. Większa elastyczność w zakresie możliwości wykonywania kopii zapasowych 2. Automatyczne zarządzanie
Bardziej szczegółowoZajęcia prowadzone przez MCT, auditora wiodącego systemów bezpieczeństwa informacji.
OFERTA SZKOLENIOWA BAZY DANYCH O firmie: Firma Information & Technology Consulting specjalizuje się w szkoleniach w zakresie systemów bazodanowych Microsoft i Sybase oraz Zarządzania bezpieczeństwem informacji
Bardziej szczegółowoWykład I. Wprowadzenie do baz danych
Wykład I Wprowadzenie do baz danych Trochę historii Pierwsze znane użycie terminu baza danych miało miejsce w listopadzie w 1963 roku. W latach sześcdziesątych XX wieku został opracowany przez Charles
Bardziej szczegółowoTECHNOLOGIE BIG DATA A BEZPIECZEŃSTWO INFORMATYCZNE WE KNOW YOU KNOW. silmine.com
TECHNOLOGIE BIG DATA A BEZPIECZEŃSTWO INFORMATYCZNE WE KNOW YOU KNOW. silmine.com 13 + 13 LAT DOŚWIADCZENIA PONAD 480 ZREALIZOWANYCH PROJEKTÓW PARTNERSTWO Naszą ambicją jest dostarczać klientom szeroki
Bardziej szczegółowoOMEGA-PSIR na Uniwersytecie Gdańskim
OMEGA-PSIR na Uniwersytecie Gdańskim doświadczenia z wdrożenia V Ogólnopolskie Seminarium użytkowników Uczelnianych Baz Wiedzy Warszawa 2018 Biblioteka Uniwersytetu Gdańskiego Uniwersytet Gdański repozytorium.bg.ug.edu.pl
Bardziej szczegółowoTworzenie partycji i dysków logicznych
Tworzenie partycji i dysków logicznych Podstawowe pojęcia Dysk twardy fizyczny napęd, który służy do przechowywania danych Dysk podstawowy zawierają tzw. woluminy podstawowe, takie jak partycje podstawowe
Bardziej szczegółowoOfficeObjects e-forms
OfficeObjects e-forms Rodan Development Sp. z o.o. 02-820 Warszawa, ul. Wyczółki 89, tel.: (+48-22) 643 92 08, fax: (+48-22) 643 92 10, http://www.rodan.pl Spis treści Wstęp... 3 Łatwość tworzenia i publikacji
Bardziej szczegółowoProblemy niezawodnego przetwarzania w systemach zorientowanych na usługi
Problemy niezawodnego przetwarzania w systemach zorientowanych na usługi Jerzy Brzeziński, Anna Kobusińska, Dariusz Wawrzyniak Instytut Informatyki Politechnika Poznańska Plan prezentacji 1 Architektura
Bardziej szczegółowoRamowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści
Ramowy plan kursu Lp. Moduły Wyk. Lab. Przekazywane treści 1 3 4 Technologia MS SQL Server 2008 R2. Podstawy relacyjnego modelu i projektowanie baz. Zaawansowane elementy języka SQL. Programowanie w języku
Bardziej szczegółowoSzybki przewodnik po produkcie. EMC DataDomain
Szybki przewodnik po produkcie EMC DataDomain Szybki przewodnik po produkcie EMC DataDomain OPIS ROZWIĄZANIA DataDomain to uniwersalne medium backupowe. Podczas procesu tworzenia kopii zapasowych, systemy
Bardziej szczegółowoReplikacje. dr inż. Dziwiński Piotr Katedra Inżynierii Komputerowej. Kontakt:
dr inż. Dziwiński Piotr Katedra Inżynierii Komputerowej Kontakt: piotr.dziwinski@kik.pcz.pl Replikacje 2 1 Podstawowe pojęcia Strategie replikacji Agenci replikacji Typy replikacji Modele replikacji Narzędzia
Bardziej szczegółowoOBIEG INFORMACJI I WSPOMAGANIE DECYZJI W SYTUACJACH KRYZYSOWYCH
OBIEG INFORMACJI I WSPOMAGANIE DECYZJI W SYTUACJACH KRYZYSOWYCH AGENDA Prezentacja firmy Tecna Informacja i jej przepływ Workflow i BPM Centralny portal informacyjny Wprowadzanie danych do systemu Interfejsy
Bardziej szczegółowoDeduplikacja danych. Zarządzanie jakością danych podstawowych
Deduplikacja danych Zarządzanie jakością danych podstawowych normalizacja i standaryzacja adresów standaryzacja i walidacja identyfikatorów podstawowa standaryzacja nazw firm deduplikacja danych Deduplication
Bardziej szczegółowoEgzamin : administrowanie systemem Windows Server 2012 R2 / Charlie Russel. Warszawa, Spis treści
Egzamin 70-411 : administrowanie systemem Windows Server 2012 R2 / Charlie Russel. Warszawa, 2014 Spis treści Wstęp xi 1 Wdrażanie i utrzymanie serwerów oraz zarządzanie nimi 1 Zagadnienie 1.1: Wdrażanie
Bardziej szczegółowoSprawa numer: BAK.WZP Warszawa, dnia 16 sierpnia 2016 r.
Sprawa numer: BAK.WZP.26.18.2016.30 Warszawa, dnia 16 sierpnia 2016 r. Zaproszenie do udziału w ustaleniu wartości zamówienia publicznego 1. Zamawiający: Skarb Państwa - Urząd Komunikacji Elektronicznej
Bardziej szczegółowoETL darmowe narzędzia
Piotr Ślatała Tomasz Żurkowski 9 czerwca 2011 Plan prezentacji Plan (Krótkie) przypomnienie problemu Plan prezentacji Plan (Krótkie) przypomnienie problemu Przykładowe scenariusze (przykład biznesowego
Bardziej szczegółowoBig Data & Analytics
Big Data & Analytics Optymalizacja biznesu Autor: Wiktor Jóźwicki, Scapaflow Senior Consultant Data wydania: 05.02.2014 Wprowadzenie Niniejszy dokument przedstawia zagadnienie Big Data w ujęciu zapotrzebowania
Bardziej szczegółowoWybrane działy Informatyki Stosowanej
Wybrane działy Informatyki Stosowanej Java Enterprise Edition. WebServices. Język XML. Serwer aplikacji GlassFish. Dr inż. Andrzej Czerepicki a.czerepicki@wt.pw.edu.pl http://www2.wt.pw.edu.pl/~a.czerepicki
Bardziej szczegółowoLeonard G. Lobel Eric D. Boyd. Azure SQL Database Krok po kroku. Microsoft. Przekład: Marek Włodarz. APN Promise, Warszawa 2014
Leonard G. Lobel Eric D. Boyd Microsoft TM Azure SQL Database Krok po kroku Przekład: Marek Włodarz APN Promise, Warszawa 2014 Spis treści Wprowadzenie........................................................
Bardziej szczegółowoReplikacja bazy danych polega na kopiowaniu i przesyłaniu danych lub obiektów bazodanowych między serwerami oraz na zsynchronizowaniu tych danych w
J. Karwowska Replikacja bazy danych polega na kopiowaniu i przesyłaniu danych lub obiektów bazodanowych między serwerami oraz na zsynchronizowaniu tych danych w celu utrzymania ich spójności. Dane kopiowane
Bardziej szczegółowoSposób funkcjonowania
Stratus Avance został zaprojektowany w sposób, który w przypadku wystąpienia awarii ma zminimalizować czas przestoju i zapobiec utracie danych. Jednocześnie rozwiązanie ma być tanie i łatwe w zarządzaniu.
Bardziej szczegółowoMIGRATE OS TO SSD. Przewodnik
MIGRATE OS TO SSD Przewodnik Koncepcja produktu Główni odbiorcy Migrate OS to SSD to podręczne rozwiązanie do transferu systemów opartych na Windows na inny dysk, nawet o mniejszej pojemności. Rozwiązanie
Bardziej szczegółowoApache Hadoop framework do pisania aplikacji rozproszonych
Apache Hadoop framework do pisania aplikacji rozproszonych Piotr Praczyk Wprowadzenie Istnieje wiele rodzajów obliczeń, których wykonywanie na pojedynczej maszynie, nawet najpotężniejszej, jest zbyt czasochłonne.
Bardziej szczegółowoAsseco HOME: obniżenie kosztów operacyjnych telekomów dzięki rozwiązaniu Big Data.
Asseco HOME: obniżenie kosztów operacyjnych telekomów dzięki rozwiązaniu Big Data. asseco.pl Klient. Klient jest jednym z wiodących w Polsce operatorów telekomunikacyjnych, obsługujących ponad 10 mln abonentów.
Bardziej szczegółowoSpis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services
Spis treści Wstęp... ix Odkąd najlepiej rozpocząć lekturę?... ix Informacja dotycząca towarzyszącej ksiąŝce płyty CD-ROM... xi Wymagania systemowe... xi Instalowanie i uŝywanie plików przykładowych...
Bardziej szczegółowoPamięci masowe. ATA (Advanced Technology Attachments)
Pamięci masowe ATA (Advanced Technology Attachments) interfejs systemowy w komputerach klasy PC i Amiga przeznaczony do komunikacji z dyskami twardymi zaproponowany w 1983 przez firmę Compaq. Używa się
Bardziej szczegółowoWykład 2. Temat: (Nie)zawodność sprzętu komputerowego. Politechnika Gdańska, Inżynieria Biomedyczna. Przedmiot:
Wykład 2 Przedmiot: Zabezpieczenie systemów i usług sieciowych Temat: (Nie)zawodność sprzętu komputerowego 1 Niezawodność w świecie komputerów Przedmiot: Zabezpieczenie systemów i usług sieciowych W przypadku
Bardziej szczegółowoWHITE PAPER. Planowanie, przygotowanie i testowanie działań na wypadek wystąpienia awarii
WHITE PAPER Planowanie, przygotowanie i testowanie działań na wypadek wystąpienia awarii 1 TABLE OF CONTENTS Wstęp...3 Symulator VERITAS Cluster Server...3 Doradca VERITAS Volume Replicator...5 Próbny
Bardziej szczegółowodlibra 3.0 Marcin Heliński
dlibra 3.0 Marcin Heliński Plan prezentacji Wstęp Aplikacja Redaktora / Administratora Serwer Aplikacja Czytelnika Aktualizator Udostępnienie API NajwaŜniejsze w nowej wersji Ulepszenie interfejsu uŝytkownika
Bardziej szczegółowoModel logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL
Podstawy baz danych: Rysunek 1. Tradycyjne systemy danych 1- Obsługa wejścia 2- Przechowywanie danych 3- Funkcje użytkowe 4- Obsługa wyjścia Ewolucja baz danych: Fragment świata rzeczywistego System przetwarzania
Bardziej szczegółowoProjektowanie, tworzenie aplikacji mobilnych na platformie Android
Program szkolenia: Projektowanie, tworzenie aplikacji mobilnych na platformie Android Informacje: Nazwa: Kod: Kategoria: Grupa docelowa: Czas trwania: Forma: Projektowanie, tworzenie aplikacji mobilnych
Bardziej szczegółowoWZÓR UMOWY. Zawarta w Białymstoku, w dniu.. pomiędzy:
WZÓR UMOWY Zawarta w Białymstoku, w dniu.. pomiędzy: Województwem Podlaskim, z siedzibą w Białymstoku przy ul. Kardynała Stefana Wyszyńskiego 1, w imieniu którego działa, na podstawie upoważnienia udzielonego
Bardziej szczegółowoStruktura dysku. Dyski podstawowe i dynamiczne
Struktura dysku Dyski podstawowe i dynamiczne System Windows 2000 oferuje dwa rodzaje konfiguracji dysków: dysk podstawowy i dysk dynamiczny. Dysk podstawowy przypomina struktury dyskowe stosowane w systemie
Bardziej szczegółowostr. 1 Informacja o zmianie treści specyfikacji istotnych warunków zamówienia Oświęcim, dnia r.
Oświęcim, dnia 16.07. 2015 r. Państwowe Muzeum Auschwitz-Birkenau w Oświęcimiu ul. Więźniów Oświęcimia 20 32-603 Oświęcim Informacja o zmianie treści specyfikacji istotnych warunków zamówienia Modyfikacja
Bardziej szczegółowoNoSQL & relax with CouchDB
NoSQL & relax with PyWaw #23 8 kwiecień 2013 Agenda 1 NoSQL - nierelacyjne systemy baz danych Wprowadzenie do NoSQL Rodzaje i porównanie baz NoSQL Polyglot persistence 2 Projekt w CERN wykorzystujacy 3
Bardziej szczegółowoSYSTEMY OPERACYJNE WYKŁAD 5 OBSŁUGA PAMIĘCI MASOWYCH
SYSTEMY OPERACYJNE WYKŁAD 5 OBSŁUGA PAMIĘCI MASOWYCH Marcin Tomana marcin@tomana.net SKRÓT WYKŁADU Fizyczna obsługa dysków Metody zabezpieczania pamięci masowych Przegląd systemów plików w systemach Windows
Bardziej szczegółowoNarzędzia umożliwiające tworzenie scentralizowanej polityki prowadzenia backupów. Adrian Marczyk
Narzędzia umożliwiające tworzenie scentralizowanej polityki prowadzenia backupów Adrian Marczyk Kopia bezpieczeństwa (ang. Backup copy) w informatyce dane, które mają służyć do odtworzenia oryginalnych
Bardziej szczegółowo