MapReduce. Janina Mincer-Daszkiewicz Systemy rozproszone. MSUI, II rok
|
|
- Miłosz Orłowski
- 7 lat temu
- Przeglądów:
Transkrypt
1 MapReduce Janina Mincer-Daszkiewicz Systemy rozproszone MSUI, II rok
2 Materiały i rysunki zaczerpnięto z następujących źródeł 1. Jeffrey Dean,Sanjay Ghemawat, MapReduce: Simplified Data Processing on Large Clusters, firma Google, OSDI'04: Sixth Symposium on Operating System Design and Implementation, San Francisco, CA, December, Google Code University,Distributed Systems 3. Christophe Bisciglia, Aaron Kimball, & Sierra Michels-Slettvet, MapReduce Theory and Implementation, Distributed Computing Seminar, Google,
3 MapReduce z lotu ptaka... Produkt firmy Google TM Model programowania i implementująca go biblioteka w C++ do przetwarzania dużych zbiorów danych Programy napisane zgodnie z tym modelem są automatycznie zrównoleglane i wykonywane na klastrze zbudowanym ze standardowych komputerów Zdejmuje z programisty konieczność zajmowania się szczegółami wykonania programu w środowisku rozproszonym Wiele aplikacji wykonywanych rutynowo w Google wykorzystuje ten model 3
4 Cele projektowe W Google rośnie liczba obliczeń przetwarzających olbrzymie ilości danych (odwiedzane strony webowe, logi serwerów WWW itp.) Większość tych obliczeń jest prosta koncepcyjnie Ze względów wydajnościowych powinno się je wykonywać w środowisku rozproszonym, ale to znacząco komplikuje kod: jak zrównoleglić wykonanie na wiele komputerów jak rozproszyć dane wejściowe jak radzić sobie z awariami maszyn jak zebrać i przekazać użytkownikowi wyniki obliczeń jak optymalnie wykorzystać przepustowość sieci 4
5 Cele projektowe cd Inspiracją dla nowego modelu programowania były obecne w językach funkcyjnych operacje map i reduce Na każdym logicznym rekordzie danych wykonuje się map, otrzymuje się pośrednie wyniki w postaci par (klucz, wartość), następnie wykonuje się reduce na wszystkich wartościach o tym samym kluczu Programista pisze program w kategoriach operacji map i reduce, wykonaniem programu w środowisku rozproszonym zarządza dołączana do niego biblioteka Biblioteka zapewnia także odporność na błędy, ponawiając wykonanie obliczeń w przypadku awarii itp. 5
6 Paradygmat programowania funkcyjnego Operatory funkcyjne nigdy nie modyfikują oryginalnych struktur danych, zawsze tworzą nowe Oryginalne dane pozostają w niezmienionej postaci Porządek operacji nie wpływa na końcowy wynik Kod programu nie determinuje jawnie przepływu danych Jeśli porządek aplikowania funkcji f do elementów listy jest przemienny, to można dowolnie zmieniać kolejność lub zrównoleglać wykonanie 6
7 map dostarcza ją programista Model programowania pobiera rekord z wejścia i produkuje pośrednie wyniki w postaci par (klucz, wartość) biblioteka grupuje wszystkie wartości pośrednie z tym samym kluczem i przekazuje do funkcji reduce reduce dostarcza ją programista pobiera zbiór wartości dla tego samego klucza i łączy je tworząc mniejszy zbiór wartości pośrednie są dostarczane przez iterator 7
8 Przykład Zliczanie liczby wystąpień każdego słowa w dużym zbiorze dokumentów map (String key, String value): // key: nazwa dokumentu // value: zawartość dokumentu for each word w in value: EmitIntermediate(w, 1 ); map emituje każde słowo z licznikiem częstości 8
9 Przykład reduce (String key, Iterator values): // key: słowo // values: lista liczników for each v in values: result += ParseInt(v); Emit (AsString(result)); reducesumuje liczniki dla konkretnego słowa Dodatkowo programista pisze kod, który wypełnia specification object nazwami plików wejściowych i wyjściowych oraz dodatkowymi parametrami Wywołuje funkcję MapReduce przekazując jej ten obiekt 9
10 Więcej przykładów Rozproszony grep: map emituje wiersz, jeśli pasuje on do wzorca, reduce jest funkcją identycznościową Licznik częstości odwołań do danego URL: map przetwarza logi z odwołaniami do stron webowych i emituje (URL, 1), reduce dodaje wartości dla tego samego URL i emituje (URL, licznik) Graf odwrotnych odsyłaczy: map emituje pary (target, source) dla każdego odnośnika do URL target znalezionego w stronie source, reduce konkatenuje listy i emituje (target, lista(source)) Odwrotny indeks: map parsuje każdy dokument i emituje ciąg (słowo, id dokumentu), reduce akceptuje wszystkie pary dla danego słowa i emituje (słowo, lista(id dokumentu)) 10
11 Implementacja Implementacja zależy od środowiska Tutaj opisano implementację dla środowiska używanego w Google: duże klastry standardowych PC połączonych Ethernetem: maszyny to zwykle dwuprocesorowe x86 z Linuksem 2-4 GB RAM sieć zwykle 100 Mb/s lub 1 Gb/s klaster zawiera setki lub tysiące maszyn, częste awarie dyski IDE, rozproszony system plików Google FS użytkownicy dostarczają zadania planiście, każde obejmuje wiele zadań, planista wybiera maszynę 11
12 Wykonanie Wywołania map są rozproszone między wieloma maszynami, dane wejściowe są dzielone automatycznie na M podzbiorów, każdy może być przetwarzany równolegle przez różne maszyny Wywołania reduce są rozproszone przez podział przestrzeni kluczy pośrednich na R części przy użyciu funkcji podziału, np. hash(key) mod R Liczba podziałów i funkcja podziału są dostarczane przez użytkownika 12
13 Implementacja cd 13
14 Implementacja wywołanie MapReduce MapReduce dzieli pliki wejściowe na M części po MB. Następnie uruchamia wiele kopii programu na klastrze Jedna kopia jest wyróżniona to zarządca. Pozostałe to pracownicy, którzy dostają zadania od zarządcy. Jest M zadań map i R zadań reduce. Zarządca wybiera bezczynnych pracowników i przydziela każdemu zadanie map lub reduce. Pracownik wykonujący map czyta zawartość opowiadającej mu części, parsuje pary (klucz, wartość) i przekazuje je do funkcji map 14
15 Implementacja cd Pośrednie pary (klucz, wartość) produkowane przez funkcję map są buforowane w pamięci. Cyklicznie są zapisywane na lokalny dysk, w podziale na R części. Położenie tych par na lokalnym dysku jest przekazywane do zarządcy, które przekazuje je dalej do pracowników wykonujących reduce Pracownik wykonujący reduce używa RPC do czytania danych, sortuje je, grupując razem wystąpienia tego samego klucza, iteruje po posortowanych danych i dla każdej unikatowej wartości klucza przekazuje ją i zbiór odpowiadających jej wartości do funkcji reduce 15
16 Implementacja cd Wynik funkcji reduce jest dołączany na koniec odpowiedniego pliku wyjściowego Gdy wszystkie zadania map i reduce zakończą pracę, zarządca budzi proces użytkownika. W tym momencie następuje powrót z wywołania MapReduce Wynik jest dostępny w R plikach wyjściowych 16
17 Wykonanie 17
18 Wykonanie 18
19 Wykonanie 19
20 Wykonanie - cd Input key*value pairs Input key*value pairs... Data store 1 map Data store n map (key 1, values...) (key 2, values...) (key 3, values...) (key 1, values...) (key 2, values...) (key 3, values...) == Barrier == : Aggregates intermediate values by output key key 1, intermediate values key 2, intermediate values key 3, intermediate values reduce reduce reduce final key 1 values final key 2 values final key 3 values 20
21 Równoległość Funkcje map wykonują się równolegle, tworząc różne wartości pośrednie z różnych wejściowych zbiorów danych Funkcje reduce także wykonują się równolegle, każda przetwarza różny klucz Wszystkie wartości są przetwarzane niezależnie Wąskie gardło: faza reduce nie może się zacząć nim nie zakończy się faza map 21
22 Struktury danych zarządcy Dla każdego zadania map i reduce zarządca przechowuje stan (idle, in-progress, completed) i tożsamość maszyny wykonującej zadanie Dla każdego zakończonego zadania map zarządca przechowuje położenie i rozmiary R wytworzonych plików pośrednich. Przekazuje tę informację dalej do pracowników wykonujących zadania reduce 22
23 Odporność na błędy Ponieważ zadania wykonują się na tysiącach standardowych komputerów, biblioteka musi zapewnić odporność na błędy Zarządca cyklicznie wysyła ping do pracowników Zakończone zadania map w sytuacji błędu są wyznaczane do ponownego wykonania, gdyż ich wynik jest zapisany na lokalnych dyskach, czyli jest niedostępny Zakończone zadania reduce nie muszą być wykonywane ponownie, gdyż ich wynik jest zapisany w globalnym systemie plików 23
24 Odporność na błędy zarządca Zarządca cyklicznie mógłby zapisywać punkty kontrolne swoich struktur danych W przypadku awarii zarządcy można by wystartować nową kopię od ostatniego punktu kontrolnego W obecnej implementacji przerywa się wykonanie MapReduce Klient w razie potrzeby wznawia wykonanie MapReduce 24
25 Szerokość pasma sieci Szerokość pasma sieci jest kluczowym zasobem Dane wejściowe są przechowywane na lokalnych dyskach w systemie plików Google FS, który dzieli każdy plik na kawałki po 64 MB i każdy blok zapisuje w kilku kopiach na różnych maszynach Zarządca próbuje uruchomić zadanie map na maszynie zawierającej kopię danych wejściowych (lub przynajmniej w pobliżu) Dzięki temu większość danych wejściowych jest czytana z lokalnych plików i nie obciąża sieci 25
26 Dodatkowe zadania O całkowitym czasie wykonania operacji MapReduce w znacznym stopniu decyduje maruder maszyna, która wykonuje nienaturalnie długo jedno z ostatnich zadań map lub reduce Maruderem może być maszyna ze złym dyskiem, obciążona maszyna lub maszyna niesprawna Kiedy wykonanie MapReduce zbliża się do końca, zarządca zleca dodatkowe wykonanie pozostałych, jeszcze nie zakończonych zadań. Zadanie oznacza się jako zakończone, gdy zakończy się wykonanie jednego ze zleconych wykonań 26
27 Udoskonalenia Funkcja podziału. Domyślna funkcja podziału ma postać hash(key) mod R. Czasami zasadne jest użycie innej funkcji, np. gdy chcemy, żeby kluczami były URL-e i chcemy, żeby wszystkie wyniki dla jednej maszyny trafiły do tego samego pliku wyjściowego. Dlatego użytkownik może dostarczyć własną funkcję podziału, np. hash(hostname(urlkey)) mod R. Funkcja łącząca. Użytkownik może dostarczyć funkcję łączącą, która połączy wyniki (np. <the, 1>) przed przesłaniem ich siecią (combiner == mini-reducer) Pomijanie błędnych rekordów. Opcjonalnie MapReduce może pomijać rekordy, które powodują deterministyczne awarie. 27
28 Wydajność Wydajność zmierzono dla dwóch obliczeń: szukanie wzorca w dużym zbiorze ( bajtowych rekordów, czyli terabajty danych) sortowanie dużego zbioru (tyle samo danych) Konfiguracja klastra 1800 maszyn, 2 GHz Intel Xeon, 4 GB RAM, dwa dyski IDE po 160 GB, 1 Gb Ethernet programy wykonywane w weekend, gdy maszyny były w większości bezczynne 28
29 Grep tempo transmisji w czasie Tempo przeglądania danych wejściowych rośnie wraz z dodawaniem kolejnych maszyn do wykonania MapReduce Max tempo to ok. 30 GB/s dla 1764 przydzielonych pracowników Całość zajmuje ok. 150 s (z czego ponad 1 minutę zajmuje narzut propagacja programu na maszyny pracowników i opóźnienia związane z otwarciem przez GFS 1000 plików wejściowych) 29
30 Sortowanie (a) normalne wykonanie (b) bez dodatkowych zadań (c) zabito 200 z 1764 zadań 30
31 Sortowanie cd. Dodatkowe zadania znacznie przyspieszają wykonanie obliczenia System dobrze daje sobie radę z awariami 31
32 Zastosowanie modelu Liczba aplikacji w Google korzystających z modelu rośnie znacząco 32
33 Hadoop jest projektem typu open source rozwijanym w ramach Apache Software Foundation Hadoop implementuje MapReduce, przy użyciu Hadoop Distributed File System (HDFS) Hadoop Hadoop był używany na klastrach złożonych z 2000 węzłów Odnośniki: 33
34 MapReduce jest wygodną abstrakcją programowania równoległego Istotnie uprościło obliczenia dużej skali wykonywane w Google u, na klastrze standardowych maszyn z systemem plików Google FS Podsumowanie Pozwala skoncentrować się na problemie, pozostawiając bibliotece techniczne szczegóły implementacji 34
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Map-Reduce system Single-node architektura 3 Przykład Googla 4 10 miliardów stron internetowych Średnia
Architektura rozproszonych magazynów danych
Big data Big data, large data cloud. Rozwiązania nastawione na zastosowanie w wielkoskalowych serwisach, np. webowych. Stosowane przez Google, Facebook, itd. Architektura rozproszonych magazynów danych
Apache Hadoop framework do pisania aplikacji rozproszonych
Apache Hadoop framework do pisania aplikacji rozproszonych Piotr Praczyk Wprowadzenie Istnieje wiele rodzajów obliczeń, których wykonywanie na pojedynczej maszynie, nawet najpotężniejszej, jest zbyt czasochłonne.
Bigtable Rozproszony system pamięci
Bigtable Rozproszony system pamięci Janina Mincer-Daszkiewicz Systemy rozproszone MSUI, II rok Materiały i rysunki zaczerpnięto z następujących źródeł Fay Chang, Jeffrey Dean, Sanjay Ghemawat, Wilson C.
Wprowadzenie do optymalnego wykorzystania MapReduce
Eugenia Busłowska 1, Łukasz Juźwiuk 2 Politechnika Białostocka, Wydział Informatyki, Katedra Systemów Informacyjnych i Sieci Komputerowych. Wprowadzenie do optymalnego wykorzystania MapReduce 1. Wstęp
Seminarium Bazy Danych I. BigTable. Piotr Świgoń Uniwersytet Warszawski
Seminarium Bazy Danych I BigTable Piotr Świgoń Uniwersytet Warszawski Rzędy wielkości Miliardy URL'i i linków, wiele wersji stron Setki milionów użytkowników Tysiące zapytań na sekundę 2.7 3.3 GB rozmiar
Wprowadzenie do Apache Spark. Jakub Toczek
Wprowadzenie do Apache Spark Jakub Toczek Epoka informacyjna MapReduce MapReduce Apache Hadoop narodziny w 2006 roku z Apache Nutch open source składa się z systemu plików HDFS i silnika MapReduce napisany
Hadoop i Spark. Mariusz Rafało
Hadoop i Spark Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl WPROWADZENIE DO EKOSYSTEMU APACHE HADOOP Czym jest Hadoop Platforma służąca przetwarzaniu rozproszonemu dużych zbiorów danych. Jest
sprowadza się od razu kilka stron!
Bazy danych Strona 1 Struktura fizyczna 29 stycznia 2010 10:29 Model fizyczny bazy danych jest oparty na pojęciu pliku i rekordu. Plikskłada się z rekordów w tym samym formacie. Format rekordujest listą
Tabela wewnętrzna - definicja
ABAP/4 Tabela wewnętrzna - definicja Temporalna tabela przechowywana w pamięci operacyjnej serwera aplikacji Tworzona, wypełniana i modyfikowana jest przez program podczas jego wykonywania i usuwana, gdy
WPROWADZENIE DO BAZ DANYCH
WPROWADZENIE DO BAZ DANYCH Pojęcie danych i baz danych Dane to wszystkie informacje jakie przechowujemy, aby w każdej chwili mieć do nich dostęp. Baza danych (data base) to uporządkowany zbiór danych z
Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski
: idea Indeksowanie: Drzewo decyzyjne, przeszukiwania binarnego: F = {5, 7, 10, 12, 13, 15, 17, 30, 34, 35, 37, 40, 45, 50, 60} 30 12 40 7 15 35 50 Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski
Wprowadzenie do Hurtowni Danych
Wprowadzenie do Hurtowni Danych BIG DATA Definicja Big Data Big Data definiowane jest jako składowanie zbiorów danych o tak dużej złożoności i ilości danych, że jest to niemożliwe przy zastosowaniu podejścia
Searching for SNPs with cloud computing
Ben Langmead, Michael C Schatz, Jimmy Lin, Mihai Pop and Steven L Salzberg Genome Biology November 20, 2009 April 7, 2010 Problem Cel Problem Bardzo dużo krótkich odczytów mapujemy na genom referencyjny
System plików przykłady. implementacji
Dariusz Wawrzyniak Plan wykładu CP/M MS DOS ISO 9660 UNIX NTFS System plików (2) 1 Przykłady systemu plików (1) CP/M katalog zawiera blok kontrolny pliku (FCB), identyfikujący 16 jednostek alokacji (zawierający
System plików przykłady implementacji
System plików przykłady implementacji Dariusz Wawrzyniak CP/M MS DOS ISO 9660 UNIX NTFS Plan wykładu System plików (2) Przykłady implementacji systemu plików (1) Przykłady implementacji systemu plików
LEKCJA TEMAT: Zasada działania komputera.
LEKCJA TEMAT: Zasada działania komputera. 1. Ogólna budowa komputera Rys. Ogólna budowa komputera. 2. Komputer składa się z czterech głównych składników: procesor (jednostka centralna, CPU) steruje działaniem
CZĘŚĆ I. WARSTWA PRZETWARZANIA WSADOWEGO
Spis treści Przedmowa Podziękowania O książce Rozdział 1. Nowy paradygmat dla Big Data 1.1. Zawartość książki 1.2. Skalowanie tradycyjnej bazy danych 1.2.1. Skalowanie za pomocą kolejki 1.2.2. Skalowanie
ang. file) Pojęcie pliku (ang( Typy plików Atrybuty pliku Fragmentacja wewnętrzna w systemie plików Struktura pliku
System plików 1. Pojęcie pliku 2. Typy i struktury plików 3. etody dostępu do plików 4. Katalogi 5. Budowa systemu plików Pojęcie pliku (ang( ang. file)! Plik jest abstrakcyjnym obrazem informacji gromadzonej
Projektowanie bezpieczeństwa sieci i serwerów
Projektowanie bezpieczeństwa sieci i serwerów Konfiguracja zabezpieczeń stacji roboczej 1. Strefy bezpieczeństwa przeglądarki Internet Explorer. W programie Internet Explorer można skonfigurować ustawienia
Systemy rozproszone. na użytkownikach systemu rozproszonego wrażenie pojedynczego i zintegrowanego systemu.
Systemy rozproszone Wg Wikipedii: System rozproszony to zbiór niezależnych urządzeń (komputerów) połączonych w jedną, spójną logicznie całość. Połączenie najczęściej realizowane jest przez sieć komputerową..
Autor: inż. Wojciech Zatorski Opiekun pracy: dr inż. Krzysztof Małecki
Autor: inż. Wojciech Zatorski Opiekun pracy: dr inż. Krzysztof Małecki Cel Konfiguracja i testowanie serwera WWW Apache w celu optymalizacji wydajności. 2/25 Zakres Konfigurowanie serwera Apache jako wydajnego
Wprowadzenie do systemów operacyjnych. mgr inż. Krzysztof Szałajko
Wprowadzenie do systemów operacyjnych mgr inż. Krzysztof Szałajko Co to jest system operacyjny? Co to jest system komputerowy? 2 / 37 Definicja: system operacyjny System operacyjny jest programem pośredniczącym
Podstawy programowania. Wykład Funkcje. Krzysztof Banaś Podstawy programowania 1
Podstawy programowania. Wykład Funkcje Krzysztof Banaś Podstawy programowania 1 Programowanie proceduralne Pojęcie procedury (funkcji) programowanie proceduralne realizacja określonego zadania specyfikacja
Tworzenie programów równoległych cd. Krzysztof Banaś Obliczenia równoległe 1
Tworzenie programów równoległych cd. Krzysztof Banaś Obliczenia równoległe 1 Metodologia programowania równoległego Przykłady podziałów zadania na podzadania: Podział ze względu na funkcje (functional
Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family
Kod szkolenia: Tytuł szkolenia: HADOOP Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family Dni: 5 Opis: Adresaci szkolenia: Szkolenie jest adresowane do programistów, architektów oraz
Algorytmy i struktury danych. Wykład 4 Tablice nieporządkowane i uporządkowane
Algorytmy i struktury danych Wykład 4 Tablice nieporządkowane i uporządkowane Tablice uporządkowane Szukanie binarne Szukanie interpolacyjne Tablice uporządkowane Szukanie binarne O(log N) Szukanie interpolacyjne
Haszowanie (adresowanie rozpraszające, mieszające)
Haszowanie (adresowanie rozpraszające, mieszające) Tadeusz Pankowski H. Garcia-Molina, J.D. Ullman, J. Widom, Implementacja systemów baz danych, WNT, Warszawa, Haszowanie W adresowaniu haszującym wyróżniamy
Memeo Instant Backup Podręcznik Szybkiego Startu
Wprowadzenie Memeo Instant Backup pozwala w łatwy sposób chronić dane przed zagrożeniami cyfrowego świata. Aplikacja regularnie i automatycznie tworzy kopie zapasowe ważnych plików znajdujących się na
Serwer druku w Windows Server
Serwer druku w Windows Server Ostatnimi czasy coraz większą popularnością cieszą się drukarki sieciowe. Często w domach użytkownicy posiadają więcej niż jedno urządzenie podłączone do sieci, z którego
Indeksowanie w bazach danych
w bazach Katedra Informatyki Stosowanej AGH 5grudnia2013 Outline 1 2 3 4 Czym jest indeks? Indeks to struktura, która ma przyspieszyć wyszukiwanie. Indeks definiowany jest dla atrybutów, które nazywamy
Distributed Hash Tables i ich zastosowania
Distributed Hash Tables i ich zastosowania Seminarium z Systemów Rozproszonych, 2005/2006 Spis treści 1 Czym sa DHT? Typowe zastosowania 2 3 Sieci P2P Cooperative File System Czym sa DHT? Typowe zastosowania
Zaawansowany kurs języka Python
DBM, SQL 10 listopada 2011 Rodzaje baz danych Trwałe słowniki Klient-serwer SQL Bekreley DB Gnu dbm (n)dbm Firebird Sqlite Oracle MySQL PostgeSQL DB/2 Plan wykładu 1 Bazy danych DBM 2 3 4 Grafowe bazy
Big Data i 5V Nowe wyzwania w świecie danych Krzysztof Goczyła
Big Data i 5V Nowe wyzwania w świecie danych Krzysztof Goczyła Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska kris@eti.pg.gda.pl Sopot, 10.09.2014 1 O czym będzie? Co to jest Big
HADOOP Dariusz Ż bik
Dariusz Żbik DLACZEGO? Przetwarzanie dużych zbiorów danych Przykład wyszukiwanie w zbiorze 100TB 1 węzeł @ 40MB/s -> 30 dni MTBF ~ 3 lata 1000 węzłów @ 40MB/s -> 44 minuty MTBF ~ 1 dzień Potrzebny framework
w sieciach szerokopasmowych CATV i ISP - Model OSI
Technologie VoIP wykorzystywane w sieciach szerokopasmowych CATV i ISP - Model OSI mgr inż. Zbigniew Papuga Stowarzyszenie Elektryków Polskich W celu ujednolicenia struktury oprogramowania sieci komputerowych
IBM DCE/DFS. Mikołaj Gierulski. 17 stycznia 2003
IBM DCE/DFS Mikołaj Gierulski 17 stycznia 2003 1 Spis treści 1 IBM DCE 3 2 DCE/Distributed File Service 3 2.1 Rozwiązanie podstawowych problemów rozproszonych systemów plików.... 3 2.1.1 Nazewnictwo................................
Hurtownie danych wykład 5
Hurtownie danych wykład 5 dr Sebastian Zając SGH Warszawa 7 lutego 2017 1 Współbieżność i integracja Niezgodność impedancji 2 bazy danych Współbieżność i integracja Niezgodność impedancji Bazy relacyjne
Baza danych. Baza danych to:
Baza danych Baza danych to: zbiór danych o określonej strukturze, zapisany na zewnętrznym nośniku (najczęściej dysku twardym komputera), mogący zaspokoić potrzeby wielu użytkowników korzystających z niego
Problemy niezawodnego przetwarzania w systemach zorientowanych na usługi
Problemy niezawodnego przetwarzania w systemach zorientowanych na usługi Jerzy Brzeziński, Anna Kobusińska, Dariusz Wawrzyniak Instytut Informatyki Politechnika Poznańska Plan prezentacji 1 Architektura
Letnia Akademia SUSE. Implementacja nowych rozwiązań open source wszystko, co musisz wiedzieć!
Letnia Akademia SUSE Implementacja nowych rozwiązań open source wszystko, co musisz wiedzieć! Każdy kolejny czwartek do 7 września w godz. 10:00-12:00. Omawiane tematy: Dzisiaj: Budowa Software Defined
Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)
Big Data Organizacyjnie Prowadzący: dr Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl (hasło: BIG) Data Camp Architektura Data Lake Repozytorium służące składowaniu i przetwarzaniu danych o
Administracja i programowanie pod Microsoft SQL Server 2000
Administracja i programowanie pod Paweł Rajba pawel@ii.uni.wroc.pl http://www.kursy24.eu/ Zawartość modułu 9 Optymalizacja zapytań Pobieranie planu wykonania Indeksy i wydajność - 1 - Zadania optymalizatora
Techniki programowania INP001002Wl rok akademicki 2018/19 semestr letni. Wykład 3. Karol Tarnowski A-1 p.
Techniki programowania INP001002Wl rok akademicki 2018/19 semestr letni Wykład 3 Karol Tarnowski karol.tarnowski@pwr.edu.pl A-1 p. 411B Plan prezentacji Abstrakcja funkcyjna Struktury Klasy hermetyzacja
DHL CAS ORACLE Wymagania oraz instalacja
DHL CAS ORACLE Wymagania oraz instalacja Opis: Niniejszy dokument opisuje wymagania niezbędne do instalacji bazy danych DHL CAS ORACLE. Przedstawia również sam proces instalacji. Przeznaczony jest dla
Systemy rozproszone System rozproszony
Systemy rozproszone Wg Wikipedii: System rozproszony to zbiór niezależnych urządzeń (komputerów) połączonych w jedną, spójną logicznie całość. Połączenie najczęściej realizowane jest przez sieć komputerową.
współbieżność - zdolność do przetwarzania wielu zadań jednocześnie
Systemy rozproszone Wg Wikipedii: System rozproszony to zbiór niezależnych urządzeń (komputerów) połączonych w jedną, spójną logicznie całość. Połączenie najczęściej realizowane jest przez sieć komputerową.
Tworzenie partycji i dysków logicznych
Tworzenie partycji i dysków logicznych Podstawowe pojęcia Dysk twardy fizyczny napęd, który służy do przechowywania danych Dysk podstawowy zawierają tzw. woluminy podstawowe, takie jak partycje podstawowe
XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery
http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod
Spis treści. 1 Wprowadzenie. 1.1 Podstawowe pojęcia. 1 Wprowadzenie Podstawowe pojęcia Sieci komunikacyjne... 3
Spis treści 1 Wprowadzenie 1 1.1 Podstawowe pojęcia............................................ 1 1.2 Sieci komunikacyjne........................................... 3 2 Problemy systemów rozproszonych
Klient-Serwer Komunikacja przy pomocy gniazd
II Klient-Serwer Komunikacja przy pomocy gniazd Gniazda pozwalają na efektywną wymianę danych pomiędzy procesami w systemie rozproszonym. Proces klienta Proces serwera gniazdko gniazdko protokół transportu
Struktura i funkcjonowanie komputera pamięć komputerowa, hierarchia pamięci pamięć podręczna. System operacyjny. Zarządzanie procesami
Rok akademicki 2015/2016, Wykład nr 6 2/21 Plan wykładu nr 6 Informatyka 1 Politechnika Białostocka - Wydział Elektryczny Elektrotechnika, semestr II, studia niestacjonarne I stopnia Rok akademicki 2015/2016
Systemy operacyjne. System operacyjny Linux - wstęp. Anna Wojak
Systemy operacyjne System operacyjny Linux - wstęp Anna Wojak 1 1 Wstęp Linux jest systemem z rodziny Unix. Pierwsza wersja systemu została opracowana w 1969 roku przez K.Thompsona i D.Ritchie Jest to
1. Pamięć wirtualna. 2. Optymalizacja pliku pamięci wirtualnej
1. Pamięć wirtualna Jeśli na komputerze brakuje pamięci RAM wymaganej do uruchomienia programu lub wykonania operacji, system Windows korzysta z pamięci wirtualnej, aby zrekompensować ten brak. Aby sprawdzić,
Działanie komputera i sieci komputerowej.
Działanie komputera i sieci komputerowej. Gdy włączymy komputer wykonuje on kilka czynności, niezbędnych do rozpoczęcia właściwej pracy. Gdy włączamy komputer 1. Włączenie zasilania 2. Uruchamia
Problemy optymalizacji, rozbudowy i integracji systemu Edu wspomagającego e-nauczanie i e-uczenie się w PJWSTK
Problemy optymalizacji, rozbudowy i integracji systemu Edu wspomagającego e-nauczanie i e-uczenie się w PJWSTK Paweł Lenkiewicz Polsko Japońska Wyższa Szkoła Technik Komputerowych Plan prezentacji PJWSTK
Big Data to skalowalność i prostota obsługi wielkich ilości danych!
Obsługa aplikacji, które operują na ogromnych zbiorach danych, czyli na przykład portali społecznościowych, przekracza możliwości zwykłych relacyjnych baz. Praca ze złożonymi zbiorami danych wymaga architektury
Zapewnienie wysokiej dostępności baz danych. Marcin Szeliga MVP SQL Server MCT
Zapewnienie wysokiej dostępności baz Marcin Szeliga MVP SQL Server MCT Agenda Techniki zapewniania wysokiej dostępności baz Zasada działania mirroringu baz Wdrożenie mirroringu Planowanie Konfiguracja
16MB - 2GB 2MB - 128MB
FAT Wprowadzenie Historia FAT jest jednym z najstarszych spośród obecnie jeszcze używanych systemów plików. Pierwsza wersja (FAT12) powstała w 1980 roku. Wraz z wzrostem rozmiaru dysków i nowymi wymaganiami
Metody Kompilacji Wykład 1 Wstęp
Metody Kompilacji Wykład 1 Wstęp Literatura: Alfred V. Aho, Ravi Sethi, Jeffrey D. Ullman: Compilers: Princiles, Techniques, and Tools. Addison-Wesley 1986, ISBN 0-201-10088-6 Literatura: Alfred V. Aho,
Systemy zarządzania produkcją - MES
Systemy zarządzania produkcją - MES Laboratorium 1: Instalacja i konfiguracja środowiska Qcadoo MES 2014 Instalacja środowiska Qcadoo MES Najprostszym sposobem instalacji środowiska Qcadoo MES jest pobranie
Lab 9 Podstawy Programowania
Lab 9 Podstawy Programowania (Kaja.Gutowska@cs.put.poznan.pl) Wszystkie kody/fragmenty kodów dostępne w osobnym pliku.txt. Materiały pomocnicze: Wskaźnik to specjalny rodzaj zmiennej, w której zapisany
76.Struktura oprogramowania rozproszonego.
76.Struktura oprogramowania rozproszonego. NajwaŜniejsze aspekty obiektowego programowania rozproszonego to: Współdziałanie (interoperability) modułów programowych na róŝnych maszynach. Wielokrotne wykorzystanie
Wdrożenie modułu płatności eservice. dla systemu Gekosale 1.4
Wdrożenie modułu płatności eservice dla systemu Gekosale 1.4 - dokumentacja techniczna Wer. 01 Warszawa, styczeń 2014 1 Spis treści: 1 Wstęp... 3 1.1 Przeznaczenie dokumentu... 3 1.2 Przygotowanie do integracji...
Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24
Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24 Agenda Serp24 NoSQL Integracja z CMS Drupal Przetwarzanie danych Podsumowanie Serp24 Darmowe narzędzie Ułatwia planowanie
Uniwersytet Zielonogórski Instytut Sterowania i Systemów Informatycznych. Algorytmy i struktury danych Laboratorium Nr 4
Uniwersytet Zielonogórski Instytut Sterowania i Systemów Informatycznych Algorytmy i struktury danych Laboratorium Nr 4 Algorytmy sortowania zewnętrznego 1 Wstęp Bardzo często przy rozwiązywaniu praktycznych
ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0
ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0 Przeznaczenie Sylabusa Dokument ten zawiera szczegółowy Sylabus dla modułu ECDL/ICDL Użytkowanie baz danych. Sylabus opisuje zakres wiedzy
Projektowanie logiki aplikacji
Jarosław Kuchta Projektowanie Aplikacji Internetowych Projektowanie logiki aplikacji Zagadnienia Rozproszone przetwarzanie obiektowe (DOC) Model klas w projektowaniu logiki aplikacji Klasy encyjne a klasy
Programowanie aplikacji na iphone. Wstęp do platformy ios. Łukasz Zieliński
Programowanie aplikacji na iphone. Wstęp do platformy ios. Łukasz Zieliński Plan Prezentacji. Programowanie ios. Jak zacząć? Co warto wiedzieć o programowaniu na platformę ios? Kilka słów na temat Obiective-C.
Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego
Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego Mariusz Uchroński 3 grudnia 2010 Plan prezentacji 1. Wprowadzenie 2.
instrukcja użytkownika terminala ARGOX PA-20 SYSTEMY AUTOMATYCZNEJ IDENTYFIKACJI
instrukcja użytkownika terminala ARGOX PA-20 SYSTEMY AUTOMATYCZNEJ IDENTYFIKACJI SPIS TREŚCI 04 Opis opcji terminala 05 SKANOWANIE 06 Skanowanie kod 07 Skanowanie kod ilość 08 Skanowanie kod ilość cena
ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0
ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0 Przeznaczenie Sylabusa Dokument ten zawiera szczegółowy Sylabus dla modułu ECDL/ICDL Użytkowanie baz danych. Sylabus opisuje zakres wiedzy
Podstawy Informatyki. Metody dostępu do danych
Podstawy Informatyki c.d. alina.momot@polsl.pl http://zti.polsl.pl/amomot/pi Plan wykładu 1 Bazy danych Struktury danych Średni czas odszukania rekordu Drzewa binarne w pamięci dyskowej 2 Sformułowanie
Analiza ilościowa w przetwarzaniu równoległym
Komputery i Systemy Równoległe Jędrzej Ułasiewicz 1 Analiza ilościowa w przetwarzaniu równoległym 10. Analiza ilościowa w przetwarzaniu równoległym...2 10.1 Kryteria efektywności przetwarzania równoległego...2
Program Rejestr zużytych materiałów. Instrukcja obsługi
Program Rejestr zużytych materiałów. Instrukcja obsługi Autor: Andrzej Woch Tel. 663 772 789 andrzej@awoch.com www.awoch.com Spis treści Wstęp... 1 Informacje dla administratora i ADO... 1 Uwagi techniczne...
System plików ReiserFs
System plików ReiserFs Mateusz Zakrzewski 18 stycznia 2004 1 Najważniejsze informacje. Autor tego systemu plików: Hans Reiser oraz firma Namesys. ReiserFs to skrót od Reiser File System. Wersja 3 to najnowsza
Zarządzanie projektem informatycznym
Zarządzanie projektem informatycznym Radosław Klimek 2001-10 C B A http://home.agh.edu.pl/rklimek 1 2 Lista slajdów 5 Szacowanie parametrów projektu informatycznego (uzupełnienie) 6 Diagramy DFD/ERD a
Sortowanie zewnętrzne
Algorytmy i struktury danych Instytut Sterowania i Systemów Informatycznych Wydział Elektrotechniki, Informatyki i Telekomunikacji Uniwersytet Zielonogórski Sortowanie zewnętrzne 1 Wstęp Bardzo często
Specyfikacja API Runtime BAS 3.0
Specyfikacja API Runtime BAS 3.0 Spis treści Wstęp... 4 Informacja o dokumencie... 4 Opis usługi... 4 Typowy sposób wywołania usługi... 5 Udostępniane funkcje... 6 Funkcje liczące... 6 Execute... 6 SafeExecute...
Przesyłania danych przez protokół TCP/IP
Przesyłania danych przez protokół TCP/IP PAKIETY Protokół TCP/IP transmituje dane przez sieć, dzieląc je na mniejsze porcje, zwane pakietami. Pakiety są często określane różnymi terminami, w zależności
Systemy operacyjne. Paweł Pełczyński
Systemy operacyjne Paweł Pełczyński ppelczynski@swspiz.pl 1 Program przedmiotu Wprowadzenie Struktura systemów operacyjnych Procesy i Wątki Komunikacja międzyprocesowa Szeregowanie procesów Zarządzanie
Dokumentacja techniczna. Młodzieżowe Pośrednictwo Pracy
Dokumentacja techniczna Młodzieżowe Pośrednictwo Pracy Spis Treści 1. Widok ogólny architektury MPP... 3 2. Warstwy systemu... 5 3. Struktura systemu/komponentów... 7 3.1 Aplikacje... 7 3.2 Biblioteki...
Wprowadzenie. Dariusz Wawrzyniak 1
Dariusz Wawrzyniak Politechnika Poznańska Instytut Informatyki ul. Piotrowo 2 (CW, pok. 5) 60-965 Poznań Dariusz.Wawrzyniak@cs.put.poznan.pl Dariusz.Wawrzyniak@put.edu.pl www.cs.put.poznan.pl/dwawrzyniak
Programowanie Strukturalne i Obiektowe Słownik podstawowych pojęć 1 z 5 Opracował Jan T. Biernat
Programowanie Strukturalne i Obiektowe Słownik podstawowych pojęć 1 z 5 Program, to lista poleceń zapisana w jednym języku programowania zgodnie z obowiązującymi w nim zasadami. Celem programu jest przetwarzanie
Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL
Podstawy baz danych: Rysunek 1. Tradycyjne systemy danych 1- Obsługa wejścia 2- Przechowywanie danych 3- Funkcje użytkowe 4- Obsługa wyjścia Ewolucja baz danych: Fragment świata rzeczywistego System przetwarzania
Przewodnik korzystania z Biblioteki kursów na platformach e-learningowych RON
RCI KRAKÓW Przewodnik korzystania z Biblioteki kursów na platformach e-learningowych RON WERSJA 1.1 Szarłowicz Piotr 10.2018 Spis treści 1. Wprowadzenie... 2 2. Wyszukiwanie kursów w bibliotece.... 3 3.
Zadanie 1: Protokół ślepych podpisów cyfrowych w oparciu o algorytm RSA
Informatyka, studia dzienne, inż. I st. semestr VI Podstawy Kryptografii - laboratorium 2010/2011 Prowadzący: prof. dr hab. Włodzimierz Jemec poniedziałek, 08:30 Data oddania: Ocena: Marcin Piekarski 150972
Wzorce projektowe. dr inż. Marcin Pietroo
Wzorce projektowe dr inż. Marcin Pietroo Adapter - strukturalny wzorzec projektowy, którego celem jest umożliwienie współpracy dwóm klasom o niekompatybilnych interfejsach - adapter przekształca interfejs
System operacyjny MACH
Emulacja w systemie MCH System operacyjny MCH 4. SD Systemu V HP/UX MS-DOS VMS inne Mikrojądro Zbigniew Suski Zbigniew Suski Podstawowe cele projektu MCH! Dostarczenie podstawy do budowy innych systemów
High Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009
High Performance Computers in Cyfronet Andrzej Oziębło Zakopane, marzec 2009 Plan Podział komputerów dużej mocy Podstawowe informacje użytkowe Opis poszczególnych komputerów Systemy składowania danych
Task Parallel Library
Task Parallel Library Daan Leijen, Wolfram Schulte, and Sebastian Burckhardt prezentacja Michał Albrycht Agenda O potrzebie zrównoleglania Przykłady użycia TPL Tasks and Replicable Tasks Rozdzielanie zadań
Middleware wprowadzenie października 2010
Dariusz Wawrzyniak Politechnika Poznańska Instytut Informatyki ul. Piotrowo 2 (CW, pok. 5) 60-965 Poznań Dariusz.Wawrzyniak@cs.put.poznan.pl Dariusz.Wawrzyniak@put.edu.pl www.cs.put.poznan.pl/dwawrzyniak/middleware
Projektowanie algorytmów równoległych. Zbigniew Koza Wrocław 2012
Projektowanie algorytmów równoległych Zbigniew Koza Wrocław 2012 Spis reści Zadniowo-kanałowy (task-channel) model algorytmów równoległych Projektowanie algorytmów równoległych metodą PACM Task-channel
JĘZYKI PROGRAMOWANIA Z PROGRAMOWANIEM OBIEKTOWYM. Wykład 6
JĘZYKI PROGRAMOWANIA Z PROGRAMOWANIEM OBIEKTOWYM Wykład 6 1 SPECYFIKATOR static Specyfikator static: Specyfikator ten powoduje, że zmienna lokalna definiowana w obrębie danej funkcji nie jest niszczona
java.util.* :Kolekcje Tomasz Borzyszkowski
java.util.* :Kolekcje Tomasz Borzyszkowski Wstęp Kolekcje w Java dają programiście pewien standardowy sposób radzenia sobie z przetwarzaniem grup obiektów. Implementacja kolekcji w Java składa się z następujących
Wykład VII. Kryptografia Kierunek Informatyka - semestr V. dr inż. Janusz Słupik. Gliwice, 2014. Wydział Matematyki Stosowanej Politechniki Śląskiej
Wykład VII Kierunek Informatyka - semestr V Wydział Matematyki Stosowanej Politechniki Śląskiej Gliwice, 2014 c Copyright 2014 Janusz Słupik Problem pakowania plecaka System kryptograficzny Merklego-Hellmana
Wypożyczalnia VIDEO. Technologie obiektowe
Wypożyczalnia VIDEO Jest to program do obsługi wypożyczalni i wypożyczeń klientów. Głównym zadaniem programu jest zarządzanie wypożyczeniami i drukowanie potwierdzenia wypożyczenia oraz naliczenie punktów
Middleware wprowadzenie października Dariusz Wawrzyniak (IIPP) 1
Dariusz Wawrzyniak Politechnika Poznańska Instytut Informatyki ul. Piotrowo 2 (CW, pok. 5) 60-965 Poznań Dariusz.Wawrzyniak@cs.put.poznan.pl poznan pl Dariusz.Wawrzyniak@put.edu.pl www.cs.put.poznan.pl/dwawrzyniak/middleware
ZASADY PROGRAMOWANIA KOMPUTERÓW
POLITECHNIKA WARSZAWSKA Instytut Automatyki i i Robotyki ZASADY PROGRAMOWANIA KOMPUTERÓW Język Język programowania: C/C++ Środowisko programistyczne: C++Builder 6 Wykład 9.. Wskaźniki i i zmienne dynamiczne.