PLNOG#10 Hadoop w akcji: analiza logów 1
|
|
- Bożena Skiba
- 5 lat temu
- Przeglądów:
Transkrypt
1 PLNOG#10 Hadoop w akcji: analiza logów 1
2 Hadoop w akcji: analiza logów rkadiusz Osiński arkadiusz.osinski@allegro.pl PLNOG#10 Hadoop w akcji: analiza logów 2
3 genda 1. Hadoop 2. HDFS 3. YRN 4. Map & Reduce 5. Hive 6. Hadoop Streaming PLNOG#10 Hadoop w akcji: analiza logów 3
4 Czym Hadoop jest? - Rozproszony system przetwarzania informacji - Połączenie systemu plików oraz frameworka do wykonywania zadań PLNOG#10 Hadoop w akcji: analiza logów 4
5 HDFS - Hadoop Distributed File System - Możliwe uzyskanie środowiska H PLNOG#10 Hadoop w akcji: analiza logów 5
6 HDFS - Hadoop Distributed File System - Możliwe uzyskanie środowiska H - Rack wareness - Łatwe skalowanie + Commodity hardware PLNOG#10 Hadoop w akcji: analiza logów 6
7 HDFS - Hadoop Distributed File System - Możliwe uzyskanie środowiska H - Rack wareness - Łatwe skalowanie + Commodity hardware - Nie wymaga RID - Replikacja zasobów PLNOG#10 Hadoop w akcji: analiza logów 7
8 HDFS - Hadoop Distributed File System - Możliwe uzyskanie środowiska H - Rack wareness - Łatwe skalowanie + Commodity hardware - Nie wymaga RID - Replikacja zasobów - Kontrola dostępu do zasobów - Łatwy dostęp: CLI, HTTP, FUSE PLNOG#10 Hadoop w akcji: analiza logów 8
9 H HDFS Name Node Name Node ZooKeeper Journal Node Data Node PLNOG#10 Hadoop w akcji: analiza logów 9
10 HDFS B Rack 1 Replikacja: 3 Rack 2 PLNOG#10 Hadoop w akcji: analiza logów 10
11 HDFS B Rack 1 Replikacja: 3 Rack 2 PLNOG#10 Hadoop w akcji: analiza logów 11
12 HDFS B Rack 1 Replikacja: 3 Rack 2 PLNOG#10 Hadoop w akcji: analiza logów 12
13 HDFS B Rack 1 Replikacja: 3 Rack 2 PLNOG#10 Hadoop w akcji: analiza logów 13
14 HDFS B B Rack 1 Replikacja: 3 Rack 2 PLNOG#10 Hadoop w akcji: analiza logów 14
15 HDFS B B Rack 1 Replikacja: 3 B Rack 2 PLNOG#10 Hadoop w akcji: analiza logów 15
16 HDFS B B B Rack 1 Replikacja: 3 B Rack 2 PLNOG#10 Hadoop w akcji: analiza logów 16
17 YRN - Yet nother Resource Negotiator - Framework do zarządzania zasobami PLNOG#10 Hadoop w akcji: analiza logów 17
18 YRN - Yet nother Resource Negotiator - Framework do zarządzania zasobami - Umożliwia uruchamianie zadań MapReduce (lecz nie tylko) - Zadania uruchamiane z uprawnieniami właściciela PLNOG#10 Hadoop w akcji: analiza logów 18
19 YRN - Yet nother Resource Negotiator - Framework do zarządzania zasobami - Umożliwia uruchamianie zadań MapReduce (lecz nie tylko) - Zadania uruchamiane z uprawnieniami właściciela - Kolejki zadań + kontrola dostępu - Wydzielanie zasobów dla kolejek (RM) PLNOG#10 Hadoop w akcji: analiza logów 19
20 YRN - Yet nother Resource Negotiator - Framework do zarządzania zasobami - Umożliwia uruchamianie zadań MapReduce (lecz nie tylko) - Zadania uruchamiane z uprawnieniami właściciela - Kolejki zadań + kontrola dostępu - Wydzielanie zasobów dla kolejek (RM) - SPOF - ResourceManager - Wersja alpha PLNOG#10 Hadoop w akcji: analiza logów 20
21 Map PLNOG Polish Network Operators Group PLNOG Map Key->Value PLNOG -> 1 Polish -> 1 Network -> 1 Operators -> 1 Group -> 1 PLNOG ->1 PLNOG#10 Hadoop w akcji: analiza logów 21
22 Reduce Group -> 1 Reduce Network -> 1 Operators -> 1 PLNOG -> 1 PLNOG -> 1 Reduce Reduce Reduce Group -> 1 Network -> 1 Operators -> 1 PLNOG -> 2 Polish -> 1 Polish -> 1 Reduce PLNOG#10 Hadoop w akcji: analiza logów 22
23 Hive hive (logs)> desc apachelog; col_name data_type Vhost string, servername string, httpson string, xrealip string, Clientip string, userident string, incomingdate string, Incomingtime string, timezone string, executiontime int, outputsize int, Outputsizewheader int, outputcode int, method string, source_host string, url string, querystring string, Referer string, useragent string, v_date string v_hour string PLNOG#10 Hadoop w akcji: analiza logów 23
24 Hive hive (logs)> show partitions apachelog; (... ) v_date= /v_hour=22 v_date= /v_hour=23 v_date= /v_hour=00 v_date= /v_hour=01 v_date= /v_hour=02 v_date= /v_hour=03 v_date= /v_hour=04 (... ) PLNOG#10 Hadoop w akcji: analiza logów 24
25 PLNOG#10 Hadoop w akcji: analiza logów 25
26 Hive hive (logs)> select count(*) from apachelog where v_date= ; (... ) hive (logs)> select source_host, sum(executiontime)/count(*) as avg_time from apachelog where v_date= group by source_host; (... ) hive (logs)> select xrealip,url,query from apachelog where v_date= and outputcode >= 500; PLNOG#10 Hadoop w akcji: analiza logów 26
27 Perl + Geolokalizacja/ Map while(<>) { chomp($_); = split(/\ /,$_); my ($country_code, (..),$city, (..) ) = $gi->get_city_record($fields[3]); $country_code = "NN" unless $country_code; $city = "NN" unless $city; } print $fields[0]." ".$country_code." ".$city."\t"."1\n"; PLNOG#10 Hadoop w akcji: analiza logów 27
28 Perl + Geolokalizacja / Reduce while (<>) { = split(/\t/,$_); if ( $key ne $line[0] ) { print $key." ".$counter."\n"; $counter=1; $key = $line[0]; } else { $counter++; }; } print $key." ".$counter."\n"; PLNOG#10 Hadoop w akcji: analiza logów 28
29 Perl + Geolokalizacja $ hadoop jar /usr/lib/hadoop-mapreduce/hadoop-streaming.jar -Dmapred.job.queue.name=q_projects -files./geo_ip_map.pl,./geo_ip_reduce.pl,./geolitecity.dat,./geopp.pm -mapper geo_ip_map.pl -reducer geo_ip_reduce.pl -input /lokalizacja/w/hdfs/logi -output /lokalizacja/w/hdfs/rezultat PLNOG#10 Hadoop w akcji: analiza logów 29
30 Perl + Geolokalizacja $ hdfs dfs ls /lokalizacja/w/hdfs/rezultat -rw-r--r-- 3 user group 0 /_SUCCESS -rw-r--r-- 3 user group /part $ hdfs dfs cat /lokalizacja/w/hdfs/rezultat/part (... ) Serwis.pl PL Poznan 4729 Serwis_kolejny.pl PL Torun 2652 Serwis_kolejny.pl PL Gdansk 373 (... ) PLNOG#10 Hadoop w akcji: analiza logów 30
31 Python import sys badwords = ['zakazane','slowa'] for line in sys.stdin: line = line.strip() for word in badwords: if word in line.lower(): print word+"\t"+line PLNOG#10 Hadoop w akcji: analiza logów 31
32 Python $ hadoop jar /usr/lib/hadoop-mapreduce/hadoop-streaming.jar -Dmapred.job.queue.name=q_projects -files./scan_map.py -mapper scan_map.py -input /lokalizacja/w/hdfs/logi -output /lokalizacja/w/hdfs/rezultat PLNOG#10 Hadoop w akcji: analiza logów 32
33 Dziękuję! Q & PLNOG#10 Hadoop w akcji: analiza logów 33
Architektura rozproszonych magazynów danych
Big data Big data, large data cloud. Rozwiązania nastawione na zastosowanie w wielkoskalowych serwisach, np. webowych. Stosowane przez Google, Facebook, itd. Architektura rozproszonych magazynów danych
Zaawansowany kurs języka Python
DBM, SQL 10 listopada 2011 Rodzaje baz danych Trwałe słowniki Klient-serwer SQL Bekreley DB Gnu dbm (n)dbm Firebird Sqlite Oracle MySQL PostgeSQL DB/2 Plan wykładu 1 Bazy danych DBM 2 3 4 Grafowe bazy
Map Reduce Wprowadzenie do Apache Hadoop
Map Reduce Wprowadzenie do Apache Hadoop 8 maja 2014 Opis pliku z zadaniami Wszystkie zadania na zajęciach będą przekazywane w postaci plików PDF sformatowanych jak ten. Będą się na nie składały różne
a) ile wynosiła populacja najbardziej i najmniej ludnego z województw (oraz jakie były ich nazwy)
Spis treści 1 TI:WTBD/Ćwiczenia 14 1.1 Sprawdzian 2 - SQL. 1.1.1 Grupa 1 1.1.2 przykład rozwiązania dla zadania gr. 1 1.1.3 Grupa 2 1.1.4 przykład rozwiązania dla gr. 2 TI:WTBD/Ćwiczenia 14 Sprawdzian
HADOOP Dariusz Ż bik
Dariusz Żbik DLACZEGO? Przetwarzanie dużych zbiorów danych Przykład wyszukiwanie w zbiorze 100TB 1 węzeł @ 40MB/s -> 30 dni MTBF ~ 3 lata 1000 węzłów @ 40MB/s -> 44 minuty MTBF ~ 1 dzień Potrzebny framework
Hadoop i Spark. Mariusz Rafało
Hadoop i Spark Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl WPROWADZENIE DO EKOSYSTEMU APACHE HADOOP Czym jest Hadoop Platforma służąca przetwarzaniu rozproszonemu dużych zbiorów danych. Jest
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Map-Reduce system Single-node architektura 3 Przykład Googla 4 10 miliardów stron internetowych Średnia
Map Reduce Proste zliczanie słów i zapytania SQL
Map Reduce Proste zliczanie słów i zapytania SQL 15 maja 2014 Opis pliku z zadaniami Wszystkie zadania na zajęciach będą przekazywane w postaci plików PDF sformatowanych jak ten. Będą się na nie składały
Wprowadzenie do Apache Spark. Jakub Toczek
Wprowadzenie do Apache Spark Jakub Toczek Epoka informacyjna MapReduce MapReduce Apache Hadoop narodziny w 2006 roku z Apache Nutch open source składa się z systemu plików HDFS i silnika MapReduce napisany
Apache Hadoop. Wolna implementacja GFS, MapReduce oraz Big Table. Michał Jaszczyk
Co to jest Hadoop? Trochę historii Wolna implementacja GFS, oraz Big Table Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Seminarium Systemów Rozproszonych 6 listopada 2008 Co to jest
Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family
Kod szkolenia: Tytuł szkolenia: HADOOP Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family Dni: 5 Opis: Adresaci szkolenia: Szkolenie jest adresowane do programistów, architektów oraz
Bazy danych. dr inż. Arkadiusz Mirakowski
Bazy danych dr inż. Arkadiusz Mirakowski Początek pracy z Transact SQL (T-SQL) 153.19.7.13,1401 jkowalski nr indeksu 2 Perspektywa - tabela tymczasowa - grupowanie Perspektywa (widok) Perspektywa (widok)
Wprowadzenie do Hurtowni Danych
Wprowadzenie do Hurtowni Danych BIG DATA Definicja Big Data Big Data definiowane jest jako składowanie zbiorów danych o tak dużej złożoności i ilości danych, że jest to niemożliwe przy zastosowaniu podejścia
Python. Wprowadzenie. Jolanta Bachan
Python Wprowadzenie Jolanta Bachan Zainstaluj i przetestuj Pythona https://www.python.org/downloads/ print 'Hello world!' operatory numeryczne: + - * / // % ** operatory porównania: ==!= > < >=
Apache Hadoop framework do pisania aplikacji rozproszonych
Apache Hadoop framework do pisania aplikacji rozproszonych Piotr Praczyk Wprowadzenie Istnieje wiele rodzajów obliczeń, których wykonywanie na pojedynczej maszynie, nawet najpotężniejszej, jest zbyt czasochłonne.
Hadoop - wprowadzenie. Łukasz Król
Hadoop - wprowadzenie Łukasz Król Hadoop - wprowadzenie obszar działalności: hurtownie danych programowanie ETL Business Intelligence Big Data programowanie obliczeń rozproszonych uczenie maszynowe statystyka
Searching for SNPs with cloud computing
Ben Langmead, Michael C Schatz, Jimmy Lin, Mihai Pop and Steven L Salzberg Genome Biology November 20, 2009 April 7, 2010 Problem Cel Problem Bardzo dużo krótkich odczytów mapujemy na genom referencyjny
Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family
Kod szkolenia: Tytuł szkolenia: HADOOP Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family Dni: 5 Partner merytoryczny Opis: Adresaci szkolenia: Szkolenie jest adresowane do programistów,
Zagadnienia. Konstrukcja bibliotek mysql i mysqli w PHP. Dynamiczne generowanie stron. Połączenie, zapytanie i sesja
Zagadnienia Konstrukcja bibliotek mysql i mysqli w PHP Dynamiczne generowanie stron Połączenie, zapytanie i sesja Podstawowe opakowanie dla zapytań SQL w PHP Zarządzania uŝytkownikami Włamania do mysql
SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik
SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop Piotr Borowik Wyzwania związane z Big Data Top Hurdles with Big data Source: Gartner (Sep 2014), Big Data Investment Grows
Hadoop : kompletny przewodnik : analiza i przechowywanie danych / Tom White. Gliwice, cop Spis treści
Hadoop : kompletny przewodnik : analiza i przechowywanie danych / Tom White. Gliwice, cop. 2016 Spis treści Przedmowa 17 Wprowadzenie 19 Kwestie porządkowe 20 Co nowego znajdziesz w wydaniu czwartym? 20
Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)
Big Data Organizacyjnie Prowadzący: dr Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl (hasło: BIG) Zaliczenie: Praca na zajęciach Egzamin Projekt/esej zaliczeniowy Plan zajęć # TEMATYKA ZAJĘĆ
Kurs rozszerzony języka Python
GTK+, cd 1 grudnia 2017 Plan wykładu 1 Wątki w GTK+ Zadania okresowe Prawdziwe wątki GNOME 2 Systemy zorientowane na dokumenty Grafowe bazy danych Bazy typu klucz wartość Wątki w GTK+ GNOME Plan wykładu
Zaawansowany kurs języka Python
Wykład 4. 23 października 2015 Plan wykładu 1 2 Pliki tekstowe Trwałość obiektów CSV Strumienie Plan wykładu 1 2 Pliki tekstowe Trwałość obiektów CSV Strumienie Protokół iteracyjny Producent Umiem dostarczać
Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)
Big Data Organizacyjnie Prowadzący: dr Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl (hasło: BIG) Automatyzacja Automatyzacja przetwarzania: Apache NiFi Źródło: nifi.apache.org 4 Automatyzacja
Bazy Danych - Instrukcja do Ćwiczenia laboratoryjnego nr 8
Bazy Danych - Instrukcja do Ćwiczenia laboratoryjnego nr 8 Bazowy skrypt PHP do ćwiczeń z bazą MySQL: Utwórz skrypt o nazwie cw7.php zawierający następującą treść (uzupełniając go o właściwą nazwę uŝytkownika
SQL Server 2016 w świecie Big Data
temat prelekcji.. SQL Server 2016 w świecie Big Data prowadzący Bartłomiej Graczyk Data Platform Solution Architect bartlomiej.graczyk@microsoft.com bartek@graczyk.info.pl Agenda Dane na świecie wczoraj,
Wprowadzenie do technologii JavaServer Faces 2.1 na podstawie http://docs.oracle.com/javaee/6/tutorial/doc/
Wprowadzenie do technologii JavaServer Faces 2.1 na podstawie http://docs.oracle.com/javaee/6/tutorial/doc/ Aplikacja internetowa tworzona na podstawie bazy danych. Programowanie komponentowe 2, Zofia
(kod ten służy wprowadzeniu definicji mediany, nie jest to optymalna ani nawet szczególnie dobra implementacja obliczania mediany w praktyce!
Spis treści 1 TI:WTBD/Kolokwium Poprawkowe 1.1 zadanie 1 1.1.1 1.2 zadanie 2 1.2.1 1.3 zadanie 3 1.3.1 TI:WTBD/Kolokwium Poprawkowe zadanie 1 Medianę sekwencji liczb można zdefiniować za pomocą następującego
MapReduce. Janina Mincer-Daszkiewicz Systemy rozproszone. MSUI, II rok
MapReduce Janina Mincer-Daszkiewicz Systemy rozproszone MSUI, II rok Materiały i rysunki zaczerpnięto z następujących źródeł 1. Jeffrey Dean,Sanjay Ghemawat, MapReduce: Simplified Data Processing on Large
Iwona Milczarek, Małgorzata Marcinkiewicz, Tomasz Staszewski. Poznań, 30.09.2015
Iwona Milczarek, Małgorzata Marcinkiewicz, Tomasz Staszewski Poznań, 30.09.2015 Plan Geneza Architektura Cechy Instalacja Standard SQL Transakcje i współbieżność Indeksy Administracja Splice Machince vs.
Podstawy programowania w Pythonie
Podstawy programowania w Pythonie Wykład 6 dr Andrzej Zbrzezny Instytut Matematyki i Informatyki Akademia Jana Długosza w Częstochowie 21 listopada 2012 dr Andrzej Zbrzezny (IMI AJD) Podstawy programowania
Informacje organizacyjne:
Informacje organizacyjne: 1. Zaliczenie przedmiotu zostanie przeprowadzone w formie testu, z którego będzie można zdobyć maksymalnie 100 punktów. Skala ocen: 00 50 punktów: 2 51 60 punktów: 3 61 70 punktów:
Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)
Big Data Organizacyjnie Prowadzący: dr Mariusz Rafało mrafalo@sgh.waw.pl http://mariuszrafalo.pl (hasło: BIG) Data Camp Architektura Data Lake Repozytorium służące składowaniu i przetwarzaniu danych o
LIGHTTPD szybkość i prostota. Robert Partyka
LIGHTTPD szybkość i prostota Dlaczego LIGHTTPD Składnia pliku konfiguracyjnego Podstawowa konfiguracja Czego najbardziej potrzebujemy Jeśli nie LIGHTTPD to co? Dlaczego LIGHTTPD problem C10K Chcemy obsłużyć
BigData. 2014 PILAB S.A./Krystian Piećko/CTO/krystian.piecko@pilab.pl/ / Wstęp. / Co to jest BigData? / Co to jest Hadoop?
Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it / Wstęp / Co to jest BigData? /
Kurs języka Python Wykład 8. Przetwarzanie tekstu Wyrażenia regularne Biblioteka urllib Parsowanie html'a XML
Kurs języka Python Wykład 8. Przetwarzanie tekstu Wyrażenia regularne Biblioteka urllib Parsowanie html'a XML Wyrażenia regularne c:\> dir *.exe $ rm *.tmp Wyrażenia regularne 'alamakota' '(hop!)*' { '',
Wprowadzenie do technologii JavaServer Faces 2.1 na podstawie http://docs.oracle.com/javaee/6/tutorial/doc/
Wprowadzenie do technologii JavaServer Faces 2.1 na podstawie http://docs.oracle.com/javaee/6/tutorial/doc/ Aplikacja internetowa tworzona na podstawie bazy danych. Programowanie komponentowe 2, Zofia
Pobieranie argumentów wiersza polecenia
Pobieranie argumentów wiersza polecenia 2. Argumenty wiersza polecenia Lista argumentów Lista argumentów zawiera cały wiersz poleceń, łącznie z nazwą programu i wszystkimi dostarczonymi argumentami. Przykłady:
EGZAMIN MATURALNY OD ROKU SZKOLNEGO
EGZAMIN MATURALNY OD ROKU SZKOLNEGO 2014/2015 INFORMATYKA POZIOM ROZSZERZONY ROZWIĄZANIA ZADAŃŃ I SCHEMATY PUNKTOWANIA (A1, A2, A3, A4, A6, A7) GRUDZIEŃ 2013 Zadanie 1. Test (0 5) Wymagania ogólne I. [
(Apache) CouchDB. Krzysztof Kulewski 2008
(Apache) CouchDB Krzysztof Kulewski 2008 Czym CouchDB nie jest? Czym CouchDB nie jest? Relacyjną bazą danych Czym CouchDB nie jest? Relacyjną bazą danych Zamiennikiem dla relacyjnej bazy danych Czym CouchDB
NoSQL Not Only SQL, CouchDB. I.Wojnicki, NoSQL. Apache CouchDB has started. Time to relax. Igor Wojnicki
29 października 2014 Igor Wojnicki (AGH, KIS) CouchDB 29 października 2014 1 / 53 NoSQL Not Only SQL, CouchDB Apache CouchDB has started. Time to relax. Igor Wojnicki Katedra Informatyki Stosowanej, Akademia
MeetingHelper. Aplikacja Android ułatwiająca przekazywanie materiałów pomiędzy uczestnikami spotkania. Instrukcja obsługi dla programisty
MeetingHelper Aplikacja Android ułatwiająca przekazywanie materiałów pomiędzy uczestnikami spotkania Instrukcja obsługi dla programisty W tej części został zawarty opis uruchamiania projektu programistycznego,
Wprowadzenie do psql i SQL. Język komend psql. Podstawy instrukcji SELECT
Wprowadzenie do psql i SQL 1 Bazy Danych Wykład p.t. Wprowadzenie do psql i SQL. Język komend psql. Podstawy instrukcji SELECT Antoni Ligęza ligeza@agh.edu.pl http://galaxy.uci.agh.edu.pl/~ligeza Wykorzystano
znaleźć wszystkie rekordy dotyczące adresów przy ulicy Hożej (dowolnego miasta!);
TI:WTBD/Ćwiczenia 9 przykład użycia SQLite w Pythonie: własnej roboty narzędzie do interaktywnych zapytań zapytania (SELECT) ze złączeniami (wewnętrznymi) zapytania agregujące tworzymy i wypełniamy danymi
JĘZYK PYTHON - NARZĘDZIE DLA KAŻDEGO NAUKOWCA. Marcin Lewandowski [ ]
JĘZYK PYTHON - NARZĘDZIE DLA KAŻDEGO NAUKOWCA Marcin Lewandowski [ mlew@ippt.gov.pl ] PYTHON 3 2 Int int jest obecnie odpowiednikiem dawnego long int nie ma wartości maksymalnej (sys.maxint) 2/4 == 0.5
CouchDB. Michał Nowikowski
CouchDB Michał Nowikowski Agenda Wprowadzenie do CouchDB Mój przypadek Wyniki i wnioski Dokumenty CouchDB Format JSON Pary nazwa wartość Możliwe tablice i struktury Załączniki Brak limitów na liczbę i
TECHNOLOGIE BIG DATA A BEZPIECZEŃSTWO INFORMATYCZNE WE KNOW YOU KNOW. silmine.com
TECHNOLOGIE BIG DATA A BEZPIECZEŃSTWO INFORMATYCZNE WE KNOW YOU KNOW. silmine.com 13 + 13 LAT DOŚWIADCZENIA PONAD 480 ZREALIZOWANYCH PROJEKTÓW PARTNERSTWO Naszą ambicją jest dostarczać klientom szeroki
Ą Ń Ę Ę Ą Ę Ć ź Ż Ż Ą ń Ź Ż Ż ń ń Ź Ą Ń Ą Ą Ę ń ź Ę Ę Ż Ć Ą ź Ą Ę ń ź Ę ń ń Ą Ż Ę ń Ą ń ń Ę Ę Ę Ź ń Ę ń ń ń ń Ź Ę Ś ź Ą Ń ń Ż Ź Ę Ź ń ń ń Ę Ę ń Ż Ą ń ńń Ś ń ń Ż Ż Ę Ż Ń Ę Ą Ń Ł ń ń ń ń ń ń ń ń Ś Ź Ę Ś
Ł ŚĆ ń Ś Ł Ź Ć Ł Ą ńń ć Ż Ą Ł Ś ń Ł ć Ś ń ć ć ć Ó Ż ć ć Ą Ś ć Ś ć Ń Ś ć Ś ć Ś Ć Ś Ż Ś Ś Ż Ś Ó ń ć ć Ź Ł ć ć ć ń ń ć ć Ą ć ć ć Ź ć ć ć ć ć ć Ó Ź Ó Ł Ł Ń ć ć Ź Ą ć ć ń ć Ą ć ć ć Ł Ź Ź Ź Ż Ł Ż Ł Ż ć ń ć Ą
JĘZYK PYTHON - NARZĘDZIE DLA KAŻDEGO NAUKOWCA. Marcin Lewandowski [ mlew@ippt.gov.pl ]
JĘZYK PYTHON - NARZĘDZIE DLA KAŻDEGO NAUKOWCA Marcin Lewandowski [ mlew@ippt.gov.pl ] PROGRAMOWANIE SIECIOWE 2 TCP/IP = UDP + TCP TCP/IP składa się z dwóch podstawowych protokołów: TCP i UDP. TCP jest
NoSQL: Riak. dr inż. Sebastian Ernst Katedra Informatyki Stosowanej
NoSQL: Riak dr inż. Sebastian Ernst Katedra Informatyki Stosowanej Twierdzenie CAP W przypadku rozdziału węzłów (partition), możliwe jest zachowanie jednej z dwóch cech: spójności (consistency) wszystkie
Zaawansowane aplikacje WWW - laboratorium
Zaawansowane aplikacje WWW - laboratorium Przetwarzanie XML (część 2) Celem ćwiczenia jest przygotowanie aplikacji, która umożliwi odczyt i przetwarzanie pliku z zawartością XML. Aplikacja, napisana w
Jak zatrudnić słonie do replikacji baz PostgreSQL
Jesień Linuksowa 2007, 22 września O projekcie... system replikacji danych dla PostgreSQL rozwijany od 2004 roku Open Source Licencja BSD Jan Wieck@Afilias... i inni aktualna seria 1.2.x
Szkolenie autoryzowane. MS 6419 Konfiguracja, zarządzanie i utrzymanie systemów Windows Server 2008
Szkolenie autoryzowane MS 6419 Konfiguracja, zarządzanie i utrzymanie systemów Windows Server 2008 Strona szkolenia Terminy szkolenia Rejestracja na szkolenie Promocje Opis szkolenia Szkolenie, podczas
Kurs języka Python Wykład 6. Pliki tekstowe Pliki rekordów Pliki CSV Strumienie
Kurs języka Python Wykład 6. Pliki tekstowe Pliki rekordów Pliki CSV Strumienie Operacje na plikach Otwarcie i zamknięcie pliku: fh = open('plik', 'r') Atrybuty: 'r' odczyt 'w' zapis 'a' dopisanie 'r+'
Język Python. Język Python 1/35
Język Python Język Python 1/35 Język Python 2/35 Wstęp Uruchamianie interpretera python Skrypty wykonywalne #!/usr/bin/python #!/usr/bin/env python lub #!/usr/bin/python3 #!/usr/bin/env python3 chmod +x
Programowanie i projektowanie obiektowe
Programowanie i projektowanie obiektowe CherryPy, Genshi Paweł Daniluk Wydział Fizyki Jesień 2016 P. Daniluk(Wydział Fizyki) PO w. IX Jesień 2016 1 / 20 Aplikacje webowe Podejście standardowe Serwer (np.
NoSQL & relax with CouchDB
NoSQL & relax with PyWaw #23 8 kwiecień 2013 Agenda 1 NoSQL - nierelacyjne systemy baz danych Wprowadzenie do NoSQL Rodzaje i porównanie baz NoSQL Polyglot persistence 2 Projekt w CERN wykorzystujacy 3
R i ekosystem Hadoop
R i ekosystem Hadoop... czyli integracja środowiska R z technologiami big data Marek Wiewiórka Instytut Informatyki, Politechnika Warszawska 19 lutego 2016 Plan prezentacji 1 Wstęp 2 Architektura big data
Internetowe bazy danych
Wyższa Szkoła Technologii Teleinformatycznych w Świdnicy Internetowe bazy danych wykład 8 dr inż. Jacek Mazurkiewicz e-mail: Jacek.Mazurkiewicz@pwr.wroc.pl Dynamicznie tworzony formularz // nazwa tabeli,
Komunikacja Człowiek-Komputer
Komunikacja Człowiek-Komputer Wprowadzenie do Python a Wojciech Jaśkowski Instytut Informatyki Politechnika Poznańska Wersja: 14 października 2013 Hello world print( Hello world ) Dlaczego Python? Prosty
Definicja. Not Only SQL
Definicja Not Only SQL Baza danych NoSQL to program zapewniający szybki dostęp do danych różniący się w jakiś sposób od stadardowych baz RDBMS. Baza NoSQL to szereg różnych rozwiązań nazwanych jednym określeniem.
Aby uzyskać zaliczenie w pierwszym terminie (do 30 stycznia 2018) rozliczyć trzeba co najmniej 8 projektów, po 4 z każdej z części: C++ oraz Python.
Aby uzyskać zaliczenie w pierwszym terminie (do 30 stycznia 2018) rozliczyć trzeba co najmniej 8 projektów, po 4 z każdej z części: C++ oraz Python. Pliki z rozwiązaniami projektu (wszystkie polecenia
Python. Skąd taka nazwa? Kurs systemu UNIX 1
Python Skąd taka nazwa? Kurs systemu UNIX 1 Cechy języka marketing Obiektowy (dużo prostszy od C++) Darmowy Nie tylko Unix (choć tam najpopularniejszy) Wiele bibliotek (np. Tkinter, czyli interfejs do
PERL zarządzanie złożonością. Pavel Pachkouski
PERL zarządzanie złożonością Pavel Pachkouski Plan prezentacji Introduction Hello world Podstawy programowania w Perl Wyrażenia regularne Pewne ogólne Perl funkcje Zaawansowane funkcje Wnioski Co to jest
Big Data to skalowalność i prostota obsługi wielkich ilości danych!
Obsługa aplikacji, które operują na ogromnych zbiorach danych, czyli na przykład portali społecznościowych, przekracza możliwości zwykłych relacyjnych baz. Praca ze złożonymi zbiorami danych wymaga architektury
Z-ID-608b Bazy danych typu Big Data Big Data Databases. Specjalnościowy Obowiązkowy Polski Semestr VI
KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angieskim Obowiązuje od roku akademickiego 015/016 Z-ID-608b Bazy danych typu Big Data Big Data Databases A. USYTUOWANIE MODUŁU
CZĘŚĆ I. WARSTWA PRZETWARZANIA WSADOWEGO
Spis treści Przedmowa Podziękowania O książce Rozdział 1. Nowy paradygmat dla Big Data 1.1. Zawartość książki 1.2. Skalowanie tradycyjnej bazy danych 1.2.1. Skalowanie za pomocą kolejki 1.2.2. Skalowanie
HTTP, CGI, Perl. HTTP HyperText Transfer Protocol. CGI Common Gateway Interface. Perl Practical Extraction and Report Language
HTTP, CGI, Perl HTTP HyperText Transfer Protocol CGI Common Gateway Interface Perl Practical Extraction and Report Language Przeglądarka HTTP Serwer WWW CGI Moduł HTTP (1) Protokół bezpołączeniowy działający
EMC ViPR Pamięć masowa definiowana programowo
EMC ViPR Pamięć masowa definiowana programowo Prawdziwa wirtualizacja Karol Boguniewicz, vspecialist, EMC Mirosław Kulka, Systems Engineer, EMC 1 Tradycyjne spojrzenie na Centrum Danych MESSAGING ERP/CRM
Multimedialne bazy danych - laboratorium
Multimedialne bazy danych - laboratorium Oracle Multimedia (rozwiązania) Celem ćwiczenia jest zapoznanie się z obiektowymi typami danych Oracle dedykowanymi do obsługi multimediów. Autor ćwiczenia: Marek
Wdrożenie skalowalnego systemu plików GlusterFS w serwisach Gratka.pl. Łukasz Jagiełło l.jagiello@gratka-technologie.pl
Wdrożenie skalowalnego systemu plików GlusterFS w serwisach Gratka.pl Łukasz Jagiełło l.jagiello@gratka-technologie.pl Po co nam storage? Po co nam storage? Co mamy do dyspozycji? Co mamy do dyspozycji?
Ćwiczenia laboratoryjne nr 11 Bazy danych i SQL.
Prezentacja Danych i Multimedia II r Socjologia Ćwiczenia laboratoryjne nr 11 Bazy danych i SQL. Celem ćwiczeń jest poznanie zasad tworzenia baz danych i zastosowania komend SQL. Ćwiczenie I. Logowanie
Zaawansowany kurs języka Python
Wykład 5. 30 października 2013 Plan wykładu 1 2 3 4 yield from Zamiast Example for item in iterable: yield item: można pisać Example yield from iterable Plan wykładu 1 2 3 4 Przykłady wyrażeń regularnych
Wątki i komunikacja między nimi w języku Python
Wątki i komunikacja między nimi w języku Python Czyli kolejny poziom abstrakcji. Michał Mazurek mazurek.michal@gmail.com http://www.ifresearch.pl January 14, 2008 Python? A co to? Python Interpretowany,
akademia androida Składowanie danych część VI
akademia androida Składowanie danych część VI agenda 1. SharedPreferences. 2. Pamięć wewnętrzna i karta SD. 3. Pliki w katalogach /res/raw i /res/xml. 4. Baza danych SQLite. 5. Zadanie. 1. SharedPreferences.
41. Zmienne lokalne muszą mieć nazwę, którą poprzedza (maksymalnie 128 znaków) oraz typ (każdy z wyjątkiem: text, ntext oraz image)
Elementy języka T-SQL 40. Polecenie PRINT jest wykorzystywane do przekazania wiadomości tekstowej (maksymalna długość 8000 znaków) Przykład PRINT 'Aktualna data: '+convert(char(8),getdate()) PRINT 'Aktualny
Sposoby tworzenia projektu zawierającego aplet w środowisku NetBeans. Metody zabezpieczenia komputera użytkownika przed działaniem apletu.
Sposoby tworzenia projektu zawierającego aplet w środowisku NetBeans. Metody zabezpieczenia komputera użytkownika przed działaniem apletu. Dr inż. Zofia Kruczkiewicz Dwa sposoby tworzenia apletów Dwa sposoby
Sprzeg podstawowy do baz danych w PHP Mateusz Sowa, 2007
1. Wstęp PHP jest to skryptowy język programowania wykonywany po stronie serwera (server-side) służący do generowania stron internetowych. Skrypty napisane w PHP po uruchomieniu nie są kompilowane do postaci
Programowanie funkcyjne w Pythonie
Programowanie funkcyjne w Pythonie Koªo DSG 2013 Konrad Siek konrad.siek@cs.put.edu.pl dsg.cs.put.poznan.pl Paradygmat funkcyjny Paradygmat = sposób my±lenia o problemach Paradygmat funkcyjny Paradygmat
MongoDB. wprowadzenie. dr inż. Paweł Boiński, Politechnika Poznańska
MongoDB wprowadzenie dr inż. Paweł Boiński, Politechnika Poznańska Plan Historia Podstawowe pojęcia: Dokument Kolekcja Generowanie identyfikatora Model danych Dokumenty zagnieżdżone Dokumenty z referencjami
Podstawy informatyki
Podstawy informatyki WYKŁAD nr 02 Fizyka Techniczna, WFT PP Michał Hermanowicz Zakład Fizyki Obliczeniowej, Instytut Fizyki, Politechnika Poznańska Rok akademicki 2018/2019 M. Hermanowicz (IF PP) Podstawy
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych Przetwarzanie i organizowanie danych : bazy danych Nr ćwiczenia 10 Temat Aplikacje
Language INtegrated Query (LINQ)
Języki Programowania na Platformie.NET (część 2) http://www.kaims.pl/ goluch/ goluch@eti.pg.gda.pl Zastosowanie LINQ pozwala na dostęp do danych w formie podobnej do SQL. Możliwy jest dostęp do danych:
Zarządzanie wieloserwerowym środowiskiem SAS z wykorzystaniem SAS Grid Managera. Katarzyna Wyszomierska
Zarządzanie wieloserwerowym środowiskiem SAS z wykorzystaniem SAS Grid Managera Katarzyna Wyszomierska Wyzwania administratora Nowe oprogra mowanie Sprzęt Użytkownicy Dane Wyzwania administratora Potrzebne
Letnia Akademia SUSE. Implementacja nowych rozwiązań open source wszystko, co musisz wiedzieć!
Letnia Akademia SUSE Implementacja nowych rozwiązań open source wszystko, co musisz wiedzieć! Każdy kolejny czwartek do 7 września w godz. 10:00-12:00. Omawiane tematy: Dzisiaj: Budowa Software Defined
SPECYFIKACJA FUNKCJONALNA OPROGRAMOWANIA 11 marca 2014 XLZEBRAPRINTER
XLZEBRAPRINTER Oprogramowanie XLZebraPrinter służy do wykonywania dowolnych wydruków etykiet (łącznie z możliwością wydruku kodów kreskowych 1D oraz 2D) na podstawie danych pochodzących bezpośrednio z
FORMULARZ OFERTY CENOWEJ. Future Processing Sp. z o.o. ul. Bojkowska 37A Gliwice NIP: NIP:
Załącznik nr 1 do Zapytania ofertowego FORMULARZ OFERTY CENOWEJ Wykonawca: Zamawiający: Future Processing Sp. z o.o. ul. Bojkowska 37A 44-100 Gliwice NIP: NIP: 634-25-32-128 Nawiązując do ogłoszenia o
Zadania do wykonania na laboratorium
Lab Oracle Katowice 2013v1 Fizyczna i logiczna struktura bazy danych 1 http://platforma.polsl.pl/rau2/mod/folder/view.php?id=9975 RB_lab2_v04st Przykładowe pomocne strony www: Zadania do wykonania na laboratorium
Wieloplatformowe aplikacje sieciowe. dr inż. Juliusz Mikoda mgr inż. Anna Wawszczak
Wieloplatformowe aplikacje sieciowe dr inż. Juliusz Mikoda mgr inż. Anna Wawszczak SOAP Serwer: Axis2 / Java Wbudowany komponent nasłuchujący, (Apache / Tomcat) Client Axis2 klient / XML Jeżyk programowania:
Bazy Danych i Usługi Sieciowe
Bazy Danych i Usługi Sieciowe Język PHP Paweł Daniluk Wydział Fizyki Jesień 2013 P. Daniluk (Wydział Fizyki) BDiUS w. VIII Jesień 2013 1 / 43 Plan wykładu 1 Język PHP 2 Składnia PHP 3 Dostęp do bazy danych
Jerzy Nawrocki, Wprowadzenie do informatyki
Wydział Informatyki Politechnika Poznańska jerzy.nawrocki@put.poznan.pl Baza danych Bazy danych = zorganizowana kolekcja danych Bazy danych (2) Cel Agenda Przedstawić relacyjny model baz danych Era przed-relacyjna
Krok po kroku... (czyli jak stworzyć i wydrukować krzyżówkę)
- Program do tworzenia krzyżówek. - Krzyżówki mogą być przygotowywane w formie drukowanej lub elektronicznej. - Program jest bezpłatny, jeśli ćwiczenia przygotowywane za jego pomocą są udostępniane odbiorcą