Modelowanie wydajności i optymalizacja na współczesnych architekturach obliczeniowych. Miłosz Ciżnicki, Piotr Kopta Poznań,
|
|
- Wacław Zych
- 6 lat temu
- Przeglądów:
Transkrypt
1 Modelowanie wydajności i optymalizacja na współczesnych architekturach obliczeniowych Miłosz Ciżnicki, Piotr Kopta Poznań,
2 Outline How fast is CPU? Application characteristic Tools available in PSNC Roofline model Example: EULAG
3 What determines performance How fast is CPU? How fast data can be moved? Application characteristic (CPU-bound or memory-bound) Performance optimization for one application may not work for the other Running benchmarks helps to understand limitations of the hardware Profiling code helps to understand application performance characteristic (and limitations)
4 CPU-bound vs Mem-bound Compute-bound time to complete task is determined by the speed/number of CPUs Memory-bound - time to complete task is determined by the memory latency and/or bandwidth Nowadays it is less likely to have just one component being responsible for the time required to complete task However starting from multicore era, the memory latency and bandwidth became important bottleneck
5 How to run faster - cache Level 1 Level 2 Level 3... Level n Size of memory Increasing distance from CPU = greater access time Example: L1: 32 kb, latency 3 cycles L2: 256 kb, latency 10 cycles L3: 8MB, latency 40 cycles DRAM: 16GB, latency 200 cycles DISK: 1TB, latency cycles Cache hit data found in cache Cache miss data not found in cache, thus must be copied from lower memory level Capacity miss cache runs out of space for new data Conflict miss more that one item is mapped to the same location in cache
6 How to run faster cont. Pipelining Multiple steps in one operation: fetch, decode, execute, memory, write back Dependencies and branching may affect the pipeline Instruction level parallelism (superscalar) Multiple instructions executed at the same time Loop unroling Multicore Combines caches, pipelining and superscalars
7 Fast and slow operations In terms of cost Fast and inexpensive: add, multiply, sub, fma (fused multiply add) Medium: divide, modules, sqrt Slow: trans (support in newer CPUs and GPUs) Very slow: power Use linear algebra (BLAS, LAPACK) and math libraries (Intel MKL)
8 Code optimization Use math, BLAS, LAPACK libraries (for effcient math routines, to utilize max. of pipelining instructions) Efficient code is often not very portable (performance is decreased among different architectures) Use compilers optimizations (but can t optimize everything) Profile your code Use accelerators (GPUs) and coprocessors (Intel Phi) Write generic code + specialized kernels matrix (2048 x 2048) product Cholesky (4096) decomposition MKL single core vs naive single core speedup 52x 12x MKL (up to 28 cores) vs naive single core speedup 543x 190x
9 Assesing performance strong vs. weak scaling Strong scaling: fixed problem size, measure speedup with more processors Example: WRF climate modelling application Weak scaling: test for time for fixed problem size per number of processors Example: LINPACK benchmark, more efficient with more memory
10 Assesing performance time vs FLOPS Does execution time give enough information about application performance? FLOPS/s - how many floating points operation per second can your code do? Peak performance clock rate * number of single/double precision add and or muls per clock or FMA E.g. 2.0GHz * 8 FLOP / clock = 16 GFLOP/s Can never be reach (data load/store) Suistained performance application dependant Does FLOP/s gives enough information about performance?
11 QPI QPI CORE AVX L1/L2 QPI LLC 2.5 MB CORE AVX L1/L2 QPI LLC 2.5 MB CORE AVX L1/L2 QPI LLC 2.5 MB CORE AVX L1/L2 QPI LLC 2.5 MB CORE AVX L1/L2 QPI LLC 2.5 MB CORE AVX L1/L2 QPI LLC 2.5 MB CORE AVX L1/L2 QPI LLC 2.5 MB CORE AVX L1/L2 QPI LLC 2.5 MB QPI QPI Intel Xeon E v3 2.6 GHz (3.6 GHz Turbo) 14 cores Theoretical performance ~650 GFlops Memory bandwidth 68 GB/s AVX 2 LLC 2.5 MB LLC 2.5 MB LLC 2.5 MB LLC 2.5 MB QPI QPI QPI QPI L1/L2 L1/L2 L1/L2 L1/L2 AVX AVX AVX AVX CORE CORE CORE CORE LLC 2.5 MB LLC 2.5 MB QPI QPI L1/L2 L1/L2 AVX AVX CORE CORE Memory Ctrl Memory Ctrl DDR DDR DDR DDR 4 x double 8 x float 32 x byte
12 Wyzwania współczesnych architektur obliczeniowych 650 Gflops only for FMA (ang. fused multiply-add) d = a b + c 325 Gflops for the other operations ~ 10 flops / B for (single precision float) d = a d + c (a, c constants) - 2 flops, 8 B 68 GB/s, 27 G(single precision float)/s, < 9 G(double precision float)s Vectorization SIMD Multithreading 14 cores
13 Hardware performance counters Set of special-purpose hardware registers to store counts of hardware-related activities Can help in spotting the application bottlenecks Allow for low-level performance analysis and tuning, though implementation may be somehow difficult Examples Cache misses Branch mispredictions Memory latency and bandwidth
14 Data access Across nodes and to main memory Data access time is measured in terms of bandwidth and latency Stream benchmark Latency is the startup time for memory, important for short memory transfers Time = latency + lenght/bandwidth Solution cache memory and multithreading
15 Narzędzia dostępne na zasobach PCSS Intel Parallel Studio XE 2017 (najnowsza dostępna wersja) Kompilatory C++ C++ 11, C99, OpenMP 4.1, automatyczna wektoryzacja Fortran Fortran IV/77/90/95/2003/2008, DO CONCURRENT, OpenMP 4.0 Biblioteki Intel Math Kernel Library (Intel MKL) zestaw zoptymalizowanych funkcji z dziedzin algebry liniowej (BLAS, LAPACK), transformat Fourier a, sieci neuronowych, funkcji statystycznych, zagadnień własnych Rogue Wave IMSL Fortran Numerical Library zestaw zoptymalizowanych komercyjnych bibliotek z dziedziny analizy numerycznej oraz statystyki Intel Data Analytics Acceleration Library (Intel DAAL) biblioteka zawierająca funkcje wykorzystywane w uczeniu maszynowym, realizujące wszystkie etapy analizy danych (preprocessing, transformacje, modelowanie, weryfikację) Intel Integrated Performance Primitives (Intel IPP) zestaw algorytmów do przetwarzania sygnałów, obrazów, kompresji, kryptografii (możliwa integracja z biblioteką OpenCV) Intel Threading Building Blocks model tworzenia programów równoległych w języku C++, dostarcza mechanizmów do allokacji pamięci, zarządzania przepływem danych i operacji synchronizujących w środowisku równoległym na platformach heterogenicznych
16 Narzędzia dostępne na zasobach PCSS Intel Parallel Studio 2017 XE (najnowsza dostępna wersja) Narzędzia Intel VTune Amplifier XE profiler aplikacji równoległych (CPU/GPU) wyposażony w interfejs GUI dający możliwość analizy aplikacji pod względem wykorzystania CPU, skalowalności, dostępu do pamięci oraz wykorzystania jednostek wektorowych Intel Inspector debugger kodu ułatwiający znajdowanie błędów związanych synchronizacją kodu wielowątkowego oraz dostępem do pamięci Intel Advisor narzędzie wspomagające optymalizację kodu pod kątem wektoryzacji oraz przetwarzania wielowątkowego, wskazuje miejsca oraz metody które pomogą zwiększyć wydajność oraz skalowalność aplikacji Intel Trace Analyzer and Collector profiler dla aplikacji równoległych wykorzystujących wymianę komunikatów (MPI), dostarcza zestawu statystyk pozwalających na analizę komunikacji oraz balansu obciążenia aplikacji, dzięki małemu narzutowi na wydajność oraz możliwości pracy wsadowej umożliwia badanie wielkoskalowych aplikacji (>10k procesów)
17 Przegląd narzędzi wspomagających programowanie ( ) 2-dwu dniowe szkolenie dotyczące narzędzi Intel dostępnych na klastrze Eagle Intel Parallel Studio XE Intel C++ & Fortran Compilers OpenMP 4 Intel MKL Intel Vtune Miejsce: PCSS Zapisy:
18 Performance modelling How to measure performance Execution time Energy usage Different models to choose The old way (when data movement was not so expensive) : FLOPS/s how many floating points operation per second Performance may be memory-latency or memory-bandwidth bound rather than compute-bound Performance modelling is used to determine best possible performance on your hardware (does execution time tell it?)
19 The Roofline Model P max = Applicable peak performance, assuming data comes from L1 cache I = Computational intensity ( work per byte transferred) over the slowest data path utilized ( the bottleneck ) I = W/Q W FLOPs Q - bytes b s = Applicable peak bandwidth of the slowest data path utilized Estimated performance: P = min(p max, I * b s )
20 The Roofline Model
21 The Roofline Model
22 The Roofline Model Methodology To construct roofline plots we need to measure three code specific quantities: W, Q and T Measuring W and Q How to measure it? Code analysis Hardware Performance Counters Instrumentation
23 Code analysis Methodology Consider the daxpy routine for(j = 0; j < 10; j++) for(i = 0; i < n; i++) c[i] = a[i] + b[i] * scalar Quantities for the double precision W = 2n Qr >= 16n Qw >= 8n Q = Qr + Qw >= 24n I = 2/24 = 1/12 For n = 10 8 W = 2 GFLOP Q >= 24 GB
24 Intel Xeon CPU E v3 Haswell 14 cores GHz ( GHz turbo) 32 kb L1 data cache per core 256 kb L2 cache per core 35 MB L3 cache per chip DDR4 memory interface 256 bit SIMD FP unit - AVX ~325 GFLOP/s DP peak
25 Nvidia Tesla K20m Kepler GK110 K20m 2496 cores GHz 13 SMX units with 192 cores each 1.25 MB L2 cache 1.17 TFLOP/s DP peak PCI Express 3:1 SP:DP performance
26 CPU vs GPU Intel Xeon E v3 Haswell Nvidia K20m Kepler Process size 22 nm 28 nm Transistor count 5.69 Billion 7.1 Billion Release date Q Q GHz AVX 0.7 GHz Performance/core 23.2 GFLOP/s 0.47 GFLOP/s Total performance GFLOP/s 1170 GLOP/s Stream BW 68 GB/s 173 GB/s (ECC=0) TDP 145 W 225 W Performance/Watt 2.24 GFLOP/W 5.2 GFLOP/W
27 Code analysis Methodology On Intel Xeon E v3 b s = 68GB/s I = 2/24 = 1/12 P = min(p max, I * b s ) I * b s = 1/12 * 68 = 5.66 GFLOP/s (1.7% of peak performance) P max = GLOP/s (14 FP units x 2 x 4 FLOP/cy x 2.9 GHz) P = min(324.8, 5.66) = 5.66 GFLOP/s
28 Code analysis Methodology On Kepler K20m b s = 173GB/s I = 2/24 = 1/12 P = min(p max, I * b s ) I * b s = 1/12 * 173 = GFLOP/s (1.2% of peak performance) P max = 1170 GLOP/s (13 SMX x 64 DP units x 2 FLOP/cy x GHz) P = min(1170, 14.41) = GFLOP/s
29 EULAG activities Adaptation to novel hardware architectures Urban modelling Contamination dispersion
30 Grant of the Polish National Science Center Project description Methods and algorithms for organization of computations in the class of anelastic numerical models for geophysical flows on modem computer architectures with realization in the EULAG model Goal: parallelize GCR solver and 3D MPDATA algorithm on modern hybrid CPU-GPU clusters and NUMA architectures Consortium: Czestochowa University of Technology Institute of Meteorology and Water Management - National Research Institute Poznan Supercomputing and Networking Center
31 Weak scaling Multi-CPU and multi-gpu performance scaling Project description Architecture Speedup CPU -> opt CPU 1.4 CPU -> GPU 6 CPU -> opt CPU+GPU 7 Strong scaling
32 Weak scaling Multi-CPU and multi-gpu performance per Watt scaling Project description Architecture opt CPU -> GPU 2.13 opt CPU -> optcpu+gpu Power efficiency 1.88 Strong scaling
33 Pytania
34 THANK YOU Poznan Supercomputing and Networking Center affiliated to the Institute of Bioorganic Chemistry of the Polish Academy of Sciences, ul. Noskowskiego 12/14, Poznań, POLAND, Office: phone center: (+48 61) , fax: (+48 61) ,
PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK
1 PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK POLITECHNIKA CZĘSTOCHOWSKA 2 Część teoretyczna Informacje i wstępne wymagania Cel przedmiotu i zakres materiału Zasady wydajnego
PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK
1 PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK POLITECHNIKA CZĘSTOCHOWSKA 2 Trendy rozwoju współczesnych procesorów Budowa procesora CPU na przykładzie Intel Kaby Lake
Tychy, plan miasta: Skala 1: (Polish Edition)
Tychy, plan miasta: Skala 1:20 000 (Polish Edition) Poland) Przedsiebiorstwo Geodezyjno-Kartograficzne (Katowice Click here if your download doesn"t start automatically Tychy, plan miasta: Skala 1:20 000
Instruction Set Instruction Set Extensions Embedded Options Available. Recommended Customer Price TRAY: $999.00
Processor Number i7-3960x # of Cores 6 # of Threads 12 Clock Speed 3.3 GHz Max Turbo Frequency 3.9 GHz Intel Smart Cache 15 MB Bus/Core Ratio 33 DMI 5 GT/s Instruction Set 64-bit Instruction Set Extensions
Procesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności.
Procesory wielordzeniowe (multiprocessor on a chip) 1 Procesory wielordzeniowe 2 Procesory wielordzeniowe 3 Intel Nehalem 4 5 NVIDIA Tesla 6 ATI FireStream 7 NVIDIA Fermi 8 Sprzętowa wielowątkowość 9 Architektury
Maciej Sypniewski. lato 2014, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych
lato 2014,, Wydział Elektroniki i Technik Informacyjnych SSE, SSE2, SSE3, SSE4, AVX, C++11 threads OpenMP, OpenACC CUDA, OpenCL, C++ AMP 2 Prawo Amdahla Prawo Gustafsona Czy warto zajmować się obliczeniami
Wstęp. Przetwarzanie równoległe. Krzysztof Banaś Obliczenia równoległe 1
Wstęp. Przetwarzanie równoległe. Krzysztof Banaś Obliczenia równoległe 1 Historia i pojęcia wstępne Obliczenia równoległe: dwa lub więcej procesów (wątków) jednocześnie współpracuje (komunikując się wzajemnie)
Wykorzystanie architektury Intel MIC w obliczeniach typu stencil
Wykorzystanie architektury Intel MIC w obliczeniach typu stencil Kamil Halbiniak Wydział Inżynierii Mechanicznej i Informatyki Kierunek informatyka, Rok IV Instytut Informatyki Teoretycznej i Stosowanej
Performance Evaluation
Performance Evaluation When using parallel system the goal of design process is not to optimise a single metric such as a speed. A good design must optimise a problem-specific function of execution time,
Studia II stopnia. studia stacjonarne. wspólny dla kierunku. Zakład Fizyki Jądrowej
Nazwa przedmiotu Nazwa przedmiotu w języku Kod przedmiotu Nowoczesne technologie obliczeniowe Modern computing technologies Wersja przedmiotu - rok NTO wprowadzenia tej wersji A. Usytuowanie przedmiotu
Implementacje nowych technologii serwerowych
Implementacje nowych technologii serwerowych Technologie serwerowe - nowości Nowe generacje procesorów, proces technologiczny Serwery w nowych formach: 2U TwinPro2, 2U Twin, FatTwin, MicroCloud Rozwiązania
Obliczenia Wysokiej Wydajności
Obliczenia wysokiej wydajności 1 Wydajność obliczeń Wydajność jest (obok poprawności, niezawodności, bezpieczeństwa, ergonomiczności oraz łatwości stosowania i pielęgnacji) jedną z najważniejszych charakterystyk
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition) Robert Respondowski Click here if your download doesn"t start automatically Wojewodztwo Koszalinskie:
Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)
Zakopane, plan miasta: Skala ok. 1:15 000 = City map (Polish Edition) Click here if your download doesn"t start automatically Zakopane, plan miasta: Skala ok. 1:15 000 = City map (Polish Edition) Zakopane,
Dostęp do europejskich systemów obliczeniowych Tier-0/Tier-1 w ramach PRACE
Dostęp do europejskich systemów obliczeniowych Tier-0/Tier-1 w ramach PRACE KONFERENCJA UŻYTKOWNIKÓW KDM 2017 Nowe trendy w użytkowaniu KDM Mirosław Kupczyk, PCSS 24.5.2017 Tier-0: komputery klasy Petaflops
Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science
Proposal of thesis topic for mgr in (MSE) programme 1 Topic: Monte Carlo Method used for a prognosis of a selected technological process 2 Supervisor: Dr in Małgorzata Langer 3 Auxiliary supervisor: 4
Revenue Maximization. Sept. 25, 2018
Revenue Maximization Sept. 25, 2018 Goal So Far: Ideal Auctions Dominant-Strategy Incentive Compatible (DSIC) b i = v i is a dominant strategy u i 0 x is welfare-maximizing x and p run in polynomial time
Wstęp. Przetwarzanie współbieżne, równoległe i rozproszone
Wstęp. 1 Cel zajęć Zapoznanie z technikami i narzędziami programistycznymi służącymi do tworzenia programów równoległych Przedstawienie sprzętu wykorzystywanego do obliczeń równoległych Nauczenie sposobów
Hard-Margin Support Vector Machines
Hard-Margin Support Vector Machines aaacaxicbzdlssnafiyn9vbjlepk3ay2gicupasvu4iblxuaw2hjmuwn7ddjjmxm1bkcg1/fjqsvt76fo9/gazqfvn8y+pjpozw5vx8zkpvtfxmlhcwl5zxyqrm2vrg5zw3vxmsoezi4ogkr6phieky5crvvjhriqvdom9l2xxftevuwcekj3lktmhghgniauiyutvrwxtvme34a77kbvg73gtygpjsrfati1+xc8c84bvraowbf+uwnipyehcvmkjrdx46vlykhkgykm3ujjdhcyzqkxy0chur6ax5cbg+1m4bbjptjcubuz4kuhvjoql93hkin5hxtav5x6yyqopnsyuneey5ni4keqrxbar5wqaxbik00icyo/iveiyqqvjo1u4fgzj/8f9x67bzmxnurjzmijtlybwfgcdjgfdtajwgcf2dwaj7ac3g1ho1n4814n7wwjgjmf/ys8fenfycuzq==
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition) Robert Respondowski Click here if your download doesn"t start automatically Wojewodztwo Koszalinskie:
MaPlan Sp. z O.O. Click here if your download doesn"t start automatically
Mierzeja Wislana, mapa turystyczna 1:50 000: Mikoszewo, Jantar, Stegna, Sztutowo, Katy Rybackie, Przebrno, Krynica Morska, Piaski, Frombork =... = Carte touristique (Polish Edition) MaPlan Sp. z O.O Click
i3: internet - infrastruktury - innowacje
i3: internet - infrastruktury - innowacje Wykorzystanie procesorów graficznych do akceleracji obliczeń w modelu geofizycznym EULAG Roman Wyrzykowski Krzysztof Rojek Łukasz Szustak [roman, krojek, lszustak]@icis.pcz.pl
Dostęp do europejskich systemów obliczeniowych Tier-0 w ramach PRACE
Dostęp do europejskich systemów obliczeniowych Tier-0 w ramach PRACE KONFERENCJA UŻYTKOWNIKÓW KDM 2016 W kierunku obliczeń Exaskalowych Mirosław Kupczyk, PCSS 28.06.2016 Misja PRACE HPC Dla Przemysłu Zagwarantowanie
COMPUTER ORGANIZATION AND DESIGN The Hardware/Software Interface. Wprowadzenie do systemów wieloprocesorowych
COMPUTER ORGANIZATION AND DESIGN The Hardware/Software Interface Wprowadzenie do systemów wieloprocesorowych Wstęp Do tej pory mówiliśmy głównie o systemach z jednym procesorem Coraz trudniej wycisnąć
Oprogramowanie na miarę z13
Oprogramowanie na miarę z13 Sebastian Milej, Zespół Oprogramowania Mainframe 11 lutego 2015 IBM z Systems to rozwiązanie kompletne Analytics Clo ud Securit y Mobile Socia l Technologia półprzewodników
Programowanie procesorów graficznych GPGPU
Programowanie procesorów graficznych GPGPU 1 GPGPU Historia: lata 80 te popularyzacja systemów i programów z graficznym interfejsem specjalistyczne układy do przetwarzania grafiki 2D lata 90 te standaryzacja
Programowanie Współbieżne
Programowanie Współbieżne Agnieszka Łupińska 5 października 2016 Hello World! helloworld.cu: #include global void helloworld(){ int thid = (blockidx.x * blockdim.x) + threadidx.x; printf("hello
Obliczenia Wysokiej Wydajności
Obliczenia wysokiej wydajności 1 Wydajność obliczeń Wydajność jest (obok poprawności, niezawodności, bezpieczeństwa, ergonomiczności i łatwości stosowania i pielęgnacji) jedną z najważniejszych charakterystyk
Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)
Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition) J Krupski Click here if your download doesn"t start automatically Karpacz, plan miasta 1:10 000: Panorama
Tesla. Architektura Fermi
Tesla Architektura Fermi Tesla Tesla jest to General Purpose GPU (GPGPU), GPU ogólnego przeznaczenia Obliczenia dotychczas wykonywane na CPU przenoszone są na GPU Możliwości jakie daje GPU dla grafiki
Emilka szuka swojej gwiazdy / Emily Climbs (Emily, #2)
Emilka szuka swojej gwiazdy / Emily Climbs (Emily, #2) Click here if your download doesn"t start automatically Emilka szuka swojej gwiazdy / Emily Climbs (Emily, #2) Emilka szuka swojej gwiazdy / Emily
Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis
Machine Learning for Data Science (CS4786) Lecture11 5 Random Projections & Canonical Correlation Analysis The Tall, THE FAT AND THE UGLY n X d The Tall, THE FAT AND THE UGLY d X > n X d n = n d d The
www.irs.gov/form990. If "Yes," complete Schedule A Schedule B, Schedule of Contributors If "Yes," complete Schedule C, Part I If "Yes," complete Schedule C, Part II If "Yes," complete Schedule C, Part
MESco. Testy skalowalności obliczeń mechanicznych w oparciu o licencje HPC oraz kartę GPU nvidia Tesla c2075. Stanisław Wowra
MESco Testy skalowalności obliczeń mechanicznych w oparciu o licencje HPC oraz kartę GPU nvidia Tesla c2075 Stanisław Wowra swowra@mesco.com.pl Lider w dziedzinie symulacji na rynku od 1994 roku. MESco
deep learning for NLP (5 lectures)
TTIC 31210: Advanced Natural Language Processing Kevin Gimpel Spring 2019 Lecture 6: Finish Transformers; Sequence- to- Sequence Modeling and AJenKon 1 Roadmap intro (1 lecture) deep learning for NLP (5
Technologia Informacyjna Wykład II Jak wygląda komputer?
Technologia Informacyjna Wykład II Jak wygląda komputer? A. Matuszak 18 października 2010 A. Matuszak Technologia Informacyjna Wykład II Jak wygląda komputer? A. Matuszak (2) Technologia Informacyjna Wykład
Network Services for Spatial Data in European Geo-Portals and their Compliance with ISO and OGC Standards
INSPIRE Conference 2010 INSPIRE as a Framework for Cooperation Network Services for Spatial Data in European Geo-Portals and their Compliance with ISO and OGC Standards Elżbieta Bielecka Agnieszka Zwirowicz
Home Software Hardware Benchmarks Services Store Support Forums About Us
1 z 8 2013-03-08 11:49 Shopping cart Search Home Software Hardware Benchmarks Services Store Support Forums About Us Home» CPU Benchmarks» Intel Core i5-2310 @ 2.90GHz CPU Benchmarks Video Card Benchmarks
Ankiety Nowe funkcje! Pomoc magda.szewczyk@slo-wroc.pl. magda.szewczyk@slo-wroc.pl. Twoje konto Wyloguj. BIODIVERSITY OF RIVERS: Survey to teachers
1 z 7 2015-05-14 18:32 Ankiety Nowe funkcje! Pomoc magda.szewczyk@slo-wroc.pl Back Twoje konto Wyloguj magda.szewczyk@slo-wroc.pl BIODIVERSITY OF RIVERS: Survey to teachers Tworzenie ankiety Udostępnianie
Installation of EuroCert software for qualified electronic signature
Installation of EuroCert software for qualified electronic signature for Microsoft Windows systems Warsaw 28.08.2019 Content 1. Downloading and running the software for the e-signature... 3 a) Installer
Usługi IBM czyli nie taki diabeł straszny
Usługi IBM czyli nie taki diabeł straszny Michał Wawrzyński 693 93 5338 michal.wawrzynski@pl.ibm.com Usługi IBM dla Partnerów Handlowych Maintenance & Technical Support Asset-based Services Labor-based
www.irs.gov/form990. If "Yes," complete Schedule A Schedule B, Schedule of Contributors If "Yes," complete Schedule C, Part I If "Yes," complete Schedule C, Part II If "Yes," complete Schedule C, Part
Cracow University of Economics Poland. Overview. Sources of Real GDP per Capita Growth: Polish Regional-Macroeconomic Dimensions 2000-2005
Cracow University of Economics Sources of Real GDP per Capita Growth: Polish Regional-Macroeconomic Dimensions 2000-2005 - Key Note Speech - Presented by: Dr. David Clowes The Growth Research Unit CE Europe
Page 1. Pięcio-krokowy pipeline
1 Pięcio-krokowy pipeline Każdy cykl zegara staje się jednym krokiem pipeline Kroki mogą być wykonywane równolegle Mimo, że wykonanie instrukcji zabiera 5 cykli zegara, liczba CPI zmienia się z 5 na 1
MS Visual Studio 2005 Team Suite - Performance Tool
MS Visual Studio 2005 Team Suite - Performance Tool przygotował: Krzysztof Jurczuk Politechnika Białostocka Wydział Informatyki Katedra Oprogramowania ul. Wiejska 45A 15-351 Białystok Streszczenie: Dokument
CEE 111/211 Agenda Feb 17
CEE 111/211 Agenda Feb 17 Tuesday: SW for project work: Jetstream, MSP, Revit, Riuska, POP, SV On R: drive; takes time to install Acoustics today: \\cife server\files\classes\cee111\presentations Thursday:
Programowanie GPU jako procesora ogólnego przeznaczenia.
Programowanie GPU jako procesora ogólnego przeznaczenia Wykład III Architektura CUDA Witold Rudnicki Łukasz Ligowski Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego Uniwersytet Warszawski
SSW1.1, HFW Fry #20, Zeno #25 Benchmark: Qtr.1. Fry #65, Zeno #67. like
SSW1.1, HFW Fry #20, Zeno #25 Benchmark: Qtr.1 I SSW1.1, HFW Fry #65, Zeno #67 Benchmark: Qtr.1 like SSW1.2, HFW Fry #47, Zeno #59 Benchmark: Qtr.1 do SSW1.2, HFW Fry #5, Zeno #4 Benchmark: Qtr.1 to SSW1.2,
Metodyki projektowania i modelowania systemów Cyganek & Kasperek & Rajda 2013 Katedra Elektroniki AGH
Kierunek Elektronika i Telekomunikacja, Studia II stopnia Specjalność: Systemy wbudowane Metodyki projektowania i modelowania systemów Cyganek & Kasperek & Rajda 2013 Katedra Elektroniki AGH Zagadnienia
The Overview of Civilian Applications of Airborne SAR Systems
The Overview of Civilian Applications of Airborne SAR Systems Maciej Smolarczyk, Piotr Samczyński Andrzej Gadoś, Maj Mordzonek Research and Development Department of PIT S.A. PART I WHAT DOES SAR MEAN?
European Crime Prevention Award (ECPA) Annex I - new version 2014
European Crime Prevention Award (ECPA) Annex I - new version 2014 Załącznik nr 1 General information (Informacje ogólne) 1. Please specify your country. (Kraj pochodzenia:) 2. Is this your country s ECPA
Zegar - układ wysyłający regularne impulsy o stałej szerokości (J) i częstotliwości (f)
Zegar Zegar - układ wysyłający regularne impulsy o stałej szerokości (J) i częstotliwości (f) http://en.wikipedia.org/wiki/computer_clock umożliwia kontrolę relacji czasowych w CPU pobieranie, dekodowanie,
Libra.cs.put.poznan.pl/mailman/listinfo/skisrkolo.
Konrad Szałkowski Libra.cs.put.poznan.pl/mailman/listinfo/skisrkolo Skisr-kolo@libra.cs.put.poznan.pl Po co? Krótka prezentacja Skąd? Dlaczego? Gdzie? Gdzie nie? Jak? CPU Pamięć DDR3-19200 19,2 GB/s Wydajność
Estimation and planing. Marek Majchrzak, Andrzej Bednarz Wroclaw, 06.07.2011
Estimation and planing Marek Majchrzak, Andrzej Bednarz Wroclaw, 06.07.2011 Story points Story points C D B A E Story points C D 100 B A E Story points C D 2 x 100 100 B A E Story points C D 2 x 100 100
Previously on CSCI 4622
More Naïve Bayes aaace3icbvfba9rafj7ew423vr998obg2gpzkojyh4rcx3ys4lafzbjmjifdototmhoilml+hf/mn3+kl+jkdwtr64gbj+8yl2/ywklhsfircg/dvnp33s796mhdr4+fdj4+o3fvywvorkuqe5zzh0oanjakhwe1ra5zhaf5xvgvn35f62rlvtcyxpnm50awundy1hzwi46jbmgprbtrrvidrg4jre4g07kak+picee6xfgiwvfaltorirucni64eeigkqhpegbwaxglabftpyq4gjbls/hw2ci7tr2xj5ddfmfzwtazj6ubmyddgchbzpf88dmrktfonct6vazputos5zakunhfweow5ukcn+puq8m1ulm7kq+d154pokysx4zgxw4nwq6dw+rcozwnhbuu9et/tgld5cgslazuci1yh1q2ynca/u9ais0kukspulds3xxegvtyfycu8iwk1598e0z2xx/g6ef94ehbpo0d9ok9yiowsvfskh1ix2zcbpsdvaxgww7wj4zdn+he2hogm8xz9s+e7/4cuf/ata==
System optymalizacji produkcji energii
System optymalizacji produkcji energii Produkcja energii jest skomplikowanym procesem na który wpływa wiele czynników, optymalizacja jest niezbędna, bieżąca informacja o kosztach i możliwościach wykorzystania
HPC na biurku. Wojciech De bski
na biurku Wojciech De bski 22.01.2015 - co to jest? High Performance Computing most generally refers to the practice of aggregating computing power in a way that delivers much higher performance than one
Procesory rodziny x86. Dariusz Chaberski
Procesory rodziny x86 Dariusz Chaberski 8086 produkowany od 1978 magistrala adresowa - 20 bitów (1 MB) magistrala danych - 16 bitów wielkość instrukcji - od 1 do 6 bajtów częstotliwośc pracy od 5 MHz (IBM
Effective Governance of Education at the Local Level
Effective Governance of Education at the Local Level Opening presentation at joint Polish Ministry OECD conference April 16, 2012, Warsaw Mirosław Sielatycki Ministry of National Education Doskonalenie
Domy inaczej pomyślane A different type of housing CEZARY SANKOWSKI
Domy inaczej pomyślane A different type of housing CEZARY SANKOWSKI O tym, dlaczego warto budować pasywnie, komu budownictwo pasywne się opłaca, a kto się go boi, z architektem, Cezarym Sankowskim, rozmawia
Architektury komputerów Architektury i wydajność. Tomasz Dziubich
Architektury komputerów Architektury i wydajność Tomasz Dziubich Przetwarzanie potokowe Przetwarzanie sekwencyjne Przetwarzanie potokowe Architektura superpotokowa W przetwarzaniu potokowym podczas niektórych
INSTRUKCJE JAK AKTYWOWAĆ SWOJE KONTO PAYLUTION
INSTRUKCJE JAK AKTYWOWAĆ SWOJE KONTO PAYLUTION Kiedy otrzymana przez Ciebie z Jeunesse, karta płatnicza została zarejestrowana i aktywowana w Joffice, możesz przejść do aktywacji swojego konta płatniczego
Few-fermion thermometry
Few-fermion thermometry Phys. Rev. A 97, 063619 (2018) Tomasz Sowiński Institute of Physics of the Polish Academy of Sciences Co-authors: Marcin Płodzień Rafał Demkowicz-Dobrzański FEW-BODY PROBLEMS FewBody.ifpan.edu.pl
Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering
Machine Learning for Data Science (CS4786) Lecture 11 Spectral Embedding + Clustering MOTIVATING EXAMPLE What can you say from this network? MOTIVATING EXAMPLE How about now? THOUGHT EXPERIMENT For each
Inverse problems - Introduction - Probabilistic approach
Inverse problems - Introduction - Probabilistic approach Wojciech Dȩbski Instytut Geofizyki PAN debski@igf.edu.pl Wydział Fizyki UW, 13.10.2004 Wydział Fizyki UW Warszawa, 13.10.2004 (1) Plan of the talk
XIV International PhD Workshop OWD 2012, October 2012 NOWOCZESNE TECHNIKI WYKONYWANIA ZAAWANSOWANYCH OBLICZEŃ NUMERYCZNYCH
XIV International PhD Workshop OWD 2012, 20 23 October 2012 NOWOCZESNE TECHNIKI WYKONYWANIA ZAAWANSOWANYCH OBLICZEŃ NUMERYCZNYCH MODERN ADVANCED COMPUTATIONAL METHOD Konrad Andrzej Markowski, Warsaw University
Sprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer
Sprzęt komputerowy 2 Autor prezentacji: 1 prof. dr hab. Maria Hilczer Budowa komputera Magistrala Procesor Pamięć Układy I/O 2 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący
Blow-Up: Photographs in the Time of Tumult; Black and White Photography Festival Zakopane Warszawa 2002 / Powiekszenie: Fotografie w czasach zgielku
Blow-Up: Photographs in the Time of Tumult; Black and White Photography Festival Zakopane Warszawa 2002 / Powiekszenie: Fotografie w czasach zgielku Juliusz and Maciej Zalewski eds. and A. D. Coleman et
Helena Boguta, klasa 8W, rok szkolny 2018/2019
Poniższy zbiór zadań został wykonany w ramach projektu Mazowiecki program stypendialny dla uczniów szczególnie uzdolnionych - najlepsza inwestycja w człowieka w roku szkolnym 2018/2019. Składają się na
Stargard Szczecinski i okolice (Polish Edition)
Stargard Szczecinski i okolice (Polish Edition) Janusz Leszek Jurkiewicz Click here if your download doesn"t start automatically Stargard Szczecinski i okolice (Polish Edition) Janusz Leszek Jurkiewicz
Aktualizacja Oprogramowania Firmowego (Fleszowanie) Microprocessor Firmware Upgrade (Firmware downloading)
Aktualizacja Oprogramowania Firmowego (Fleszowanie) Microprocessor Firmware Upgrade (Firmware downloading) ROGER sp.j. Gościszewo 59 82-416 Gościszewo Poland tel. 055 2720132 fax 055 2720133 www.roger.pl
CUDA obliczenia ogólnego przeznaczenia na mocno zrównoleglonym sprzęcie. W prezentacji wykorzystano materiały firmy NVIDIA (http://www.nvidia.
CUDA obliczenia ogólnego przeznaczenia na mocno zrównoleglonym sprzęcie W prezentacji wykorzystano materiały firmy NVIDIA (http://www.nvidia.com) 1 Architektura karty graficznej W porównaniu z tradycyjnym
Akcja COST FP0902 jako przykład międzynarodowej współpracy w zakresie metodyki badań pozyskiwania biomasy leśnej do celów energetycznych
Akcja COST FP0902 jako przykład międzynarodowej współpracy w zakresie metodyki badań pozyskiwania biomasy leśnej do celów energetycznych Krzysztof Jodłowski, Michał Kalinowski Instytut Badawczy Leśnictwa
Macierze All Flash. Czy to jest alternatywa dla macierzy klasy Enterprise? Krzysztof Jamiołkowski HP EG Storage Solutions Architect
Innowacje w przetwarzaniu danych Macierze All Flash Czy to jest alternatywa dla macierzy klasy Enterprise? Krzysztof Jamiołkowski HP EG Storage Solutions Architect Definicja macierzy Enterprise Cechy charakterystyczne
Miedzy legenda a historia: Szlakiem piastowskim z Poznania do Gniezna (Biblioteka Kroniki Wielkopolski) (Polish Edition)
Miedzy legenda a historia: Szlakiem piastowskim z Poznania do Gniezna (Biblioteka Kroniki Wielkopolski) (Polish Edition) Piotr Maluskiewicz Click here if your download doesn"t start automatically Miedzy
Tworzenie programów równoległych. Krzysztof Banaś Obliczenia równoległe 1
Tworzenie programów równoległych Krzysztof Banaś Obliczenia równoległe 1 Tworzenie programów równoległych W procesie tworzenia programów równoległych istnieją dwa kroki o zasadniczym znaczeniu: wykrycie
Unit of Social Gerontology, Institute of Labour and Social Studies ageing and its consequences for society
Prof. Piotr Bledowski, Ph.D. Institute of Social Economy, Warsaw School of Economics local policy, social security, labour market Unit of Social Gerontology, Institute of Labour and Social Studies ageing
JCuda Czy Java i CUDA mogą się polubić? Konrad Szałkowski
JCuda Czy Java i CUDA mogą się polubić? Konrad Szałkowski Agenda GPU Dlaczego warto używać GPU Budowa GPU CUDA JCuda Przykładowa implementacja Co to jest? GPU GPU Graphical GPU Graphical Processing GPU
Programowanie Rozproszone i Równoległe
Programowanie Rozproszone i Równoległe OpenMP (www.openmp.org) API do pisania wielowątkowych aplikacji Zestaw dyrektyw kompilatora oraz procedur bibliotecznych dla programistów Ułatwia pisanie programów
ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS.
ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS. Strona 1 1. Please give one answer. I am: Students involved in project 69% 18 Student not involved in
No matter how much you have, it matters how much you need
CSR STRATEGY KANCELARIA FINANSOWA TRITUM GROUP SP. Z O.O. No matter how much you have, it matters how much you need Kancelaria Finansowa Tritum Group Sp. z o.o. was established in 2007 we build trust among
Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia
Konsolidacja wysokowydajnych systemów IT Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia Mirosław Pura Sławomir Rysak Senior IT Specialist Client Technical Architect Agenda Współczesne wyzwania:
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition) Robert Respondowski Click here if your download doesn"t start automatically Wojewodztwo Koszalinskie:
Plan wykładu. Architektura systemów komputerowych. Cezary Bolek
Architektura systemów komputerowych Wydajność systemów komputerowych Cezary Bolek Katedra Informatyki Plan wykładu Wydajność systemu komputerowego Cykl zegarowy Liczba cykli zegarowych na instrukcję Wyznaczanie
Architektura systemów komputerowych
Architektura systemów komputerowych Wydajność systemów komputerowych Cezary Bolek Katedra Informatyki Plan wykładu Wydajność systemu komputerowego Cykl zegarowy Liczba cykli zegarowych na instrukcję Wyznaczanie
Architektura Systemów Komputerowych. Rozwój architektury komputerów klasy PC
Architektura Systemów Komputerowych Rozwój architektury komputerów klasy PC 1 1978: Intel 8086 29tys. tranzystorów, 16-bitowy, współpracował z koprocesorem 8087, posiadał 16-bitową szynę danych (lub ośmiobitową
DODATKOWE ĆWICZENIA EGZAMINACYJNE
I.1. X Have a nice day! Y a) Good idea b) See you soon c) The same to you I.2. X: This is my new computer. Y: Wow! Can I have a look at the Internet? X: a) Thank you b) Go ahead c) Let me try I.3. X: What
Rev Źródło:
KamPROG for AVR Rev. 20190119192125 Źródło: http://wiki.kamamilabs.com/index.php/kamprog_for_avr Spis treści Introdcution... 1 Features... 2 Standard equipment... 4 Installation... 5 Software... 6 AVR
Zamieszczanie ogłoszenia: obowiązkowe. Ogłoszenie dotyczy: zamówienia publicznego.
Gdańsk: Dostawa oprogramowania dla Wydziału Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej Numer ogłoszenia: 58219-2013; data zamieszczenia: 17.04.2013 OGŁOSZENIE O ZAMÓWIENIU - dostawy
Financial support for start-uppres. Where to get money? - Equity. - Credit. - Local Labor Office - Six times the national average wage (22000 zł)
Financial support for start-uppres Where to get money? - Equity - Credit - Local Labor Office - Six times the national average wage (22000 zł) - only for unymployed people - the company must operate minimum
Home Software Hardware Benchmarks Services Store Support Forums About Us
Pass - CPU Benchmarks - List of Benchmarked CPUs Shopping cart Search Home Software Hardware Benchmarks Services Store Support Forums About Us Home» CPU Benchmarks» CPU List CPU Benchmarks Video Card Benchmarks
Compatible cameras for NVR-5000 series Main Stream Sub stream Support Firmware ver. 0,2-1Mbit yes yes yes n/d
NOVUS IP CAMERAS CLASSIC CAMERAS Compatible cameras for NVR-5000 series Main Stream Sub stream Support Firmware ver. Resolution Bitrate FPS GOP Resolution Bitrate FPS GOP Audio Motion detection NVIP 5000
Organizacja pamięci współczesnych systemów komputerowych : pojedynczy procesor wielopoziomowa pamięć podręczna pamięć wirtualna
Pamięć Wydajność obliczeń Dla wielu programów wydajność obliczeń może być określana poprzez pobranie danych z pamięci oraz wykonanie operacji przez procesor Często istnieją algorytmy, których wydajność
Towards Stability Analysis of Data Transport Mechanisms: a Fluid Model and an Application
Towards Stability Analysis of Data Transport Mechanisms: a Fluid Model and an Application Gayane Vardoyan *, C. V. Hollot, Don Towsley* * College of Information and Computer Sciences, Department of Electrical
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition) Robert Respondowski Click here if your download doesn"t start automatically Wojewodztwo Koszalinskie:
OPBOX ver USB 2.0 Mini Ultrasonic Box with Integrated Pulser and Receiver
OPBOX ver.0 USB.0 Mini Ultrasonic Box with Integrated Pulser and Receiver Przedsiębiorstwo BadawczoProdukcyjne OPTEL Sp. z o.o. ul. Morelowskiego 30 PL59 Wrocław phone: +8 7 39 8 53 fax.: +8 7 39 8 5 email:
Najlepsze drukarki 3D
Pass - CPU Benchmarks - List of Benchmarked CPUs Shopping cart Search Home Software Hardware Benchmarks Services Store Support Forums About Us Home» CPU Benchmarks» CPU List CPU Benchmarks Video Card Benchmarks
Budowa komputera. Magistrala. Procesor Pamięć Układy I/O
Budowa komputera Magistrala Procesor Pamięć Układy I/O 1 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący przetwarzanie informacji Zmiana stanu tranzystorów wewnątrz
Linear Classification and Logistic Regression. Pascal Fua IC-CVLab
Linear Classification and Logistic Regression Pascal Fua IC-CVLab 1 aaagcxicbdtdbtmwfafwdgxlhk8orha31ibqycvkdgpshdqxtwotng2pxtvqujmok1qlky5xllzrnobbediegwcap4votk2kqkf+/y/tnphdschtadu/giv3vtea99cfma8fpx7ytlxx7ckns4sylo3doom7jguhj1hxchmy/irhrlgh67lxb5x3blis8jjqynmedqujiu5zsqqagrx+yjcfpcrydusshmzeluzsg7tttiew5khhcuzm5rv0gn1unw6zl3gbzlpr3liwncyr6aaqinx4wnc/rpg6ix5szd86agoftuu0g/krjxdarph62enthdey3zn/+mi5zknou2ap+tclvhob9sxhwvhaqketnde7geqjp21zvjsfrcnkfhtejoz23vq97elxjlpbtmxpl6qxtl1sgfv1ptpy/yq9mgacrzkgje0hjj2rq7vtywnishnnkzsqekucnlblrarlh8x8szxolrrxkb8n6o4kmo/e7siisnozcfvsedlol60a/j8nmul/gby8mmssrfr2it8lkyxr9dirxxngzthtbaejv