Cezary Bolek Katedra Informatyki. Prawo Moore a



Podobne dokumenty
Prawo Moore a 4/10/2013. Wstęp do Informatyki

4/10/2013. Koszt wydajności komputerów. Miary wydajności komputerów (MIPS) Miary wydajności komputerów (SPEC)

Technika mikroprocesorowa. Linia rozwojowa procesorów firmy Intel w latach

Zegar - układ wysyłający regularne impulsy o stałej szerokości (J) i częstotliwości (f)

Architektura systemów komputerowych

Plan wykładu. Architektura systemów komputerowych. Cezary Bolek

Sprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer

Budowa komputera. Magistrala. Procesor Pamięć Układy I/O

Wprowadzenie. Klastry komputerowe. Superkomputery. informatyka +

Budowa komputera. Magistrala. Procesor Pamięć Układy I/O

Sprzęt komputerowy 2. Autor prezentacji: 1 prof. dr hab. Maria Hilczer

Miary i pomiary wydajności. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1

Architektury komputerów Architektury i wydajność. Tomasz Dziubich

Nowoczesne technologie przetwarzania informacji

Obliczenia Wysokiej Wydajności

SYSTEMY OPERACYJNE WYKŁAD 1 INTEGRACJA ZE SPRZĘTEM

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK

Programowanie współbieżne Wykład 1. Rafał Skinderowicz

Podstawy Informatyki. Rodzaje komputerów. dr. inż Adam Klimowicz

Systemy operacyjne i sieci komputerowe Szymon Wilk Superkomputery 1

Miary i pomiary wydajności

Programowanie współbieżne. Iwona Kochańska

Informatyka 1. Informatyka 1. Wykład nr 1 ( ) Dane podstawowe. Politechnika Białostocka. - Wydział Elektryczny.

Programowanie współbieżne Wykład 1. Rafał Skinderowicz


OBLICZENIA RÓWNOLEGŁE I ROZPROSZONE

Algorytmy i Struktury Danych

Bibliografia: pl.wikipedia.org Historia i rodzaje procesorów w firmy Intel

PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK

High Performance Computers in Cyfronet. Andrzej Oziębło Zakopane, marzec 2009

Obliczenia Wysokiej Wydajności

Architektura Systemów Komputerowych. Rozwój architektury komputerów klasy PC

Informatyka 1. Wykład nr 1 ( ) Dane podstawowe. Politechnika Białostocka. - Wydział Elektryczny. Strona WWW - Dydaktyka

Składowanie, archiwizacja i obliczenia modelowe dla monitorowania środowiska Morza Bałtyckiego

Bajt (Byte) - najmniejsza adresowalna jednostka informacji pamięci komputerowej, z bitów. Oznaczana jest literą B.

Budowa Mikrokomputera

GRIDY OBLICZENIOWE. Piotr Majkowski

Zasady pracy z komputerem

3.Przeglądarchitektur

Procesory. Schemat budowy procesora

Architektura Komputerów

Podstawy obsługi komputerów. Budowa komputera. Podstawowe pojęcia

O superkomputerach. Marek Grabowski

Symulacje kinetyczne Par2cle In Cell w astrofizyce wysokich energii Wykład 7

KATALOG SERWERÓW ACTINA SOLAR

3.Przeglądarchitektur

Architektury równoległe

konsultacje: dr inŝ. Jarosław Forenc Dydaktyka - slajdy prezentowane na wykładzie

Technologia Informacyjna Wykład II Jak wygląda komputer?

Komputery równoległe. Zbigniew Koza. Wrocław, 2012

Programowanie Rozproszone i Równoległe

Politechnika Gdańska Centrum Informatyczne Trójmiejskiej Akademickiej Sieci Komputerowej,

Płyty główne rodzaje. 1. Płyta główna w formacie AT

Home Software Hardware Benchmarks Services Store Support Forums About Us

Plan wykładu. Architektura systemów komputerowych. Cykle zegarowe

Klasyfikacja sprzętu i oprogramowania nowoczesnego banku. Informatyka bankowa, AE w Poznaniu, dr Grzegorz Kotliński

HPC na biurku. Wojciech De bski

Cyfronet w CTA. Andrzej Oziębło DKDM

Wyniki testów PassMark

Arkusz1. Wyniki Passmark CPU Mark z dn. 19 czerwca 2012 r.

Technologie informacyjne Wykład I-III

dr inż. Jarosław Forenc

Procesory wielordzeniowe (multiprocessor on a chip) Krzysztof Banaś, Obliczenia wysokiej wydajności.

Dostęp do europejskich systemów obliczeniowych Tier-0 w ramach PRACE

Dariusz Brzeziński. Politechnika Poznańska, Instytut Informatyki

Systemy operacyjne i sieci komputerowe

NOWE TRENDY ROZWOJU MIKROPROCESORÓW

Infrastruktura informatyczna dla nauki w Polsce

XIV International PhD Workshop OWD 2012, October 2012 NOWOCZESNE TECHNIKI WYKONYWANIA ZAAWANSOWANYCH OBLICZEŃ NUMERYCZNYCH

Architektura von Neumanna. Jak zbudowany jest współczesny komputer? Schemat architektury typowego PC-ta. Architektura PC wersja techniczna

Programowanie procesorów graficznych NVIDIA (rdzenie CUDA) Wykład nr 1

MAGISTRALE ZEWNĘTRZNE, gniazda kart rozszerzeń, w istotnym stopniu wpływają na

Zasady pracy z komputerem

Home Software Hardware Benchmarks Services Store Support Forums About Us

Wrocławskie Centrum Sieciowo-Superkomputerowe

Wstęp do informatyki. Chipset. North-South Bridge. Architektura komputera PC cd. Cezary Bolek

Architektura komputera PC cd. Cezary Bolek. Uniwersytet Łódzki. Wydział Zarządzania. Katedra Informatyki.

Komputer IBM PC niezależnie od modelu składa się z: Jednostki centralnej czyli właściwego komputera Monitora Klawiatury

OPIS PRZEDMIOTU ZAMÓWIENIA

Budowa komputera: dr inż. Jarosław Forenc. Zestaw komputerowy Jednostka centralna. płyta główna (przykłady, standardy)

Analiza porównawcza wydajności prognozowania pogody na klastrze TRYTON z wykorzystaniem modelu WRF

Bibliografia: pl.wikipedia.org Historia i rodzaje procesorów w firmy Intel

Najlepsze drukarki 3D

Podstawy Techniki Mikroprocesorowej wykład 13: MIMD. Dr inż. Jacek Mazurkiewicz Katedra Informatyki Technicznej

RDZEŃ x86 x86 rodzina architektur (modeli programowych) procesorów firmy Intel, należących do kategorii CISC, stosowana w komputerach PC,

Współczesna problematyka klasyfikacji Informatyki

MASZYNA TURINGA W 1936 roku Alan Turing ( ) ogłosił rewolucyjną pracę dotyczącą teorii maszyn obliczeniowych i algorytmów. Turing sformułował

Numer ogłoszenia: ; data zamieszczenia: OGŁOSZENIE O ZMIANIE OGŁOSZENIA

Chipset i magistrala Chipset Mostek północny (ang. Northbridge) Mostek południowy (ang. Southbridge) -

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia

USŁUGI HIGH PERFORMANCE COMPUTING (HPC) DLA FIRM. Juliusz Pukacki,PCSS

Spis treúci. Księgarnia PWN: Krzysztof Wojtuszkiewicz - Urządzenia techniki komputerowej. Cz. 1. Przedmowa Wstęp... 11

Kierownik Katedry: Prof. dr hab. inż. Tadeusz BURCZYŃSKI

16. Taksonomia Flynn'a.

Home Software Hardware Benchmarks Services Store Support Forums About Us

Procesor (CPU Central Processing Unit) informacje dodatkowe

1. Serwer. 2. Komputer desktop 9szt. Załącznik nr 1 do SIWZ

System 32-Bit 1: Microsoft Windows 7 Home Premium 2;, Professional, Ultimate, Enterprise Microsoft Windows 8/8.1, Pro, Enterprise 2;

ZAPYTANIE OFERTOWE NR 6

Transkrypt:

Wstęp do Informatyki Wydajność systemów komputerowych Cezary Bolek Katedra Informatyki Prawo Moore a Gordon E. Moore, 1965. "Cramming more components onto integrated circuits," Electronics, v.38, no 8 (19 April), Wzrost liczby elementów układów mikroprocesorowych ma charakter wykładniczy Liczba tranzystorów mikroprocesorów podwaja się średnio co 18 miesięcy (1980) Wydajność obliczeniowa mikroprocesorów podwaja się średnio co 18 miesięcy (1990) Wydajność komputerów w odniesieniu do ceny podwaja się średnio co 18 miesięcy (1990) 1

ZłoŜoność mikroprocesorów i pamięci Koszt wydajności komputerów 2

Miary wydajności komputerów (MIPS) MIPS (Milion Instructions Per Second) - miara wydajności jednostki centralnej CPU komputera, liczba milionów operacji stałoprzecinkowych wykonywanych w ciągu sekundy Procesor MIPS MIPS/MHz Rok Ołówek i papier 0.0119 IPS 1892 Intel 4004 92 kips (740 khz) 0.124 1971 IBM System/370 model 158-3 1 MIPS 1972 Intel 8080 640 kips (2 MHz) 0.320 MIPS/MHz 1974 Motorola 68000 1 MIPS (8 MHz) 0.125 MIPS/MHz 1979 Intel 386DX 8.5 MIPS (25 MHz) 0.340 MIPS/MHz 1988 Intel 486DX 54 MIPS (66 MHz) 0.818 MIPS/MHz 1992 PowerPC 600s (G2) 35 MIPS (33 MHz) 1.06 MIPS/MHz 1994 Intel Pentium Pro 541 MIPS (200 MHz) 2.705 MIPS/MHz 1996 ARM 7500FE 35.9 MIPS (40 MHz) 0.897 MIPS/MHz 1996 PowerPC G3 525 MIPS (233 MHz) 2.253 MIPS/MHz 1997 Zilog ez80 80 MIPS (50 MHz) 1.6 MIPS/MHz 1999 Intel Pentium III 1,354 MIPS (500 MHz) 2.708 MIPS/MHz 1999 AMD Athlon 3,561 MIPS (1.2 GHz) 2.967 MIPS/MHz 2000 AMD Athlon XP 2400+ 5,935 MIPS (2.0 GHz) 2.967 MIPS/MHz 2002 Pentium 4 Extreme Edition 9,726 MIPS (3.2 GHz) 3.039 MIPS/MHz 2003 ARM Cortex A8 2,000 MIPS (1.0 GHz) 2.0 MIPS/MHz 2005 Xbox360 IBM "Xenon" Triple Core 9,600 MIPS (3.2 GHz) 2.0 MIPS/MHz 2005 P.A. Semi PA6T-1682M 8,800 MIPS (2.0 GHz) 4.4 MIPS/MHz 2007 AMD Athlon FX-57 12,000 MIPS (2.8 GHz) 4.285 MIPS/MHz 2005 AMD Athlon 64 3800+ X2 (Dual Core) 14,564 MIPS (2.0 GHz) 7.282 MIPS/MHz 2005 AMD Athlon FX-60 (Dual Core) 18,938 MIPS (2.6 GHz) 7.283 MIPS/MHz 2006 Intel Core 2 X6800 27,079 MIPS (2.93 GHz) 9.242 MIPS/MHz 2006 Intel Core 2 Extreme QX6700 57,063 MIPS (3.33 GHz) 17.136 MIPS/MHz 2006 Intel Polaris Prototype 1,800,000 MIPS (5.8 GHz) 310.4 MIPS/MHz 2007 Miary wydajności komputerów (SPEC) SPEC (Standard Performance Evaluation Corporation) - załoŝona w 1988 r. organizacja z siedzibą w Warrenton, Virginia, zajmująca się ustanawianiem standardowych benchmarków oceniających wydajność komputerów. Jej pierwszym testem wydajności był SPECmark badający CPU, w którym jednostką był ekwiwalent wydajności maszyny VAX 11/780. ChociaŜ testy SPEC w dalszym ciągu badają CPU, organizacja opracowała teŝ inne testy, np. do oceny podsystemu graficznego czy rozmaitych kategorii aplikacji: 3

SPEC CPU2006 SPEC CPU92, CPU95, CPU2000, CPU2006 Zestaw testów opartych na realizacji problemów za pomocą języków programowania wysokiego poziomu Pomiar czasu realizacji i odniesienie do czasu referencyjnego Składający się z: CINT2006 ("SPECint"), arytmetyka stałoprzecinkowa (kompilatory, interpretery, edytory tekstu, gry logiczne itp,) CFP2006 ("SPECfp"), arytmetyka zmiennoprzecinkowa pod kątem aplikacji numerycznych, grafiki 3D, przetwarzania obrazów itp CINT2006 ("SPECint") Benchmark Language Category 400.perlbench C Programming Language 401.bzip2 C Compression 403.gcc C C Compiler 429.mcf C Combinatorial Optimization 445.gobmk C Artificial Intelligence 456.hmmer C Search Gene Sequence 458.sjeng C Artificial Intelligence 462.libquantum C Physics / Quantum Computing 464.h264ref C Video Compression 471.omnetpp C++ Discrete Event Simulation 473.astar C++ Path-finding Algorithms 483.xalancbmk C++ XML Processing 4

Inne testy SPEC SPECweb2005, PHP and/or JSP performance. SPECviewperf, performance of an OpenGL 3D graphics system, tested with various rendering tasks from real applications SPECapc, performance of several 3D-intensive popular applications on a given system SPEC OMP2001 V3.2, for evaluating performance of parallel systems using OpenMP (http://www.openmp.org) applications. SPEC MPI2007, for evaluating performance of parallel systems using MPI (Message Passing Interface) applications. SPECjvm2008, measuring basic Java performance of a Java Runtime Environment on a wide variety of both client and server systems. SPECjAppServer2004, a multi-tier benchmark for measuring the performance of Java 2 Enterprise Edition (J2EE) technology-based application servers. SPECjbb2005, evaluates the performance of server side Java by emulating a threetier client/server system (with emphasis on the middle tier). SPEC MAIL2001, performance of a mail server, testing SMTP and POP protocols SPECpower_ssj2008, evaluates the energy efficiency of server systems. SPEC SFS97_R1, NFS file server throughput and response time Miary wydajności komputerów (SPEC) System CINT2006 CFP2006 Rdzenie Proces ory Rdzeni/ proc. Procesor Taktowanie Dell Precision M90 proc. [GHz] Pamięć (Intel GHz) T7600, 2.33 23 19.5 Intel Duo T7600 Core 2333 2 MHz SDRAM) GB CL5 (2x1 DDR2 GB 667 Dell (Intel GHz) Precision E6850, 3.00 T3400 33.7 28.8 Intel Duo E6850 Core 3000 MHz DDR2) GB ECC (4x1 CL6 GB 800 Dell (Intel GHz) Precision E8500, 3.16 T3400 36.8 30.5 2 1 Intel Duo E8500 Core 2 3166 4 MHz DDR2) GB ECC (4x1 CL6 GB 800 Dell (Intel 3.00 Precision GHz) Xeon 5160, 690 53.2 42.3 4 2 Intel 5160Xeon 3000 8 MHz DDR2 GB ECC (8x1 FB-DIMM) CL5 GB 667 XPS Core M1710 2 Duo (Intel T7600) 23.9 19.9 2 1 2 Intel Duo T7600 Core 2 2333 2 Hynix CL5) GB (2x1GB DDR2-667 5

Miary wydajności komputerów (FLOPS) FLOPS (ang. FLoating point Operations Per Second) - liczba operacji zmiennoprzecinkowych na sekundę, miara wydajności układów realizujących obliczenia zmiennoprzecinkowe. 1 MFLOPS = 1 milion FLOPS-ów 1 GFLOPS = 1 miliard FLOPS-ów 1 TFLOPS = 1 bilion FLOPS-ów 1 PFLOPS = 1 biliard FLOPS-ów Najszybszy komputer Cray XT5 (Jaguar) 1795 TFLOPS* Najszybszy polski komputer ACTION Cluster Xeon E5345 Infiniband (Galera) 38,17 TFLOPS (136 pozycja na świecie)* Komputer klasy PC kilkanaście GFLOPS Człowiek do kilkudziesięciu mflops (Podzielenie dwóch liczb dziesięciocyfrowych zajmuje człowiekowi średnio kwadrans) * Dane: http://www.top500.org/ Superkomputery Kategoria komputerów o wielkiej mocy obliczeniowej Najszybsze i najbardziej wydajne (najdroŝsze) w danym czasie Za pierwszy superkomputer uznaje się CDC 6600 (CDC - Control Data Corporation) powstał w 1963 roku, według projektu i pod ścisłym nadzorem Seymoura Craya. 3 miliony operacji na sekundę. Był to pierwszy komputer gdzie zastosowano tranzystory krzemowe, oraz nowatorską technikę chłodzenia podzespołów freonem Zastosowania Modelowanie Symulacja Militaria np. meteorologia Modelowanie fizyczne, chemiczne Analiza katastrof Kryptografia Symulacje reakcji nuklearnych Analiza strukturalna 6

Cena Superkomputery czym się róŝnią od normalnych od $100.000+ do $1,000,000+ Środowisko pracy Kontrolowane Stałe parametry środowiskowe Peryferia brak kard grafiki, dźwiękowych, klawiatury itp. dostęp poprzez stacje robocze Języki programowania C, C++, Java, FORTRAN Superkomputery architektura SMP Symmetric Shared- Memory Multiprocessing (SMP) Współdzielona pamięć Wspólny system operacyjny Programy dzielone na podzadania (wątki) dla poszczególnych procesorów (wielowątkowość) 7

Superkomputery architektura MPP Massively Parallel Processing (MPP) KaŜdy procesor posiada swoją własną pamięć Samodzielne systemy operacyjne dla jednsotek Interfejs komunikacyjny Wiele procesorów rozwiązuje problem podzielony na części (200+) Superkomputery Clustering Grid computing Wiele serwerów połączonych ze sobą Oparte na szybkich łączach sieciowych Łatwo rozszerzalne poprzez dodawanie nowych serwerów 8

Najszybsze komputery świata (listopad 2009) Najszybsze komputery świata (listopad 2009) Pozycja Rmax Rpeak Nazwa Komputer, liczba rdzeni Dostawca Lokalizacja, kraj, rok 1 1759.00 2331.00 Jaguar Cray XT5 224162 (Opteron) Cray Oak Ridge National Laboratory United States, 2008 2 1042.00 1375.78 Roadrunner BladeCenter QS22/LS21 122400 (Cell/Opteron) IBM Los Alamos National Laboratory United States, 2008 3 831.70 1028.85 Kraken Cray XT5 98928 (Opteron) Cray National Institute for Computational Sciences United States, 2008 4 825.50 1002.70 JUGENE Blue Gene/P Solution 294912 (Power) IBM Jülich Research Centre Germany, 2009 5 563.10 1206.19 Tianhe-I NUDT TH-1 71680 (Xeon), InfiniBand NUDT National SuperComputer Center China, 2009 6 544.30 673.26 Pleiades SGI Altix ICE 8200EX 56320 (Xeon), InfiniBand SGI NASA/Ames Research Center United States, 2008 7 478.20 596.38 Blue Gene/L eserver Blue Gene Solution 212992 (Power) IBM Lawrence Livermore National Laboratory United States, 2007 8 458.61 557.06 Intrepid Blue Gene/P Solution 163840 (Power) IBM Argonne National Laboratory United States, 2007 9 433.20 579.38 Ranger Sun Constellation System 62976 (Opteron), Infiniband Sun Texas Advanced Computing Center United States, 2008 10 423.90 487.74 Red Sky Sun Constellation System 41616 (Xeon), InfiniBand Sun Sandia National Laboratories United States, 2009 9

Cray XT5 Jaguar System Name Jaguar Site Oak Ridge National Laboratory System Family Cray XT System Model Cray XT5-HE Computer Cray XT5-HE Opteron Six Core 2.6 GHz Vendor Cray Inc. Application area Not Specified Installation Year 2009 Operating System Linux Interconnect Proprietary Processor AMD x86_64 Opteron Six Core 2600 MHz (10.4 GFlops) Cores Rmax(GFlops) Rpeak(GFlops) 224162 1759000 2331000 Polskie superkomputery w TOP500 Rank Site System Cores R max R peak 136 Gdansk University of Technology, CI Task Poland ACTION Cluster Xeon E5345 Infiniband ACTION 5336 38.17 49.73 451 Telecommunication Company Poland Cluster Platform 3000 BL2x220, L54xx 2.5 Ghz, GigE Hewlett-Packard 4080 21.82 40.8 469 Telecommunication Company Poland Cluster Platform 3000 BL2x220, L54xx 2.5 Ghz, GigE Hewlett-Packard 4000 21.4 40 10

Najszybszy polski superkomputery - Galera System Name Galera Site Gdansk University of Technology, CI Task System Family ACTION Cluster System Model ACTION Cluster Computer ACTION Cluster Xeon E5345 Infiniband Vendor ACTION Application area Research Main Memory 5376 GB Installation Year 2008 Operating System Linux Memory 5376 GB Interconnect Infiniband DDR Processor Intel EM64T Xeon 53xx (Clovertown) 2333 MHz (9.332 GFlops) Cores Rmax(GFlops) Rpeak(GFlops) 5336 38170 49731 BlueGene/L - architektura Najszybszy komputer w listopadzie 2004 System Name BlueGene/L beta-system Site IBM/DOE System Family IBM BlueGene System Model BlueGene/L Prototype Computer BlueGene/L DD2 beta-system (0.7 GHz PowerPC 440) Vendor IBM Application area Not Specified Installation Year 2004 Operating System Linux Interconnect Proprietary Processor PowerPC 440 700 MHz (2.8 GFlops) Cores Rmax(GFlops) Rpeak(GFlops) 32768 70720 91750 11

BlueGene/L - architektura BlueGene/L karta procesorowa 12

BlueGene/L węzeł BlueGene/L szafa i grid 13

Najszybsze komputery producenci Najszybsze komputery kraje 14

Najszybsze komputery architektury Najszybsze komputery zastosowania 15

Najszybsze komputery rodziny procesorów Najszybsze komputery systemy operacyjne 16