Wstęp do Informatyki Wydajność systemów komputerowych Cezary Bolek Katedra Informatyki Prawo Moore a Gordon E. Moore, 1965. "Cramming more components onto integrated circuits," Electronics, v.38, no 8 (19 April), Wzrost liczby elementów układów mikroprocesorowych ma charakter wykładniczy Liczba tranzystorów mikroprocesorów podwaja się średnio co 18 miesięcy (1980) Wydajność obliczeniowa mikroprocesorów podwaja się średnio co 18 miesięcy (1990) Wydajność komputerów w odniesieniu do ceny podwaja się średnio co 18 miesięcy (1990) 1
ZłoŜoność mikroprocesorów i pamięci Koszt wydajności komputerów 2
Miary wydajności komputerów (MIPS) MIPS (Milion Instructions Per Second) - miara wydajności jednostki centralnej CPU komputera, liczba milionów operacji stałoprzecinkowych wykonywanych w ciągu sekundy Procesor MIPS MIPS/MHz Rok Ołówek i papier 0.0119 IPS 1892 Intel 4004 92 kips (740 khz) 0.124 1971 IBM System/370 model 158-3 1 MIPS 1972 Intel 8080 640 kips (2 MHz) 0.320 MIPS/MHz 1974 Motorola 68000 1 MIPS (8 MHz) 0.125 MIPS/MHz 1979 Intel 386DX 8.5 MIPS (25 MHz) 0.340 MIPS/MHz 1988 Intel 486DX 54 MIPS (66 MHz) 0.818 MIPS/MHz 1992 PowerPC 600s (G2) 35 MIPS (33 MHz) 1.06 MIPS/MHz 1994 Intel Pentium Pro 541 MIPS (200 MHz) 2.705 MIPS/MHz 1996 ARM 7500FE 35.9 MIPS (40 MHz) 0.897 MIPS/MHz 1996 PowerPC G3 525 MIPS (233 MHz) 2.253 MIPS/MHz 1997 Zilog ez80 80 MIPS (50 MHz) 1.6 MIPS/MHz 1999 Intel Pentium III 1,354 MIPS (500 MHz) 2.708 MIPS/MHz 1999 AMD Athlon 3,561 MIPS (1.2 GHz) 2.967 MIPS/MHz 2000 AMD Athlon XP 2400+ 5,935 MIPS (2.0 GHz) 2.967 MIPS/MHz 2002 Pentium 4 Extreme Edition 9,726 MIPS (3.2 GHz) 3.039 MIPS/MHz 2003 ARM Cortex A8 2,000 MIPS (1.0 GHz) 2.0 MIPS/MHz 2005 Xbox360 IBM "Xenon" Triple Core 9,600 MIPS (3.2 GHz) 2.0 MIPS/MHz 2005 P.A. Semi PA6T-1682M 8,800 MIPS (2.0 GHz) 4.4 MIPS/MHz 2007 AMD Athlon FX-57 12,000 MIPS (2.8 GHz) 4.285 MIPS/MHz 2005 AMD Athlon 64 3800+ X2 (Dual Core) 14,564 MIPS (2.0 GHz) 7.282 MIPS/MHz 2005 AMD Athlon FX-60 (Dual Core) 18,938 MIPS (2.6 GHz) 7.283 MIPS/MHz 2006 Intel Core 2 X6800 27,079 MIPS (2.93 GHz) 9.242 MIPS/MHz 2006 Intel Core 2 Extreme QX6700 57,063 MIPS (3.33 GHz) 17.136 MIPS/MHz 2006 Intel Polaris Prototype 1,800,000 MIPS (5.8 GHz) 310.4 MIPS/MHz 2007 Miary wydajności komputerów (SPEC) SPEC (Standard Performance Evaluation Corporation) - załoŝona w 1988 r. organizacja z siedzibą w Warrenton, Virginia, zajmująca się ustanawianiem standardowych benchmarków oceniających wydajność komputerów. Jej pierwszym testem wydajności był SPECmark badający CPU, w którym jednostką był ekwiwalent wydajności maszyny VAX 11/780. ChociaŜ testy SPEC w dalszym ciągu badają CPU, organizacja opracowała teŝ inne testy, np. do oceny podsystemu graficznego czy rozmaitych kategorii aplikacji: 3
SPEC CPU2006 SPEC CPU92, CPU95, CPU2000, CPU2006 Zestaw testów opartych na realizacji problemów za pomocą języków programowania wysokiego poziomu Pomiar czasu realizacji i odniesienie do czasu referencyjnego Składający się z: CINT2006 ("SPECint"), arytmetyka stałoprzecinkowa (kompilatory, interpretery, edytory tekstu, gry logiczne itp,) CFP2006 ("SPECfp"), arytmetyka zmiennoprzecinkowa pod kątem aplikacji numerycznych, grafiki 3D, przetwarzania obrazów itp CINT2006 ("SPECint") Benchmark Language Category 400.perlbench C Programming Language 401.bzip2 C Compression 403.gcc C C Compiler 429.mcf C Combinatorial Optimization 445.gobmk C Artificial Intelligence 456.hmmer C Search Gene Sequence 458.sjeng C Artificial Intelligence 462.libquantum C Physics / Quantum Computing 464.h264ref C Video Compression 471.omnetpp C++ Discrete Event Simulation 473.astar C++ Path-finding Algorithms 483.xalancbmk C++ XML Processing 4
Inne testy SPEC SPECweb2005, PHP and/or JSP performance. SPECviewperf, performance of an OpenGL 3D graphics system, tested with various rendering tasks from real applications SPECapc, performance of several 3D-intensive popular applications on a given system SPEC OMP2001 V3.2, for evaluating performance of parallel systems using OpenMP (http://www.openmp.org) applications. SPEC MPI2007, for evaluating performance of parallel systems using MPI (Message Passing Interface) applications. SPECjvm2008, measuring basic Java performance of a Java Runtime Environment on a wide variety of both client and server systems. SPECjAppServer2004, a multi-tier benchmark for measuring the performance of Java 2 Enterprise Edition (J2EE) technology-based application servers. SPECjbb2005, evaluates the performance of server side Java by emulating a threetier client/server system (with emphasis on the middle tier). SPEC MAIL2001, performance of a mail server, testing SMTP and POP protocols SPECpower_ssj2008, evaluates the energy efficiency of server systems. SPEC SFS97_R1, NFS file server throughput and response time Miary wydajności komputerów (SPEC) System CINT2006 CFP2006 Rdzenie Proces ory Rdzeni/ proc. Procesor Taktowanie Dell Precision M90 proc. [GHz] Pamięć (Intel GHz) T7600, 2.33 23 19.5 Intel Duo T7600 Core 2333 2 MHz SDRAM) GB CL5 (2x1 DDR2 GB 667 Dell (Intel GHz) Precision E6850, 3.00 T3400 33.7 28.8 Intel Duo E6850 Core 3000 MHz DDR2) GB ECC (4x1 CL6 GB 800 Dell (Intel GHz) Precision E8500, 3.16 T3400 36.8 30.5 2 1 Intel Duo E8500 Core 2 3166 4 MHz DDR2) GB ECC (4x1 CL6 GB 800 Dell (Intel 3.00 Precision GHz) Xeon 5160, 690 53.2 42.3 4 2 Intel 5160Xeon 3000 8 MHz DDR2 GB ECC (8x1 FB-DIMM) CL5 GB 667 XPS Core M1710 2 Duo (Intel T7600) 23.9 19.9 2 1 2 Intel Duo T7600 Core 2 2333 2 Hynix CL5) GB (2x1GB DDR2-667 5
Miary wydajności komputerów (FLOPS) FLOPS (ang. FLoating point Operations Per Second) - liczba operacji zmiennoprzecinkowych na sekundę, miara wydajności układów realizujących obliczenia zmiennoprzecinkowe. 1 MFLOPS = 1 milion FLOPS-ów 1 GFLOPS = 1 miliard FLOPS-ów 1 TFLOPS = 1 bilion FLOPS-ów 1 PFLOPS = 1 biliard FLOPS-ów Najszybszy komputer Cray XT5 (Jaguar) 1795 TFLOPS* Najszybszy polski komputer ACTION Cluster Xeon E5345 Infiniband (Galera) 38,17 TFLOPS (136 pozycja na świecie)* Komputer klasy PC kilkanaście GFLOPS Człowiek do kilkudziesięciu mflops (Podzielenie dwóch liczb dziesięciocyfrowych zajmuje człowiekowi średnio kwadrans) * Dane: http://www.top500.org/ Superkomputery Kategoria komputerów o wielkiej mocy obliczeniowej Najszybsze i najbardziej wydajne (najdroŝsze) w danym czasie Za pierwszy superkomputer uznaje się CDC 6600 (CDC - Control Data Corporation) powstał w 1963 roku, według projektu i pod ścisłym nadzorem Seymoura Craya. 3 miliony operacji na sekundę. Był to pierwszy komputer gdzie zastosowano tranzystory krzemowe, oraz nowatorską technikę chłodzenia podzespołów freonem Zastosowania Modelowanie Symulacja Militaria np. meteorologia Modelowanie fizyczne, chemiczne Analiza katastrof Kryptografia Symulacje reakcji nuklearnych Analiza strukturalna 6
Cena Superkomputery czym się róŝnią od normalnych od $100.000+ do $1,000,000+ Środowisko pracy Kontrolowane Stałe parametry środowiskowe Peryferia brak kard grafiki, dźwiękowych, klawiatury itp. dostęp poprzez stacje robocze Języki programowania C, C++, Java, FORTRAN Superkomputery architektura SMP Symmetric Shared- Memory Multiprocessing (SMP) Współdzielona pamięć Wspólny system operacyjny Programy dzielone na podzadania (wątki) dla poszczególnych procesorów (wielowątkowość) 7
Superkomputery architektura MPP Massively Parallel Processing (MPP) KaŜdy procesor posiada swoją własną pamięć Samodzielne systemy operacyjne dla jednsotek Interfejs komunikacyjny Wiele procesorów rozwiązuje problem podzielony na części (200+) Superkomputery Clustering Grid computing Wiele serwerów połączonych ze sobą Oparte na szybkich łączach sieciowych Łatwo rozszerzalne poprzez dodawanie nowych serwerów 8
Najszybsze komputery świata (listopad 2009) Najszybsze komputery świata (listopad 2009) Pozycja Rmax Rpeak Nazwa Komputer, liczba rdzeni Dostawca Lokalizacja, kraj, rok 1 1759.00 2331.00 Jaguar Cray XT5 224162 (Opteron) Cray Oak Ridge National Laboratory United States, 2008 2 1042.00 1375.78 Roadrunner BladeCenter QS22/LS21 122400 (Cell/Opteron) IBM Los Alamos National Laboratory United States, 2008 3 831.70 1028.85 Kraken Cray XT5 98928 (Opteron) Cray National Institute for Computational Sciences United States, 2008 4 825.50 1002.70 JUGENE Blue Gene/P Solution 294912 (Power) IBM Jülich Research Centre Germany, 2009 5 563.10 1206.19 Tianhe-I NUDT TH-1 71680 (Xeon), InfiniBand NUDT National SuperComputer Center China, 2009 6 544.30 673.26 Pleiades SGI Altix ICE 8200EX 56320 (Xeon), InfiniBand SGI NASA/Ames Research Center United States, 2008 7 478.20 596.38 Blue Gene/L eserver Blue Gene Solution 212992 (Power) IBM Lawrence Livermore National Laboratory United States, 2007 8 458.61 557.06 Intrepid Blue Gene/P Solution 163840 (Power) IBM Argonne National Laboratory United States, 2007 9 433.20 579.38 Ranger Sun Constellation System 62976 (Opteron), Infiniband Sun Texas Advanced Computing Center United States, 2008 10 423.90 487.74 Red Sky Sun Constellation System 41616 (Xeon), InfiniBand Sun Sandia National Laboratories United States, 2009 9
Cray XT5 Jaguar System Name Jaguar Site Oak Ridge National Laboratory System Family Cray XT System Model Cray XT5-HE Computer Cray XT5-HE Opteron Six Core 2.6 GHz Vendor Cray Inc. Application area Not Specified Installation Year 2009 Operating System Linux Interconnect Proprietary Processor AMD x86_64 Opteron Six Core 2600 MHz (10.4 GFlops) Cores Rmax(GFlops) Rpeak(GFlops) 224162 1759000 2331000 Polskie superkomputery w TOP500 Rank Site System Cores R max R peak 136 Gdansk University of Technology, CI Task Poland ACTION Cluster Xeon E5345 Infiniband ACTION 5336 38.17 49.73 451 Telecommunication Company Poland Cluster Platform 3000 BL2x220, L54xx 2.5 Ghz, GigE Hewlett-Packard 4080 21.82 40.8 469 Telecommunication Company Poland Cluster Platform 3000 BL2x220, L54xx 2.5 Ghz, GigE Hewlett-Packard 4000 21.4 40 10
Najszybszy polski superkomputery - Galera System Name Galera Site Gdansk University of Technology, CI Task System Family ACTION Cluster System Model ACTION Cluster Computer ACTION Cluster Xeon E5345 Infiniband Vendor ACTION Application area Research Main Memory 5376 GB Installation Year 2008 Operating System Linux Memory 5376 GB Interconnect Infiniband DDR Processor Intel EM64T Xeon 53xx (Clovertown) 2333 MHz (9.332 GFlops) Cores Rmax(GFlops) Rpeak(GFlops) 5336 38170 49731 BlueGene/L - architektura Najszybszy komputer w listopadzie 2004 System Name BlueGene/L beta-system Site IBM/DOE System Family IBM BlueGene System Model BlueGene/L Prototype Computer BlueGene/L DD2 beta-system (0.7 GHz PowerPC 440) Vendor IBM Application area Not Specified Installation Year 2004 Operating System Linux Interconnect Proprietary Processor PowerPC 440 700 MHz (2.8 GFlops) Cores Rmax(GFlops) Rpeak(GFlops) 32768 70720 91750 11
BlueGene/L - architektura BlueGene/L karta procesorowa 12
BlueGene/L węzeł BlueGene/L szafa i grid 13
Najszybsze komputery producenci Najszybsze komputery kraje 14
Najszybsze komputery architektury Najszybsze komputery zastosowania 15
Najszybsze komputery rodziny procesorów Najszybsze komputery systemy operacyjne 16