Loading AI tools
besonders schneller Computer für seine Zeit Aus Wikipedia, der freien Enzyklopädie
Als Supercomputer (aus dem Englischen entlehnt, dazu teilweise übersetzt Superrechner und weiter übersetzt „[der] Großrechner“; außerdem auch Hochleistungsrechner[1][2] genannt) werden für ihre Zeit besonders schnelle Computer (Allzweckrechner) bezeichnet. Dabei ist es unerheblich, auf welcher Bauweise der Computer beruht, solange es sich um einen universell einsetzbaren Rechner handelt. Ein typisches Merkmal eines modernen Supercomputers ist seine besonders große Anzahl an Prozessoren, die auf gemeinsame Peripheriegeräte und einen teilweise gemeinsamen Hauptspeicher zugreifen können. Supercomputer werden häufig für Computersimulationen im Bereich des Hochleistungsrechnens eingesetzt.
Supercomputer spielen eine essenzielle Rolle im wissenschaftlichen Rechnen und werden dort in diversen Disziplinen eingesetzt, etwa Simulationen im Bereich der Quantenmechanik, Wettervorhersagen, Klimatologie, Entdeckung von Öl- und Gasvorkommen, Molekulardynamik, biologischen Makromolekülen, Kosmologie, Astrophysik, Fusionsforschung, Erforschung von Kernwaffentests bis hin zur Kryptoanalyse.
In Deutschland sind Supercomputer überwiegend an Universitäten und Forschungseinrichtungen wie etwa den Max-Planck-Instituten zu finden. Wegen ihrer Einsatzmöglichkeiten fallen sie unter deutsche Gesetze zur Waffenexportkontrolle.[3]
Supercomputer spalteten sich in der Geschichte der Computerentwicklung in den 1960er Jahren von den wissenschaftlichen Rechnern und den Großrechnern ab. Während Großrechner eher auf hohe Zuverlässigkeit hin optimiert wurden, wurden Supercomputer in Richtung hoher Rechenleistung optimiert. Der erste offiziell installierte Supercomputer Cray-1 schaffte 1976 130 MegaFLOPS.
Ursprünglich wurde die herausragende Rechenleistung durch maximale Ausnutzung der verfügbaren Technik erzielt, indem Konstruktionen gewählt wurden, die für größere Serienproduktion zu teuer waren (z. B. Flüssigkeitskühlung, exotische Bauelemente und Materialien, kompakter Aufbau für kurze Signalwege), die Zahl der Prozessoren war eher gering. Seit geraumer Zeit etablieren sich vermehrt sogenannte Cluster, bei denen eine große Anzahl von (meist preiswerten) Einzelrechnern zu einem großen Rechner vernetzt werden. Im Vergleich zu einem Vektorrechner besitzen die Knoten in einem Cluster eigene Peripherie und ausschließlich einen eigenen, lokalen Hauptspeicher. Cluster verwenden Standardkomponenten, deshalb bieten sie zunächst Kostenvorteile gegenüber Vektorrechnern. Sie erfordern aber einen weit höheren Programmieraufwand. Es ist abzuwägen, ob die eingesetzten Programme sich dafür eignen, auf viele Prozessoren verteilt zu werden.
Moderne Hochleistungsrechner sind vor allem Parallelrechner. Sie bestehen aus einer großen Anzahl an miteinander vernetzten Computern. Zusätzlich verfügt jeder Computer in der Regel über mehrere Hauptprozessoren (CPUs). Auf einem Supercomputer können nicht unmodifiziert die gleichen Programme wie auf einem gewöhnlichen Computer laufen, sondern speziell abgestimmte Programme, die die einzelnen, parallel arbeitenden Prozessoren beschäftigen. Supercomputer sind (wie auch heutzutage jeder handelsübliche Computer im unteren Preissegment) Vektorrechner. Dominierend sind mittlerweile Standardarchitekturen aus dem Bereich von Personalcomputern und Servern, etwa x86-64 von Intel (Xeon) und AMD (Epyc). Sie unterscheiden sich von gewöhnlicher Personalcomputer-Hardware nur geringfügig. Es gibt aber auch immer noch Spezialhardware wie IBM BlueGene/Q und Sparc64.
Die Verbindungen zwischen Einzelcomputern werden bei Supercomputern mit speziellen Hochleistungsnetzwerken umgesetzt, verbreitet ist dabei unter anderem InfiniBand. Computer werden oft mit Beschleunigerkarten ausgestattet, etwa Grafikkarten oder der Intel Xeon Phi. Grafikkarten eignen sich zum Einsatz im High Performance Computing, weil sie exzellente Vektorrecheneinheiten darstellen und Probleme der Linearen Algebra effizient lösen. Die zugehörige Technik nennt sich General Purpose Computation on Graphics Processing Unit (GPGPU).
Bei Clustern werden die einzelnen Computer oft Knoten (englisch nodes) genannt und mittels Clustermanagament-Werkzeugen zentral konfiguriert und überwacht.
Während noch in den 1990er Jahren diverse Unix-Varianten bei Supercomputern verbreitet waren, hat sich in den 2000er Jahren die Freie Software Linux als Betriebssystem durchgesetzt. In der TOP500-Liste der schnellsten Computersysteme (Stand Juni 2012) werden insgesamt 462 ausschließlich unter Linux betriebene Systeme und 11 teilweise (CNK/SLES 9) unter Linux betriebene Systeme aufgelistet. Damit laufen 92,4 % der Systeme vollständig unter Linux. Fast alle anderen Systeme werden unter Unix oder Unix-artigen Systemen betrieben. Der im Desktop-Bereich größte Konkurrent Windows spielt im Bereich der Höchstleistungsrechner kaum eine Rolle (0,4 %).
Verwendete Programmiersprachen zur Programmierung von Programmen sind vor allem Fortran und C bzw. C++. Um möglichst schnellen Code zu generieren, wird meist auf Compiler der Supercomputer-Hersteller (etwa CRAY oder Intel) zurückgegriffen. Programme im High Performance Computing (HPC) werden typischerweise in zwei Kategorien eingeteilt:
In der Praxis findet man oft hybride Verfahren als Kombination beider Parallelisierungstechniken. Sie sind deswegen populär, weil Programme oft nicht gut genug skalieren, um alle Kerne eines Supercomputers mit reinem Message Passing auszulasten.
Wenn Supercomputer mit Beschleunigerkarten (Grafikkarten oder Rechenkarten) ausgestattet sind, zergliedert sich die Programmierung nochmals auf die des Hostcomputers und die der Beschleunigerkarte. OpenCL und CUDA sind dabei gängige Schnittstellen, die die Programmierung derartiger Komponenten ermöglichen.
Hochleistungsrechner werden in der Regel nicht von einem einzigen Benutzer bzw. Programm genutzt. Stattdessen werden Job-Scheduler wie Simple Linux Utility for Resource Management (SLURM) oder IBMs LoadLeveler verwendet, um einer großen Anzahl an Benutzern zu ermöglichen, kurzzeitig Teile des Supercomputers zu verwenden. Die Zuteilung erfolgt dabei exklusiv auf Ebene von Knotenzuordnung oder Prozessorzuordnung. Die verbrauchte Prozessorzeit wird dabei in Einheiten wie CPU-Stunden oder Knoten-Stunden gemessen und ggf. abgerechnet.
Die Herstellungskosten eines Supercomputers aus der TOP10 bewegen sich derzeit in einem hohen zweistelligen, oftmals bereits dreistelligen Euro-Millionenbetrag.
Die heutigen Supercomputer werden überwiegend zu Simulationszwecken eingesetzt. Je realitätsnäher eine Simulation komplexer Zusammenhänge wird, desto mehr Rechenleistung wird in der Regel benötigt. Ein Vorteil der Supercomputer ist, dass sie durch ihre extrem schnelle und damit große Rechenleistung immer mehr Interdependenzen berücksichtigen können. Dies erlaubt das Einbeziehen weiterreichender, oftmals auch unscheinbarer Neben- oder Randbedingungen zur eigentlichen Simulation und gewährleistet dadurch ein immer aussagekräftigeres Gesamtergebnis.
Die derzeitigen Haupteinsatzgebiete der Supercomputer umfassen dabei die Bereiche Biologie, Chemie, Geologie, Luft- und Raumfahrt, Medizin, Wettervorhersage, Klimaforschung, Militär und Physik.
Im militärischen Bereich haben Supercomputer es z. B. ermöglicht, neue Atombombenentwicklungen durch Simulation, ohne Stützdaten durch weitere unterirdische Atombombenversuche, durchzuführen. Die Bereiche kennzeichnen sich dadurch, dass es sich um sehr komplexe Systeme bzw. Teilsysteme handelt, die in weitreichendem Maße miteinander verknüpft sind. So haben Veränderungen in dem einen Teilsystem meist mehr oder minder starke Auswirkungen auf benachbarte oder angeschlossene Systeme. Durch den Einsatz von Supercomputern wird es immer leichter möglich, viele solcher Konsequenzen zu berücksichtigen oder sogar zu prognostizieren, wodurch bereits weit im Vorfeld etwaige Gegenmaßnahmen getroffen werden könnten. Dies gilt z. B. bei Simulationen zum Klimawandel, der Vorhersagen von Erdbeben oder Vulkanausbrüchen sowie in der Medizin bei der Simulation neuer Wirkstoffe auf den Organismus. Solche Simulationen sind logischerweise, ganz unabhängig von der Rechenleistung, nur so genau, wie es die programmierten Parameter bzw. Modelle zur Berechnung zulassen. Die enormen Investitionssummen in die stetige Steigerung der FLOPS und damit die Entwicklung von immer schnelleren Supercomputern werden vor allem mit den Nutzenvorteilen und dem eventuellen „Wissensvorsprung“ für die Menschheit gerechtfertigt, weniger aus den Aspekten des allgemeinen technischen Fortschritts.
Das wissenschaftliche Hochleistungsrechnen ist in Deutschland durch das Gauss Centre for Supercomputing (GCS) organisiert, welches Mitglied im europäischen Partnership for Advanced Computing in Europe (PRACE) ist. Der Verbund für Nationales Hochleistungsrechnen (NHR) stellt Hochleistungsrechenressourcen der mittleren Leistungsklasse (Ebene 2) zur Verfügung. Die Mehrzahl der 16 deutschen Bundesländer unterhalten Landeshochrechnerverbände, um die Nutzung ihrer Hochleistungsrechner zu organisieren. In der Wissenschaftswelt wird in der Regel ein Kontingent an CPU-Stunden ausgeschrieben und unter Bewerbern verteilt.
Die schnellsten Superrechner nach Leistung werden heutzutage halbjährlich in der TOP500-Liste aufgeführt. Als Bewertungsgrundlage dient der LINPACK-Benchmark. Die schnellsten Superrechner nach Energieeffizienz bzw. MFLOPS/W werden seit November 2007 in der Green500-Liste geführt.[6] Den größten Anteil (117) der Top 500 leistungsstärksten Rechner weltweit konnte 2018 Lenovo installieren.[7]
Diese Green500-Liste vom November 2014 weist länderweise gemittelte Effizienzen von 1895 MFLOPS/W (Italien) bis hinunter zu 168 MFLOPS/W (Malaysia) auf.
Stand früher als Juni 2017 (2016?). Jedoch Piz Daint, Schweiz, und Levante, Deutschland, nachgetragen.
Name | Standort | TeraFLOPS | Konfiguration | Energiebedarf | Zweck |
---|---|---|---|---|---|
Frontier | Oak Ridge National Laboratory (Tennessee, USA) | 1.100.000,00 | 8.730.112 Prozessoren: AMD Optimized 3rd Generation EPYC 64C 2GHz, 9 PB RAM | 21.000 kW | Wissenschaftliche Anwendungen |
Fugaku | RIKEN Center for Computational Science, Kobe, (Japan) | 415.530,00 | 152.064 A64FX (48 Kerne, 2,2 GHz),4,85 PB RAM | 15.000 kW | Wissenschaftliche Anwendungen |
Summit | Oak Ridge National Laboratory (Tennessee, USA) | 122.300,00 aufgerüstet auf 148.600,00 | 9.216 POWER9 CPUs (22 Kerne, 3,1 GHz), 27,648 Nvidia Tesla V100 GPUs | 10.096 kW | Physikalische Berechnungen |
Sunway TaihuLight | National Supercomputing Center, Wuxi, Jiangsu | 93.014,60 | 40.960 Sunway SW26010 (260 Kerne, 1,45 GHz), 1,31 PB RAM, 40 Serverschränke mit jeweils 4 × 256 Nodes, insgesamt 10.649.600 Kerne | 15.370 kW | Wissenschaftliche und kommerzielle Anwendungen |
Sierra[8] | Lawrence Livermore National Laboratory (Kalifornien, USA) | 71.600,00 | IBM Power9 (22 Kerne, 3,1 GHz) 1,5 PB RAM | 7.438 kW | physikalische Berechnungen (z. B. Simulation von Kernwaffentests) |
Tianhe-2[9] | National University for Defense Technology, Changsha, China finaler Standort: National Supercomputer Center (Guangzhou, Volksrepublik China) |
33.862,70 aufgerüstet auf 61.400,00 | 32.000 Intel Xeon E5-2692 CPUs (Ivy Bridge, 12 Kerne, 2,2 GHz) + 48.000 Intel Xeon Phi 31S1P Co-Prozessoren (57 Kerne, 1,1 GHz), 1,4 PB RAM | 17.808 kW | Chemische und physikalische Berechnungen (z. B. Untersuchungen von Erdöl und Flugzeugentwicklung) |
Hawk[10][11] | Höchstleistungsrechenzentrum Stuttgart (Deutschland) | 26.000,00 | 11.264 AMD EPYC 7742(64 Kerne, 2,25 GHz), 1.44 PB RAM | 3.500 kW | Wissenschaftliche und kommerzielle Anwendungen |
Piz Daint | Swiss National Supercomputing Centre (CSCS) (Schweiz) | 21.230,00 | Cray XC50, Xeon E5-2690v3 12C 2,6 GHz, Aries interconnect, NVIDIA Tesla P100, Cray Inc. (361.760 Kerne) | 2.384 kW | wissenschaftliche und kommerzielle Anwendungen |
Titan | Oak Ridge National Laboratory (Tennessee, USA) | 17.590,00 | Cray XK7, 18.688 AMD Opteron 6274 CPUs (16 Kerne, 2,20 GHz) + 18.688 Nvidia Tesla K20 GPGPUs, 693,5 TB RAM | 8.209 kW | Physikalische Berechnungen |
Sequoia[12] | Lawrence Livermore National Laboratory (Kalifornien, USA) | 17.173,20 | IBM BlueGene/Q, 98.304 Power BQC-Prozessoren (16 Kerne, 1,60 GHz), 1,6 PB RAM | 7.890 kW | Simulation von Kernwaffentests |
LEVANTE[13] | Deutsches Klimarechenzentrum Hamburg (Deutschland) | 14.000,00 (CPU-Partition) 2.800,00 (GPU-Partition) |
Atos BullSequana XH2000 mit insgesamt 370.000 Prozessorkernen; CPU-Partition: 2832 Nodes mit je 2 CPUs vom Typ AMD 7763; GPU-Partition: 60 Nodes mit je 2 CPUs vom Typ AMD 7713 und je 4 GPUs vom Typ Nvidia A100 | 2.000 kW | Erdsystemforschung |
K computer | Advanced Institute for Computational Science (Japan) | 10.510,00 | 88.128 SPARC64-VIII 8-Core-Prozessoren (2,00 GHz), 1.377 TB RAM | 12.660 kW | Chemische und physikalische Berechnungen |
Mira | Argonne National Laboratory (Illinois, USA) | 8.586,6 | IBM BlueGene/Q, 49.152 Power BQC-Prozessoren (16 Kerne, 1,60 GHz), 768 TB RAM | 3.945 kW | Entwicklung neuer Energiequellen, Technologien und Materialien, Bioinformatik |
JUQUEEN[14] | Forschungszentrum Jülich (Deutschland) | 5.008,9 | IBM BlueGene/Q, 28.672 Power BQC-Prozessoren (16 Kerne, 1,60 GHz), 448 TB RAM | 2.301 kW | Materialwissenschaften, theoretische Chemie, Elementarteilchenphysik, Umwelt, Astrophysik |
Phase 1 – Cray XC30[15] | Europäisches Zentrum für mittelfristige Wettervorhersage (Reading, England) | 3.593,00 | 7.010 Intel E5-2697v2 „Ivy Bridge“ (12 Kerne, 2,7 GHz) | ||
SuperMUC IBM[16][17] | Leibniz-Rechenzentrum (LRZ) (Garching bei München, Deutschland) | 2.897,00 | 18.432 Xeon E5-2680 CPUs (8 Kerne, 2,7 GHz) + 820 Xeon E7-4870 CPUs (10 Kerne, 2,4 GHz), 340 TB RAM | 3.423 kW | Kosmologie über die Entstehung des Universums, Seismologie/Erdbebenvorhersage, uvm. |
Stampede | Texas Advanced Computing Center (Texas, USA) | 5.168,10 | Xeon E5-2680 CPUs (8 Kerne, 2,7 GHz) + Xeon E7-4870 CPUs, 185 TB RAM | 4.510 kW | Chemische und physikalische, biologische (z. B. Proteinstrukturanalyse), geologische (z. B. Erdbebenvorhersage), medizinische Berechnungen (z. B. Krebswachstum) |
Tianhe-1A | National Supercomputer Center (Tianjin, Volksrepublik China) | 2.266,00 | 14.336 Intel 6-Core-Xeon X5670 CPUs (2,93 GHz) + 7.168 Nvidia Tesla M2050 GPGPUs, 224 TB RAM | 4.040 kW | Chemische und physikalische Berechnungen (z. B. Untersuchungen von Erdöl und Flugzeugentwicklung) |
Dawning Nebulae | National Supercomputing Center (Shenzhen, Volksrepublik China) | 1.271,00 | Hybridsystem aus 55.680 Intel Xeon-Prozessoren (2,66 GHz) + 64.960 Nvidia Tesla GPGPU (1,15 GHz), 224 TB RAM | 2.580 kW | Meteorologie, Finanzwirtschaft u. a. |
IBM Roadrunner | Los Alamos National Laboratory (New Mexico, USA) | 1.105,00 | 6.000 AMD Dual-Core-Prozessoren (3,2 GHz), 13.000 IBM Cell-Prozessoren (1,8 GHz), 103 TB RAM | 4.040 kW | Physikalische Simulationen (z. B. Atomwaffensimulationen) |
N. n. | Universität Bielefeld (Deutschland) | 529,70 | 208x Nvidia Tesla M2075-GPGPUs + 192x Nvidia GTX-580-GPUs + 152x Dual Quadcore Intel Xeon 5600 CPUs, 9,1 TB RAM | Fakultät für Physik: Numerische Simulationen, physikalische Berechnungen[18][19] | |
SGI Altix | NASA (USA) | 487,00 | 51.200 4-Core-Xeon, 3 GHz, 274,5 TB RAM | 3.897 kW | Weltraumforschung |
BlueGene/L | Lawrence Livermore National Laboratory Livermore (USA) | 478,20 | 212.992 PowerPC 440 Prozessoren 700 MHz, 73.728 GB RAM | 924 kW | Physikalische Simulationen |
Blue Gene Watson | IBM Thomas J. Watson Research Center (USA) | 91,29 | 40.960 PowerPC 440 Prozessoren, 10.240 GB RAM | 448 kW | Forschungsabteilung von IBM, aber auch Anwendungen aus Wissenschaft und Wirtschaft |
ASC Purple | Lawrence Livermore National Laboratory Livermore (USA) | 75,76 | 12.208 Power5 CPUs, 48.832 GB RAM | 7.500 kW | Physikalische Simulationen (z. B. Atomwaffensimulationen) |
MareNostrum | Universitat Politècnica de Catalunya (Spanien) | 63,8 | 10.240 PowerPC 970MP 2,3 GHz, 20,4 TB RAM | 1.015 kW | Klima- und Genforschung, Pharmazie |
Columbia | NASA Ames Research Center (Silicon Valley, Kalifornien, USA) | 51,87 | 10.160 Intel Itanium 2 Prozessoren (Madison Kern), 9 TB RAM | Klimamodellierung, astrophysikalische Simulationen |
Name | Standort | TeraFLOPS (peak) | Konfiguration | TB RAM | Energiebedarf | Zweck |
---|---|---|---|---|---|---|
Hawk[10][11] | Höchstleistungsrechenzentrum Stuttgart (Deutschland) | 26.000,00 | 11.264 AMD EPYC 7742(64 Kerne, 2,25 GHz), 1.44 PB RAM | 1440 | 3.500 kW | Wissenschaftliche und kommerzielle Anwendungen |
LEVANTE[20] | Deutsches Klimarechenzentrum Hamburg | 14.000,00 (CPU-Partition) 2.800,00 (GPU-Partition) |
Atos BullSequana XH2000 mit insgesamt 370.000 Prozessorkernen; CPU-Partition: 2832 Nodes mit je 2 CPUs vom Typ AMD 7763; GPU-Partition: 60 Nodes mit je 2 CPUs vom Typ AMD 7713 und je 4 GPUs vom Typ Nvidia A100 | 815 (CPU-Partition) 30 (GPU-Partition) |
2.000 kW | Erdsystemforschung |
JUWELS[21] | Forschungszentrum Jülich | 9.891,07 | 2511 Nodes mit je 4 Dual Intel Xeon Platinum 8168 (mit je 24 Kernen, 2,70 GHz), 64 Nodes mit je 6 Dual Intel Xeon Gold 6148 (mit je 20 Kernen, 2,40 GHz) | 258 | 1.361 kW | |
JUQUEEN[14] | Forschungszentrum Jülich (Deutschland) | 5.900,00 | IBM BlueGene/Q, 28.672 Power BQC-Prozessoren (16 Kerne, 1,60 GHz) | 448 | 2.301 kW | Materialwissenschaften, theoretische Chemie, Elementarteilchenphysik, Umwelt, Astrophysik |
SuperMUC IBM[16][22] | Leibniz-Rechenzentrum (LRZ) (Garching bei München, Deutschland) | 2.897,00 | 18.432 Xeon E5-2680 CPUs (8 Kerne, 2,7 GHz), 820 Xeon E7-4870 CPUs (10 Kerne, 2,4 GHz) | 340 | 3.423 kW | Kosmologie über die Entstehung des Universums, Seismologie und Erdbebenvorhersage |
HLRN-III[23] (Cray XC40) | Zuse-Institut Berlin, Regionales Rechenzentrum für Niedersachsen | 2.685,60 | 42.624 Cores Intel Xeon Haswell @2,5 GHz und IvyBridge @ 2,4 GHz | 222 | 500 – 1.000 kW | Physik, Chemie, Umwelt- und Meeresforschung, Ingenieurwissenschaften |
HRSK-II[24][25] | Zentrum für Informationsdienste und Hochleistungsrechnen, TU Dresden | 1.600,00 | 43.866 CPU-Kerne, Intel Haswell-EP-CPUs (Xeon E5 2680v3), 216 Nvidia Tesla-GPUs | 130 | Wissenschaftliche Anwendungen | |
HLRE-3 „Mistral“[26][27] | Deutsches Klimarechenzentrum Hamburg | 1.400,00 | 1.550 Knoten à 2 Intel Haswell-EP-CPUs (Xeon E5-2680v3) (12 Kerne 2,5 GHz), 1750 Knoten à 2 Intel Broadwell-EP-CPUs (Xeon E5-2695V4) (18 Kerne 2,1 GHz), 100.000 Kerne, 54 PB Lustre-Festplattensystem, 21 Visualisierungsknoten (á 2 Nvidia Tesla K80 GPUs) oder (á 2 Nvidia GeForce GTX 9xx) | 120 | Klimamodellierung | |
Cray XC40 | Deutscher Wetterdienst (Offenbach) | 1.100,00 | Cray Aries Netzwerk; 1.952 CPUs Intel Xeon E5-2680v3/E5-2695v4 | 122 | 407 kW | Numerische Wettervorhersage und Klimasimulationen |
Lichtenberg-Hochleistungsrechner[28] | Technische Universität Darmstadt | 951.34 | Phase 1: 704 Knoten à 2 Intel Xeon (8 Cores), 4 Knoten à 8 Intel Xeon (8 Cores), 70 Knoten à 2 Intel Xeon.
Phase 2: 596 Knoten à 2 Intel Xeon (12 Cores), 4 Knoten à 4 Intel Xeon (15 Cores), 32 Knoten à 2 Intel Xeon. |
76 | Wissenschaftliche Anwendungen | |
CARL und EDDY[29][30] | Carl von Ossietzky Universität Oldenburg | 457,2 | Lenovo NeXtScale nx360M5, 12.960 Cores (Intel Xeon E5-2650v4 12C 2,2 GHz), Infiniband FDR | 80 | 180 kW | Theoretische Chemie, Windenergieforschung, Theoretischer Physik, Neurowissenschaften und Hörforschung, Meeresforschung, Biodiversität und Informatik |
HPC Compute Cluster 2019[31] | Technische Universität Bergakademie Freiberg | 307,2 (Standard) bzw. 377,3 (mit Double Precision) | Megware Knoten (96-mal): 192 Intel Xeon Gold 6248 Prozessoren; 3840 Kerne; 18 TB DDR4 Main Memory
Shared Memory Knoten (17-mal): 4 Dual Socket Intel Xeon Gold 6248; 3 Quad Socket Intel Xeon Gold 5218; 10 Dual Socket Intel Xeon Gold 6244 (2020 erweitert); 512 Kerne; 17,7 TB DDR4 Main Memory Megware GPU-Knoten (3-mal): 3 NVIDIA Quadro RTX 5000 GPUs; 6 Intel Xeon Gold 6248 Prozessoren, 120 CPU-Kerne; 576 GB DDR4 Hauptspeicher Zentraler Speicher: 246 TB |
36,3 | wissenschaftliche Anwendungen (Ingenieurwissenschaften, Quantenchemie, Strömungsmechanik, Geophysik) | |
Mogon | Johannes Gutenberg-Universität Mainz | 283,90 | 33.792 Opteron 6272 | 84 | 467 kW | Naturwissenschaften, Physik, Mathematik, Biologie, Medizin |
OCuLUS[32] | Paderborn Center for Parallel Computing, Universität Paderborn | 200,00 | 614 Knoten Dual Intel E5-2670 (9856 Cores) und 64 GB RAM | 45 | Ingenieurwissenschaften, Naturwissenschaften | |
HLRE 2[27] | Deutsches Klimarechenzentrum Hamburg | 144,00 | 8064 IBM Power6 Dual Core CPUs, 6 Petabyte Disk | 20 | Klimamodellierung | |
Komplex MPI 2 | RWTH Aachen | 103,60 | 176 Knoten mit insgesamt 1.408 Intel Xeon 2,3 GHz 8-Core-Prozessoren | 22 | Wissenschaftliche Anwendungen | |
HPC-FF | Forschungszentrum Jülich | 101,00 | 2160 Intel Core i7 (Nehalem-EP) 4-Core, 2,93 GHz Prozessoren | 24 | europäische Fusionsforschung | |
HLRB II | LRZ Garching | 56,52 | 9.728 CPUs 1,6 GHz Intel Itanium 2 (Montecito Dual Core) | 39 | Naturwissenschaften, Astrophysik und Materialforschung | |
ClusterVision HPC[33] | Technische Universität Bergakademie Freiberg | 22,61 | 1728 Cores Intel Xeon X5670 (2,93 GHz) + 280 Cores AMD Opteron 6276, (2,3 GHz) | 0,5 | Ingenieurwissenschaften, Quantenchemie, Strömungsmechanik, Geophysik (abgebaut und ersetzt) | |
CHiC[34] Cluster (IBM x3455) | TU Chemnitz | 8,21 | 2152 Cores aus 1076 Dual Core 64 bit AMD Opteron 2218 (2,6 GHz) | Modellierung und numerische Simulationen (abgebaut) |
In der Liste der 500 schnellsten Supercomputer der Welt befand sich Stand Juni 2024 der schnellste Rechner aus Österreich auf Rang 353.
Name | Standort | TeraFLOPS (peak) | Konfiguration | TB RAM | Energiebedarf | Zweck |
---|---|---|---|---|---|---|
VSC-4 (Stand Juni 2024) | Vienna Scientific Cluster | 2726,08 | ThinkSystem SD650, Xeon Platinum 8174 24C 3.1GHz, Intel Omni-Path (37.920 Kerne) | |||
VSC-5 (Stand Juni 2024) | Vienna Scientific Cluster | 2312,30 | MEGWARE SLIDESX, AMD EPYC 7713 64C 2GHz, Infiniband (95.232 Kerne) | |||
VSC-3 (Stand Juni 2017) | Vienna Scientific Cluster | 596,01 | Oil blade server, Intel Xeon E5-2650v2 8C 2,6 GHz, Intel TrueScale Infiniband; ClusterVision (32.768 Kerne) | 450 kW | ||
Cluster Platform DL360 (Stand Juni 2017) | Hosting Company | 572,60 | Cluster Platform DL360, Xeon E5-2673v4 20C 2,3 GHz, 10G Ethernet; HPE (26.880 Kerne) | 529 kW | ||
Cluster Platform DL360 (Stand Juni 2017) | Hosting Company | 527,20 | Cluster Platform DL360, Xeon E5-2673v3 12C 2,4 GHz, 10G Ethernet;HPE (20.352 Kerne) | 678 kW | ||
Der im Spätsommer 2024 in Betrieb genommene „Alps“ befindet sich auf Rang 6 In der Liste der 500 schnellsten Supercomputer der Welt. Piz Daint nahm darin Rang 43 ein (Stand Juni 2024).
Name | Standort | TeraFLOPS (peak) | Konfiguration | TB RAM | Energiebedarf | Zweck |
---|---|---|---|---|---|---|
Alps (Stand Juni 2024) | Swiss National Supercomputing Centre (CSCS) | 270.000 | HPE Cray EX254n, NVIDIA Grace 72C 3,1 GHz, NVIDIA GH200 Superchip, Slingshot-11 (1.305.600 Kerne) | 5.194 kW | Forschung, KI-Anwendungen, Start-ups | |
Piz Daint (Upgrade 2018, Stand Juni 2024) | Swiss National Supercomputing Centre (CSCS) | 21.230 |
Cray XC50, Xeon E5-2690v3 12C 2,6 GHz, Aries interconnect, NVIDIA Tesla P100 (387.872 Kerne) |
2.272 kW | ||
preAlps (Stand Juni 2024) | Swiss National Supercomputing Centre (CSCS) | 15.470 | HPE Cray EX254n, NVIDIA Grace 72C 3.1GHz, NVIDIA GH200 Superchip, Slingshot-11 (81.600 Kerne) | 519 kW | ||
Alps (Stand Juni 2024) | Swiss National Supercomputing Centre (CSCS) | 3.088,60 | HPE Cray EX, AMD EPYC 7742 64C 2.25GHz, Slingshot-10 (128.000 Kerne) | 638 kW | ||
Piz Daint Multicore (Stand Juni 2024) | Swiss National Supercomputing Centre (CSCS) | 1.896,75 | Cray XC40, Xeon E5-2695v4 18C 2,1 GHz, Aries interconnect, Cray Inc. (65.268 Kerne) | 519 kW | ||
EPFL Blue Brain IV (Stand Juni 2024) | Swiss National Supercomputing Centre (CSCS) | 715,55 | BlueGene/Q, Power BQC 16C 1,6 GHz, Custom Interconnect; IBM (65.536 Kerne) | 329 kW | ||
A17A (Stand Juni 2024) | MSW, Rümlang | 691,20 | ThinkSystem C0366, Xeon Gold 6252 24C 2,1 GHz, 100G Ethernet; Lenovo (69.120 Kerne) | Komerziell | ||
Nachfolgende Tabelle (Stand Juni 2022) listet einige der schnellsten Superrechner ihrer jeweiligen Zeit auf:
Jahr | Supercomputer | Spitzengeschwindigkeit bis 1959 in Operationen pro Sekunde (OPS) ab 1960 in FLOPS |
Ort |
---|---|---|---|
1906 | Babbage Analytical Engine, Mill | 0,3 | RW Munro, Woodford Green, Essex, England |
1928 | IBM 301[35] | 1,7 | verschiedene Orte weltweit |
1931 | IBM Columbia Difference Tabulator[36] | 2,5 | Columbia University |
1940 | Zuse Z2 | 3,0 | Berlin, Deutschland |
1941 | Zuse Z3 | 5,3 | Berlin, Deutschland |
1942 | Atanasoff-Berry Computer (ABC) | 30,0 | Iowa State University, Ames (Iowa), USA |
TRE Heath Robinson | 200,0 | Bletchley Park, Milton Keynes, England | |
1.000,0 | entspricht 1 kilo-OPS | ||
1943 | Flowers Colossus | 5.000,0 | Bletchley Park, Milton Keynes, England |
1946 | UPenn ENIAC (vor den Modifikationen von 1948+) |
50.000,0 | Aberdeen Proving Ground, Maryland, USA |
1954 | IBM NORC | 67.000,0 | U.S. Naval Proving Ground, Dahlgren, Virginia, USA |
1956 | MIT TX-0 | 83.000,0 | Massachusetts Inst. of Technology, Lexington, Massachusetts, USA |
1958 | IBM SAGE | 400.000,0 | 25 Stützpunkte der U.S. Air Force in den USA und ein Ort in Kanada (52 Computer) |
1960 | UNIVAC LARC | 500.000,0 | Lawrence Livermore National Laboratory, Kalifornien, USA |
1.000.000,0 | entspricht 1 MFLOPS, 1 Mega-FLOPS | ||
1961 | IBM 7030 „Stretch“ | 1.200.000,0 | Los Alamos National Laboratory, New Mexico, USA |
1964 | CDC 6600 | 3.000.000,0 | Lawrence Livermore National Laboratory, Kalifornien, USA |
1969 | CDC 7600 | 36.000.000,0 | |
1974 | CDC STAR-100 | 100.000.000,0 | |
1975 | Burroughs ILLIAC IV | 150.000.000,0 | NASA Ames Research Center, Kalifornien, USA |
1976 | Cray-1 | 250.000.000,0 | Los Alamos National Laboratory, New Mexico, USA (weltweit über 80 Mal verkauft) |
1981 | CDC Cyber 205 | 400.000.000,0 | verschiedene Orte weltweit |
1983 | Cray X-MP/4 | 941.000.000,0 | Los Alamos National Laboratory; Lawrence Livermore National Laboratory; Battelle; Boeing |
1.000.000.000,0 | entspricht 1 GFLOPS, 1 Giga-FLOPS | ||
1984 | M-13 | 2.400.000.000,0 | Scientific Research Institute of Computer Complexes, Moskau, UdSSR |
1985 | Cray-2/8 | 3.900.000.000,0 | Lawrence Livermore National Laboratory, Kalifornien, USA |
1989 | ETA10-G/8 | 10.300.000.000,0 | Florida State University, Florida, USA |
1990 | NEC SX-3/44R | 23.200.000.000,0 | NEC Fuchu Plant, Fuchū, Japan |
1993 | Thinking Machines CM-5/1024 | 65.500.000.000,0 | Los Alamos National Laboratory; National Security Agency |
Fujitsu Numerical Wind Tunnel | 124.500.000.000,0 | National Aerospace Laboratory, Tokio, Japan | |
Intel Paragon XP/S 140 | 143.400.000.000,0 | Sandia National Laboratories, New Mexico, USA | |
1994 | Fujitsu Numerical Wind Tunnel | 170.400.000.000,0 | National Aerospace Laboratory, Tokio, Japan |
1996 | Hitachi SR2201/1024 | 220.400.000.000,0 | Universität Tokio, Japan |
1996 | Hitachi/Tsukuba CP-PACS/2048 | 368.200.000.000,0 | Center for Computational Physics, University of Tsukuba, Tsukuba, Japan |
1.000.000.000.000,0 | entspricht 1 TFLOPS, 1 Tera-FLOPS | ||
1997 | Intel ASCI Red/9152 | 1.338.000.000.000,0 | Sandia National Laboratories, New Mexico, USA |
1999 | Intel ASCI Red/9632 | 2.379.600.000.000,0 | |
2000 | IBM ASCI White | 7.226.000.000.000,0 | Lawrence Livermore National Laboratory, Kalifornien, USA |
2002 | NEC Earth Simulator | 35.860.000.000.000,0 | Earth Simulator Center, Yokohama-shi, Japan |
2004 | SGI Project Columbia | 42.700.000.000.000,0 | Project Columbia, NASA Advanced Supercomputing Facility, USA |
IBM BlueGene/L | 70.720.000.000.000,0 | U.S. Department of Energy/IBM, USA | |
2005 | IBM BlueGene/L | 136.800.000.000.000,0 | U.S. Department of Energy/U.S. National Nuclear Security Administration, Lawrence Livermore National Laboratory, Kalifornien, USA |
1.000.000.000.000.000,0 | entspricht 1 PFLOPS, 1 Peta-FLOPS | ||
2008 | IBM Roadrunner | 1.105.000.000.000.000,0 | U.S. Department of Energy/U.S. National Nuclear Security Administration, Los Alamos National Laboratory |
2010 | Tianhe-1A | 2.507.000.000.000.000,0 | National Supercomputer Center in Tianjin, China |
2011 | K computer | 10.510.000.000.000.000,0 | Advanced Institute for Computational Science, Japan |
2012 | Sequoia | 16.324.750.000.000.000,0 | Lawrence Livermore National Laboratory, Kalifornien, USA |
2012 | Titan | 17.590.000.000.000.000,0 | Oak Ridge National Laboratory, Tennessee, USA |
2013 | Tianhe-2 | 33.863.000.000.000.000,0 | National Supercomputer Center in Guangzhou, China |
2016 | Sunway TaihuLight[37] | 93.000.000.000.000.000,0 | National Supercomputing Center, Wuxi, China |
2018 | Summit[38] | 200.000.000.000.000.000,0 | Oak Ridge National Laboratory, Tennessee, USA |
1.000.000.000.000.000.000,0 | entspricht 1 EFLOPS, 1 Exa-FLOPS | ||
2022 | Frontier[39] | 1.100.000.000.000.000.000,0 | Oak Ridge National Laboratory, Tennessee, USA |
2023 | Tesla Dojo | 13.000.000.000.000.000.000,0 | USA, San José in Kalifornien, der Elektroautofirma Tesla - geplant ist eine Erweiterung auf 100 EFLOPS bis Ende 2024 |
Zukunft | Tianhe-3[40] | 1.000.000.000.000.000.000,0 | China, Nationales Zentrum für Supercomputer – Baustart Feb. 2017, Fertigstellung des Prototyps für Anfang 2018 angekündigt |
El Capitan[41] | 2.000.000.000.000.000.000,0 | USA, DOE’s Lawrence Livermore National Laboratory (LLNL) - Fertigstellung 2023 angekündigt |
Trägt man die FLOPS der schnellsten Computer ihrer Zeit gegen die Zeit auf, erhält man eine exponentielle Kurve, logarithmisch in etwa ein Gerade, wie im folgenden Graph dargestellt.
TOP500 Liste der 500 schnellsten Supercomputer
Mit einer Executive Order hatte US-Präsident Barack Obama die US-Bundesbehörden angewiesen, die Entwicklung eines ExaFlops-Supercomputers voranzutreiben.[42][43] Im Jahr 2018 sollte Intels Aurora-Supercomputer eine Rechenleistung von 180 PetaFlops erreichen.[44] Im Jahr 2021 wollte das DOE einen ersten Exascale-Supercomputer aufstellen und 9 Monate später in Betrieb nehmen.[45]
China wollte bis 2020 einen Supercomputer mit einer Geschwindigkeit im Exaflops-Bereich entwickeln.[46] Der Prototyp von „Tianhe-3“ sollte bis Anfang 2018 fertig sein, berichtete „China Daily“ am 20. Februar 2017.[40] Im Mai 2018 wurde er vorgestellt.[47]
2011 starteten in der EU zahlreiche Projekte mit dem Ziel Software für Exascale-Supercomputer zu entwickeln. Das CRESTA-Projekt (Collaborative Research into Exascale Systemware, Tools and Applications),[48] das DEEP-Projekt (Dynamical ExaScale Entry Platform),[49][50] und das Projekt Mont-Blanc.[51] Das MaX (Materials at the Exascale) ist als weiteres wichtiges Projekt zu nennen.[52] Im März 2015 startete das SERT-Projekt unter Beteiligung der Universität von Manchester und der STFC in Cheshire.[53]
Siehe auch: Europäisches Hochleistungsrechnen.
In Japan begann 2013 das RIKEN die Planung eines Exascale-Systems für 2020 mit einem elektrischen Leistungsbedarf von weniger als 30 MW.[54] 2014 wurde Fujitsu beauftragt, die nächste Generation des K computer zu entwickeln.[55] 2015 verkündete Fujitsu auf der International Supercomputing Conference, dass dieser Supercomputer Prozessoren der ARMv8-Architektur verwenden werde.[56]
Korrelatoren sind spezielle Geräte in der Radiointerferometrie deren Leistung man ebenfalls in Einheiten von FLOPS messen kann. Sie fallen nicht unter die Kategorie der Supercomputer, weil es sich um Spezialcomputer handelt, mit denen sich nicht jede Art von Problemen lösen lässt.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.