Laut dem halbjährlich erscheinenden Green500-Ranking Supercomputer des KIT ist einer der energieeffizientesten der Welt

Die neue HoreKa-Erweiterung „HoreKa-Teal“ (rechts) mit insgesamt 88 warmwassergekühlten Grafikbeschleunigerprozessoren steht neben dem im Juni 2021 in Betrieb genommenen Hochleistungsrechner Karlsruhe (im Hintergrund).

Bild: Markus Breig, KIT
13.05.2024

Der „Hochleistungsrechner Karlsruhe“ (HoreKa), der seit Juni 2021 am Karlsruher Institut für Technologie (KIT) in Betrieb ist, zählt derzeit zu den schnellsten Rechnern Europas. Nach einem kürzlich erfolgten Upgrade belegt er nun außerdem Rang 6 in der halbjährlich erscheinenden Green500-Liste der energieeffizientesten Rechner der Welt. Damit verbessert sich der Supercomputer um sieben Plätze im Vergleich zu 2021.

„Hochleistungsrechner ermöglichen komplexe Simulationen, Datenanalysen und Berechnungen, die in der Wissenschaft unverzichtbar sind und dabei helfen, schnelle Antworten auf die drängendsten Herausforderungen unserer Zeit zu finden“, sagt Professorin Kora Kristof, Vizepräsidentin Digitalisierung und Nachhaltigkeit des KIT. „Dabei gilt es aber auch, den Energieverbrauch sowie andere Nachhaltigkeitsaspekte im Blick zu behalten: Die hervorragende Platzierung in den Top 10 der weltweiten Green500-Liste zeigt, dass es uns am KIT gelingt, Leistung und Energieeffizienz in Einklang zu bringen.”

„Unser Hochleistungsrechner vereint verschiedenste Komponenten und erreicht eine extrem hohe Leistung bei Rechenoperationen, etwa beim Lösen von Gleichungssystemen oder beim Training von neuronalen Netzen in der Künstlichen Intelligenz“, so Professor Martin Frank, Direktor des Scientific Computing Center (SCC) des KIT. „Effiziente Kühlung, intelligente Stromverwaltung und optimierte Hardwarearchitekturen tragen dazu bei, den Energieverbrauch zu minimieren und die Nachhaltigkeit in der Wissenschaft zu fördern.“

Neue Beschleunigerprozessoren mit hoher Effizienz

HoreKa ist ein Hybridsystem, das zum einen aus 668 Rechenbeschleunigern und zum anderen aus 60 000 handelsüblichen Standardprozessoren (CPUs) besteht. Diese beiden Bereiche, „HoreKa-Green“ und „HoreKa-Blue“, haben die Forschenden des KIT nun um „HoreKa-Teal“ erweitert. Mit den 88 neuen Beschleunigerprozessoren vom Typ NVIDIA H100 steigt die Leistung von HoreKa von 17 auf insgesamt mehr als 20 PetaFLOPS.

Ein PetaFLOP entspricht dabei einer Leistung von einer Billiarde Rechenoperationen pro Sekunde. Die Beschleuniger führen die Berechnungen wesentlich energieeffizienter aus als bisher, da sie in einem weiterentwickelten Fertigungsprozess mit deutlich kleineren Strukturen hergestellt werden.

Mit einer speziellen Benchmark-Anwendung – dem High Performance LINPACK – wurde die Rechenleistung der neuen Beschleuniger gemessen. Dies ist notwendig, um HoreKa für die Liste der energieeffizientesten Rechner zu nominieren. In diesem Benchmark lösen die Recheneinheiten ein fest definiertes Gleichungssystem. Aus der dafür benötigten Zeit ergibt sich die Rechenleistung, aus der aufgenommenen Energie die Energieeffizienz. Mit den gemessenen 63 GigaFLOPS pro Watt belegt HoreKa nun weltweit Rang 6.

Optimierung verschiedener Parameter steigert Leistung

Um diesen Spitzenwert zu erreichen, haben die Teams des SCC verschiedene weitere Parameter optimiert, wie etwa die maximale Leistungsaufnahme der Rechenbeschleuniger. „Selbst kleinste Stellschrauben wirken sich auf die Energieeffizienz aus“, sagt Simon Raffeiner, Technischer Leiter des Nationalen Hochleistungsrechenzentrums am KIT (NHR@KIT). „Wir haben hier über die Jahre viel Know-how aufgebaut und auch unsere Nutzenden dafür sensibilisiert. Am Ende zählt schließlich nicht die Energieeffizienz eines bestimmten Benchmarks, sondern alle Anwendungen, die tatsächlich auf dem System laufen, müssen so effizient wie möglich sein.“

Seit fast zehn Jahren setzt das KIT zudem auf eine effiziente Warmwasserkühlung bei seinen Hochleistungsrechnern. „Diese minimiert ganzjährig den Energieaufwand für die Kühlung der Komponenten und ermöglicht es beispielsweise, die Abwärme zum Heizen der Bürogebäude zu nutzen“, so Martin Frank. Für seine Vorreiterrolle bei dieser Technologie erhielt das SCC 2017 den Deutschen Rechenzentrumspreis.

Umfassendes Unterstützungskonzept für Nutzende

Darüber hinaus unterstützt ein spezielles Team des SCC die Forschenden dabei, die Leistung und Energieeffizienz ihrer Berechnungen zu optimieren. Mit dem „Job-Performance Monitoring System“ können sie Laufzeitparameter ihrer Berechnungen wie den Energieverbrauch oder die Auslastung von CPU und GPU visualisieren und analysieren.

Verwandte Artikel