KI-Rechenzentren werden oft als „stromfressende Giganten“ bezeichnet. Nicht nur verbrauchen Berechnungen im Bereich der Künstlichen Intelligenz enorme Mengen an Strom, sondern es wird auch eine beträchtliche Menge an Energie benötigt, um die Halbleiterchips zu kühlen, die sich während des Betriebs erhitzen. Da KI-Chips immer leistungsfähiger werden, steigt die von ihnen erzeugte Wärme rapide an. Infolgedessen stoßen herkömmliche Luftkühlung und externe Kupfer-Wärmeverteiler an ihre praktischen Grenzen. Um dieser Herausforderung zu begegnen, hat ein Forschungsteam der KAIST eine hocheffiziente Flüssigkeitskühlungstechnologie entwickelt, die Halbleiterchips mit hohem Wärmefluss direkt mit Wasser bei Raumtemperatur kühlt. Dies gelang den Forschern durch die Einbettung von Flüssigkeitskühlkanälen, die dünner als ein menschliches Haar sind, direkt in einen Silizium-Halbleiterchip. Dem Team gelang es, die Chip-Temperatur selbst unter extremen Wärmeentwicklungsbedingungen von über 2.000 W/cm2 unter 100 °C zu halten.
Mikrokanäle im Chip verkürzen den Weg des Kühlmittels
Die Forscher konzentrierten sich auf eine „Manifold-MicroChannel“-Struktur (im Folgenden MMC), die direkt in einen Siliziumchip eingebettet ist. Bei der Mikrokanalkühlung wird Wärme über mikroskopisch kleine Flüssigkeitskanäle abgeführt, die dünner sind als ein menschliches Haar. Bei herkömmlichen Konstruktionen muss das Kühlmittel durch zahlreiche Mikrokanäle von einem Ende des Chips zum anderen fließen. Dieser lange Strömungsweg erhöht den Strömungswiderstand und erfordert eine höhere Pumpleistung, um das Kühlmittel in Umlauf zu bringen.
Die vom Forschungsteam entwickelte Verteiler-Struktur verteilt das Kühlmittel über mehrere Einlasskanäle und sammelt es über mehrere Auslässe wieder auf. Eine Analogie lässt sich zu einem Logistiknetzwerk ziehen: Anstatt alle Güter von einem einzigen Ursprungsort zu einem weit entfernten Ziel zu transportieren, werden mehrere Verteilzentren strategisch platziert, um die Transportwege zu verkürzen. Da das Kühlmittel innerhalb jedes Kanals nur eine kurze Strecke zurücklegt, wird der Strömungswiderstand deutlich reduziert und der erforderliche Pumpdruck deutlich geringer.
Optimierte Kühlarchitektur steigert Effizienz deutlich
Frühere MMC-Konstruktionen litten häufig unter einer ungleichmäßigen Kühlmittelverteilung, wobei einige Kanäle zu viel Kühlmittel erhielten, während andere zu wenig bekamen. Das Forschungsteam bewältigte diese Herausforderung durch eine Verbesserung der Struktur, sodass das Kühlmittel gleichmäßig durch alle Mikrokanäle fließen kann. Durch umfangreiche Konstruktionsanalysen und fortschrittliche Simulationen identifizierten sie eine optimierte Kühlarchitektur, die eine hohe Kühlleistung liefert und gleichzeitig den Energieverlust minimiert.
Die verbesserte Struktur wurde anschließend in einem echten Silizium-Halbleiterchip umgesetzt und experimentell validiert. Unter denselben Temperaturanstiegsbedingungen erreichte das Kühlsystem einen Leistungskoeffizienten (COP) von 106.000. Dies ist etwa zehnmal höher als das bisherige weltweit führende Ergebnis von rund 10.000, das 2020 veröffentlicht wurde. In der Praxis bedeutet dies, dass nur etwa ein Zehntel der Pumpleistung erforderlich ist, um die gleiche Wärmemenge abzuführen.
Bemerkenswert ist, dass diese Leistung ohne den Einsatz von Phasenwechselkühlung, nanoskaligen Oberflächenmodifikationen oder teuren Materialien wie Diamant erzielt wurde. Als Kühlmittel wurde gewöhnliches Wasser bei Raumtemperatur verwendet. Zudem wurde das Gerät in einem Niedrigtemperaturprozess unter 350 °C hergestellt, der mit der herkömmlichen Halbleiterfertigung kompatibel ist. Das bedeutet, dass die Technologie in bestehenden Halbleiterfabriken implementiert werden könnte, ohne dass größere zusätzliche Investitionen in die Ausrüstung erforderlich wären.
Potenzial für KI-Chips, Rechenzentren und Leistungselektronik
Es wird erwartet, dass diese Technologie dazu beitragen wird, Herausforderungen im Bereich des Wärmemanagements in einer Vielzahl von elektronischen Systemen mit hohem Wärmefluss zu bewältigen, darunter KI-Beschleuniger, Hochleistungsrechner (HPC), dreidimensionale Halbleiterverpackungen, Leistungselektronik und Verteidigungselektronik. Insbesondere Rechenzentren sehen sich zunehmend nicht nur durch die Rechenleistung, sondern auch durch den Stromverbrauch für die Kühlung und die Anforderungen an die Kühlinfrastruktur eingeschränkt. Technologien, die den Kühlleistungsbedarf auf Chip-Ebene reduzieren, könnten daher eine wichtige Rolle bei der Verbesserung der Energieeffizienz von Rechenzentren der nächsten Generation und bei der Beseitigung thermischer Engpässe spielen.
Professor Sung Jin Kim erklärte: „Da die Leistung von KI-Halbleitern und fortschrittlichen elektronischen Gehäusen zunehmend durch Wärme begrenzt wird, erwarten wir, dass diese Technologie als grundlegende Kühllösung für zukünftige Hochleistungsrechnersysteme dienen wird.“