AMD-Keynote zur ISC 2025: Teure 2-nm-Chips, MI355X, Effizienz und Kernreaktoren
In einem vollgepackten Saal erläuterte AMDs CTO Mark Papermaster zur ISC 2025 die Visionen der Branche. Wachstum gibt es weiterhin massiv, AI soll dieses in Zukunft weiterführen – die neuen Einträge von Supercomputern auch in Deutschland wie Jupiter und Blue Lion untermauern dies.
Mit weiterhin der Nummer 1 und Nummer 2 der weltweit schnellsten Supercomputer im Rücken übernahm AMDs Nummer 2 im Konzern gern die Eröffnungskeynote zur ISC 2025 in Hamburg. Gleich voran stellte Papermaster: Die Leistung von Supercomputern wird weiter rasant steigen.
Papermaster führte dabei aus, dass es die Nachfrage sei, die Innovationen und Erfindungen dieser Art hervorbringen und das auch in Zukunft tun werden. Natürlich sei AI dabei gerade ein Fokusthema, aber ohne die klassischen Techniken gehe es nicht. Hohe Präzision sei nach wie vor überaus wichtig, gerade bei Supercomputern für den wissenschaftlichen Einsatz. Berechnungen mit doppelter Genauigkeit (FP64) gehen hier nicht weg, wenn selbst FP128 auch noch gefragt ist. Geringere Präzision wie FP16 und FP8 werden in einigen Bereichen aber sehr gut unterstützen können, es braucht einen hybriden Ansatz. Am Ende heiß es so oder so aber: „It's not just FLOPS!“
Bandbreite und Strom limitieren
Reine Compute-Leistung lässt sich theoretisch durchaus schnell bereitstellen, es sind jedoch viele weitere Parameter, die das am Ende in der Praxis limitieren. Vor allem Bandbreite, sei es beim Speicher oder auch dem Netzwerk, und natürlich die Leistungsaufnahme sind sehr große Herausforderungen, die alle unter einen Hut gebracht werden müssen.
Die Total Board Power moderner Beschleuniger sah zuletzt einen massiven Anstieg. 1.600 Watt und mehr werden ab 2026/2027 Realität, und auch dies ist nur ein weiterer Schritt in Richtung 2.000 Watt. Die Speicherbandbreite muss gemäß den aktuellen Daten weiter um den Faktor 2 jedes zweite Jahr steigen um die Compute-Leistung nicht auszubremsen, dies wiederum kostet jedoch noch mehr Strom. Strom und Kühlung werden und sind in einigen Teilen bereits heute, der größte Faktor bei der Limitierung.
Der Trend zu noch höherem Stromverbrauch wird aber anhalten. Neue AI-Rechenzentren werden für hunderte Megawatt gebaut, für ein Zettascale-System deshalb hier ein halbes Gigawatt anzusetzen liegt dann letztlich schon ein wenig auf der Hand.
Auf die nicht ganz ernst gemeinte Frage am Ende der Keynote, wie viele Hersteller kleiner Kernreaktoren wir denn zur ISC 2035 sehen, folgte prompt die Antwort: 15. Natürlich auch mit einem Augenzwinkern, es zeigt aber, dass dieses Thema durchaus einen Raum einnehmen wird.
AMD Instinct MI355 kommt
AMD war durch die letzten Instinct-Lösungen durchaus gut aufgestellt in dem Bereich, erklärte auch Papermaster. MI300X und MI300A, letzterer vor allem für Supercomputer, fanden durchaus ihren Markt, AMD setzt im ersten Jahr fünf Milliarden US-Dollar damit um und zwackte fünf Prozent des Marktes ab. Mit MI355X wird das im Rahmen seiner Vorstellung am Donnerstag fortgeführt, bestätigte Papermaster.
MI355X wird in gewissen Szenarien deutlich flotter sein als bisherige MI300: Von bis zum 35-fachen der Inference-Leistung spricht AMD auch heute wieder – wie schon seit Oktober des letzten Jahres. Die weiterhin sowohl als luft- oder wassergekühlte Variante angebotene Lösung von AMD wird dem Unternehmen dabei helfen, sein selbst auferlegtes Ziel zu erreichen, die Effizienz zu verbessern. In Zukunft könnte In-Memory-Compute ebenfalls dazu beitragen, hier verspricht sich die Branche einen Effizienzsprung – AMD forscht ebenfalls daran, bestätigte Papermaster.
Dass AMD-basierte Supercomputer zu den besten zählen, was das Thema Leistung in Relation zur Leistungsaufnahme angeht, haben sie auch dieses Jahr wieder unter Beweis gestellt, in den Top10 der Green500 sind mehrere AMD-Systeme dabei.
Konkurrenz belebt das Geschäft, RISC-V noch nicht
Im Profi-Bereich sind Kosten aber ebenfalls ein Thema, welches schnell kritisch wird. Budget-Grenzen haben im Grunde alle, von vornherein greift die Frage: Mehr Geld direkt in die Systeme stecken oder dann doch das Budget für ganz lange Laufzeiten auslegen? AMD will sich hier einmal mehr gern der Open-Source-Community und freien Lösungen verschreiben, merkt dann aber auch an, dass es so leicht nicht immer ist.
Die Entwicklung ihres neuen 2-nm-Chips war natürlich nicht offen – und extrem teuer und dauert viel länger zu produzieren, wie Papermaster auf der Bühne betonte. Auch viele Tools, die dafür nötig sind, waren es nicht – und werden es in naher Zukunft auch nicht sein. Es sind andere Punkte, wie „Ultra Ethernet“ als Verbindung der Zukunft, welches jedoch die Kosten drücken könnte. Hier sieht sich letztlich auch Nvidia bedroht und öffnete NVLink für Mitbewerber, um auch Ultra Ethernet ein wenig das Wasser abzugraben. Eine gewisse Auswahl in dem Bereich kann helfen, die Kosten nicht komplett ausufern zu lassen.
Auf die Frage, ob auch RISC-V dazugehöre, verneinte dies Papermaster, respektive erklärte, dass es aktuell nicht realistisch sei, diese Chips dem Bereich Supercomputer zuzuordnen. RISC-V-Lösungen werden jedoch auch bei AMD bereits in vielen Bereichen eingesetzt. RSIC-V stehe einfach immer noch komplett am Anfang und habe viel Entwicklungszeit vor sich.
Der Supercomputer der Zukunft: Braucht alles!
Der nächste Supercomputer soll im Idealfall so etwas wie die eierlegende Wollmilchsau sein. Inwiefern das realistisch ist, bleibt abzuwarten, vermutlich wird es weiterhin eher spezialisierte Systeme für die eine oder andere Aufgabe geben, so wie der Trend sich zuletzt abzeichnete. Auch die Bauweise via Modulen, wie sie beispielsweise bei Jupiter aktuell umgesetzt werden, ist ein Ansatzpunkt, der eine große Supercomputer ist dabei am Ende ein Baukasten aus mehreren Teilen.
Denn eine gewaltige Menge an FLOPS mit niedriger Präzision, dazu natürlich weiterhin auch FP64, garniert mit einer riesigen Bandbreite, eventuell optische Verbindungen und auch noch Quantencomputer-Support unter einen Hut zu bekommen, geht aktuell ohnehin nur mit multiplen Technologien.
Und dabei müssen auch die Haltbarkeit und Laufzeiten der jeweiligen Produkte im Auge behalten werden, die so unwichtig nicht sind: Bei AMD habe das Thema Reliability den gleichen Stellenwert wie Performance und Effizienz, erklärte Papermaster. Die Betreiber der aktuellen AMD-Supercomputer teilen alle Daten, die interessantesten sind natürlich Temperaturverläufe und Taktraten in den eng gepackten Blades und Racks. Die Frontier-Betreiber erklären dazu auf der Bühne, dass die Instinct-Chips meist nur bei vergleichsweise geringen maximal 60 Grad arbeiten.
- AMD Instinct MI350 Serie: 288 GByte HBM3E, CDNA-4-Architektur und bis zu 1.400 Watt
- AMD-Keynote zur ISC 2025: Teure 2-nm-Chips, MI355X, Effizienz und Kernreaktoren
- Green500 Juni 2025: Das sind die neuen effizientesten Supercomputer
- +2 weitere News