Racks mit Nvidia Blackwell: Erste Auslieferungen starten flankiert von möglichen Hitzeproblemen
CoreWeave und Dell verkünden die Auslieferung erster Blackwell-Racks, die den Auftakt der HPC-Messe SC24 in Atlanta begleiten. Zeitlich passend werden jedoch mögliche Hitzeprobleme bekannt. Unklar bleibt, inwiefern diese aber schon beseitigt wurden.
Der Report von The Information (Bezahlschranke) wird von großen Medienportalen wie Bloomberg und Reuters aufgegriffen und hat wenige Tage vor Bekanntgabe der Quartalszahlen von Nvidia einiges an Potenzial.
Nvidia NVL72 beherbergt 36 Grace-CPUs und 72 Blackwell-GPUs in einem flüssigkeitsgekühlten Rack. Hier soll es laut The Information zu Hitzeproblemen gekommen sein, die jedoch bereits vor einigen Monaten aufgetaucht waren und Anpassungen am Design nötig machten.
Inwiefern das umgesetzt wurde, ist unbekannt, Partner sollen jedoch angehalten worden sein, das Design der Racks mehrfach zu überarbeiten. Nvidia hatte kürzlich ein Problem bestätigt, das vor einigen Monaten bei der Blackwell-GPU aufgetaucht war und auch die Ausbeute reduzierte, und gemeinsam mit TSMC als behoben erachtet. Auch hier war es unter anderem The Information, die hierüber als erstes berichteten.
In einer Mitteilung an Reuters erklärte Nvidia, dass alle Auslieferungen im Plan liegen. Nvidia arbeite zusammen mit den Partnern an den Lösungen, heißt es weiter, die Dinge laufen „normal“ und „wie erwartet“. Dies ist kein echtes Dementi, denn wie erwartet schließt oft auch einige mögliche Probleme mit ein.
Erste Auslieferungen gestartet
Unabhängig davon vermeldeten in der Nacht CoreWeave und Dell die ersten Auslieferungen von GB200-Systemen, die den Meldungen über mögliche Hitzeprobleme schnell das Wasser abgraben.
We’re proud to bring up the first @NVIDIA GB200 NVL72 from @Dell with NVIDIA Quantum InfiniBand, setting a new bar for AI infrastructure. This wouldn’t have been possible without the support of our valued partners at @Dell and @Switch. pic.twitter.com/Y8uYvccNCD
— CoreWeave (@CoreWeave) November 18, 2024
Die Basis dafür ist der neue Dell PowerEdge XE9712, wie Firmenchef Michael Dell persönlich via X bestätigt. Der hohe Verbrauch der Komponenten hat Nvidia und den Partnern beim Design der Racks aber durchaus einiges abverlangt und Neuigkeiten hervorgebracht. Dell wartet auf die finale Absegnung eines Patents, das sich um das erweiterte Management der Kühlung kümmert, um so in den unterschiedlichen Bereichen des Racks möglichst effizient zu arbeiten.
The 1st in the world @nvidia GB200 NVL72 server racks are now shipping. We are thrilled to deliver our liquid-cooled PowerEdge XE9712 to @CoreWeave. The AI rocket just got a massive boost! 🤖🚀🤝 pic.twitter.com/2QzlxbQE5f
— Michael Dell 🇺🇸 (@MichaelDell) November 18, 2024