News Blackwell Mini-PC und Workstation: Nvidia bietet DGX Spark und DGX Station für Endkunden an

Gringalf · 20. März 2025

@HerrRossi Damit sind dünn besetzte Matrizen gemeint, also Matrizen, die fast überall Nullen enthalten. Dafür gibt es dann effizientere Algorithmen. Siehe https://de.wikipedia.org/wiki/Dünnbesetzte_Matrix

HerrRossi · 20. März 2025

Also eine Art Benchmark, der hohe Ergebnisse abliefert?

stefan92x · 20. März 2025

@HerrRossi Das ist schon etwas, was sich in realen Anwendungen oft findet. Genau deshalb wird auch die Hardware darauf optimiert. Das ist einfach eine eingebaute Abkürzung für den Fall, dass mit 0 multipliziert werden sollte, da muss man halt nicht das große Rechenwerk füttern, sondern kann direkt 0 zurückgeben.

Bei Berechnungen einzelner Daten gibt das keinen relevanten Boost, aber wenn man ganze Matrizen auf einmal in den Rechenkern wirft, dann wird es spürbar.

HerrRossi · 20. März 2025

Alles klar, vielen Dank für die Info!

nutrix · 20. März 2025

Reservierungen für den kleinen DGX Spark nimmt Nvidia ab sofort entgegen

Ach, hier sind Reservierungen plötzlich möglich... 🙄🤬

TheSomeone · 21. März 2025

Gringalf schrieb:
Der Speicherdurchsatz liegt leider nur bei 273 GB/s. Siehe https://www.nvidia.com/en-us/products/workstations/dgx-spark/

Man bekommt also eine 5070 mit 128 GB RAM, das aber nur 40,625% des Durchsatzes der 5070 hat. Für LLM ist das aber der entscheidende Wert, da für jedes Token das komplette Modell ganz eingelesen werden muss, d.h. ein 100 GB großes Modell würde zwar laufen, aber maximal mit 2,73 Token/s, realistisch wahrscheinlich mit ca. 2 Token/s.

Bei dem Preis könnte man auch über einen Mac Studio nachdenken mit 128 GB (oder auch mehr) unified RAM, der dann aber mit 819 GB/s angebunden ist, also exakt 3 mal so schnell.

Der kostet auch mehr und kein Nvidia Software Stack

sujo99 · 22. April 2025

phanter schrieb:
Also eine 5070 mit 128Gb RAM für 3999$

Geht schlimmer aber geht auch besser. Glaube da macht eine RTX PRO 6000 schnell mehr Sinn. Bringt immerhin 3-4x mehr Rechenleistung mit. Und günstiger zusammenschließen kann man die auch in einem System mit 2-6 Karten

Ergänzung (19. März 2025)

Eine GB200 besteht aus zwei Dies. Das ist vermutlich gemeint

Hm nur bist du bei einer Rtx pro 6000 bei 6000-8000$ und 48GB Ram. Ich glaube da wird es für den Prosumer langsam too much.

GrumpyCat · 22. Mai 2025

ARM-CPU "in Zusammenarbeit mit MediaTek"? Klingt etwas gruselig. Welches OS läuft denn drauf? Läuft Linux mit den normalen Distributions-Kerneln? Wohl kaum, schätze ich...?

Reelaxxer! · 2. Februar 2026

Gringalf schrieb:
Der Speicherdurchsatz liegt leider nur bei 273 GB/s. Siehe https://www.nvidia.com/en-us/products/workstations/dgx-spark/

Man bekommt also eine 5070 mit 128 GB RAM, das aber nur 40,625% des Durchsatzes der 5070 hat. Für LLM ist das aber der entscheidende Wert, da für jedes Token das komplette Modell ganz eingelesen werden muss, d.h. ein 100 GB großes Modell würde zwar laufen, aber maximal mit 2,73 Token/s, realistisch wahrscheinlich mit ca. 2 Token/s.

Bei dem Preis könnte man auch über einen Mac Studio nachdenken mit 128 GB (oder auch mehr) unified RAM, der dann aber mit 819 GB/s angebunden ist, also exakt 3 mal so schnell.

Ich habe den DGX jetzt seit Freitag und bin fleißig am testen und einarbeiten. Habe testweise mal den OpenAI GPT mit 120B, ca. 70 GB installiert. Es erreicht bei den ersten Test-Anfragen ca. 60 Token/sek. Bei komplexeren und parallelen Anfragen spielt das Gerät erst dann seine wahren Stärken aus, die Tests die ich gesehen habe erreichen ca. 1500 T/Sek. Ein Mac Studio M3 Ultra mit 512GB Ram, erreicht "nur" ca. 250T/Sek.

hippiemanuide · 1. Juni 2026

Da gehe ich mit. Habe auch einen DGX-Spark und manchmal dachte ich, ok n Mac studio mit 128 hätte auch auch getan, aber selbst mit der "schmalen Bandbreite" rockt gut durch. Je nach Modellart (MoE/Dense) fallen Token/s entsprechend aus. Bei mir sind es zwischen 4-~80tks von Dense zu MoE usw.
Ich setze ihn für quasi alles was local LLM/AI etc betrifft ein und bin echt fasziniert von der kleinen Kiste. Linux Support und Treiber/Software-Pflege ist bisher gut. Wenn Nvidia da nun doch noch den Endkunden Sale anschmeißt, noch besser, heisst, da gibt es dann noch mehr und hoffentlich lange Support + OS Pflege.
Die DGX Station wäre ein Träumchen, aber 100k ohne "größeren Business Kontext", da bin ich dann erstmal raus.

Suche

News Blackwell Mini-PC und Workstation: Nvidia bietet DGX Spark und DGX Station für Endkunden an

Gringalf

Newbie

HerrRossi

Fleet Admiral

stefan92x

Rear Admiral

HerrRossi

Fleet Admiral

nutrix

Vice Admiral

TheSomeone

Banned

sujo99

Cadet 1st Year

GrumpyCat

Lt. Commander

Reelaxxer!

Ensign

hippiemanuide

Lt. Commander

Ähnliche Themen

Passend zum Thema

Im Keller gefunden AMD-PC mit Unterschriften von Lisa Su und Mark Papermaster

Test GMKtec K17 Mini-PC mit Intel Core Ultra bietet viel RAM/SSD für 530 Euro

Computex Zotac GeForce RTX 5080 als Magnus One Ultra im Kompaktformat