AMD-Generationenvergleich: Fazit: RDNA 1, 2, 3 & 4 im Vergleich
4/4Die großen Neuerungen seit RDNA 1 sind der Infinity Cache mit RDNA 2 sowie die Dual-Issue VALU seit RDNA 3 gewesen. Während der Infinity-Cache ein voller Erfolg und auch heute noch spürbar ist (Nvidia ist nicht ohne Grund auf einen riesigen L2-Cache gegangen), sieht es bei den Dual-Issue-VALU anders aus. In zu vielen Spielen kann sich die Radeon RX 7800 XT nur um die Anzahl der gesteigerten CU absetzen. Statt 40 CU sind es 60 und damit 50 Prozent mehr. RDNA 4 hinterlässt im Generationenvergleich einen etwas schwächeren Eindruck als im Test zum Launch. RDNA 4 mag moderne Spiele, bei älteren Spielen fällt es RDNA 4 jedoch etwas schwerer, sich von RDNA 3 abzusetzen. Bei modernen Titeln sind es bei 2160p im Mittel knapp 48 Prozent, die zwischen RX 9070 XT und RX 7800 XT liegen, in diesem Generationenvergleich sind es schwächere 41 Prozent.
Erst mit Raytacing kann RDNA 4 wirklich auftrumpfen und das starke Ergebnis des Launchartikels bestätigen: 66 Prozent schneller als RDNA 3 in 2160p und immer noch sehr gute 61 Prozent Vorsprung in 1080p stehen zu Buche.
Gleichzeitig kann auch RDNA 3 im Generationenvergleich bei RT deutlich zulegen, wobei hier nicht die reine RT-Leistung der RT-Implementation für den Vorsprung verantwortlich ist, sondern auch die Steigerung des CU-Counts. Dazu hilft der RX 7800 XT die 16 GB VRAM. Auch in 1080p kann sich RDNA 3 jedoch stärker von RDNA 2 absetzen als RDNA 4 von RDNA 3. Natürlich unterschlägt diese Betrachtung die Verbesserungen beim RT durch RDNA 4 und ist nur ein Winkel der Betrachtung.
Um einzuschätzen, was sich alles getan hat, müssen auch die Unterschiede zwischen den einzelnen Chips beachtet werden. Die Radeon RX 7800 XT hat 60 CU statt 40 wie die Radeon RX 6700 XT, taktet dabei jedoch etwas langsamer. Von den 65 Prozent gehen allein geschätzt 50 Prozentpunkte auf die Steigerung der CU und damit den Anstieg der RT-Kerne. RDNA 4 wiederum hat nur vier CU – sieben Prozent – mehr und taktet knapp 22 Prozent höher, von den 61 Prozent Steigerung in 1080p bei RT lassen sich 30 Prozentpunkte auf die gesteigerte Rohleistung zurückführen, die anderen 31 Prozentpunkte sind der besseren Raytracing-Implementation zuzuordnen. Das hat erst am Montag auch der IPC-Vergleich von RDNA 3 und RDNA 4 gezeigt:
Eine Konstante bei Navi ist, dass AMD versucht so viele Blöcke wie möglich mehrfach zu verwenden. Während Nvidia bei den GPUs für jede Aufgabe eigene Schaltungen und Rechenwerke implementiert und damit auch große Chips bewusst in Kauf nimmt, verwendet AMD so viel wie möglich mehrfach und erweitert nur dann die Architektur um neue Blöcke, wenn es notwendig ist.
Das beste Beispiel dafür sind die AI-Cores. Während Nvidia direkt zu Anfang eigene Tensor-Kerne für die Matrix-Berechnung implementiert hat, wird für die eigentliche Matrix-Operation bei AMD immer noch die VALU genutzt. Der AI-Core wiederum bereitet die Daten im Register-File so auf, dass diese passend durch die VALU berechnet werden können. Ebenso ist die Raytracing-Implementierung bei AMD zweigeteilt: Die Abfrage des BVH findet über die Textur-Einheiten statt, da diese bereits effektiv an den Cache angebunden sind, während die RT-Kerne die Schnittberechnung übernehmen.
Diese Vorgehensweise hat für AMD Vor- und Nachteile und bei den aktuellen Tests zeigen sich diese auch, wenn das Verhalten von Ada Lovelace und Blackwell dem von RDNA 4 verglichen wird. RDNA 4 nutzt das eigene Power-Budget in der Regel vollständig aus, während Ada Lovelace und Blackwell teilweise auch deutlich unterhalb der eigenen TBP laufen.
Es bleibt spannend, was RDNA 5 oder UDNA bringt und inwieweit AMD hier noch einmal die CU umbaut, die Leser wiederum können sich nach diesem Generationenvergleich bereits auf den nächsten freuen, der sich dann um Nvidias GeForce-RTX-xx70-Serie dreht.
Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.