GeForce RTX 5060 im Test: AI-Benchmarks

 7/9
Wolfgang Andermahr
428 Kommentare

Das Thema künstliche Intelligenz, „AI“ schwirrt derzeit in der gesamten IT-Branche herum. Sei es Hardware für AI oder Software die (oft angeblich) AI für irgendwelche Verbesserungen nutzt – das Thema ist nicht mehr wegzudenken. Umso mehr, da nun auch Microsoft ein neuronales Netzwerk für den Copilot+ nutzt und manche SoCs mit einer NPU auch separate Hardware verbaut haben, die Matrizen-Berechnungen, aus diesen entsteht ein neuronales Netzwerk, effizient durchführen können.

Moderne PC-Hardware kann bereits länger ein neuronales Netzwerk beschleunigen, konzentriert sich anders als eine NPU aber nicht auf Effizienz, sondern auf Performance. Nvidia verbaut seit der GeForce-RTX-2000-Serie sogenannte Tensor-Kerne in Gaming-Grafikkarten, die „AI“ beschleunigen können. AMD hat zwar keine separate Hardware in den GPUs, ist seit RDNA 3 aufgrund neuer WMMA-Operationen (Wave Matrix Multiply Accumulate) aber auch deutlich besser für AI gerüstet. Und Intels Arc-Beschleuniger fahren mit ihren MXM-Einheiten ebenso eine dedizierte Matrizen-Beschleunigung auf. Erwähnenswert ist noch, dass auf dem Heim-PC nicht das AI-Training, also das Anlernen eines neuronalen Netzwerkes, sondern das AI-Inference, das Ausführen eines neuronalen Netzwerkes im Fokus steht. Beides hat sehr unterschiedliche Anforderungen und benötigt auch sehr verschiedene Hardware.

Für alle Tests gilt, dass jede Grafikkarte, falls möglich, mit ihrer für sie optimalen Bibliotheken arbeitet. Alle GeForce-RTX-GPU arbeiten mit Nvidias auf CUDA basiertem TensorRT, während für Intel Arc OpenVINO zum Einsatz kommt. AMD hat noch keine eigene Bibliothek für AI Inference, entsprechend kommt Microsofts überall lauffähiges DirectML zum Einsatz.

Procyon AI Image Generation mit Stable Diffusion

Abgesehen vom Copilot+ gibt es für den PC immer mehr Software, die AI für etwaige Aufgaben nutzt. Mit die bekannteste ist die Erstellung künstlicher Bilder nach Eingabe gewisser Vorgaben, die dann mittels „Stable Diffusion“ umgesetzt wird. ComputerBase nutzt den synthetischen Benchmark Procyon AI Image Generation dafür und daraus den Test „Stable Diffusion 1.5 (FP16)“ mit geringen Anforderungen sowie „Stable Diffusion XL (FP16)“ mit hohen Anforderungen an die GPU-Hardware, der unter anderem deutlich mehr VRAM benötigt und daher längst nicht überall läuft. Die Ergebnisse werden in „Sekunden pro Bild“ dargestellt.

Procyon AI Image Generation – Stable Diffusion 1.5 (FP16)
    • GeForce RTX 5090 (32 GB)
      0,9
    • GeForce RTX 4090 (24 GB)
      1,1
    • GeForce RTX 5080 (16 GB)
      1,3
    • GeForce RTX 4080 Super (16 GB)
      1,5
    • GeForce RTX 5070 Ti (16 GB)
      1,6
    • GeForce RTX 4070 Ti Super (16 GB)
      1,8
    • GeForce RTX 5070 (12 GB)
      2,1
    • GeForce RTX 4070 Super (12 GB)
      2,2
    • Radeon RX 9070 XT (16 GB)
      2,4
    • GeForce RTX 4070 (12 GB)
      2,6
    • GeForce RTX 3080 (10 GB)
      2,6
    • Radeon RX 9070 (16 GB)
      2,8
    • Radeon RX 7900 XTX (24 GB)
      3,1
    • GeForce RTX 5060 Ti (16 GB)
      3,1
    • Radeon RX 7900 XT (20 GB)
      3,6
    • GeForce RTX 5060 (8 GB)
      3,8
    • Radeon RX 7900 GRE (16 GB)
      4,1
    • GeForce RTX 4060 Ti (8 GB)
      4,1
    • Arc B580 (12 GB)
      4,2
    • GeForce RTX 3060 Ti (8 GB)
      4,3
    • Radeon RX 7800 XT (16 GB)
      5,0
    • Radeon RX 7700 XT (12 GB)
      5,4
    • GeForce RTX 4060 (8 GB)
      5,4
    • Arc A770 (16 GB)
      5,7
    • Arc A580 (8 GB)
      8,5
    • Radeon RX 7600 (8 GB)
      9,1
    • Radeon RX 6800 XT (16 GB)
      15,8
    • Radeon RX 6700 XT (12 GB)
      30,1
Einheit: Sekunden pro Bild
Procyon AI Image Generation – Stable Diffusion XL (FP16)
    • GeForce RTX 5090 (32 GB)
      5,4
    • GeForce RTX 4090 (24 GB)
      7,5
    • GeForce RTX 5080 (16 GB)
      9,0
    • GeForce RTX 4080 Super (16 GB)
      9,6
    • GeForce RTX 5070 Ti (16 GB)
      11,1
    • GeForce RTX 4070 Ti Super (16 GB)
      12,3
    • GeForce RTX 4070 Super (12 GB)
      14,6
    • GeForce RTX 5070 (12 GB)
      15,0
    • Radeon RX 9070 XT (16 GB)
      18,3
    • GeForce RTX 4070 (12 GB)
      18,3
    • GeForce RTX 3080 (10 GB)
      19,4
    • GeForce RTX 5060 Ti (16 GB)
      21,1
    • Radeon RX 9070 (16 GB)
      21,4
    • Arc B580 (12 GB)
      23,5
    • Radeon RX 7900 XTX (24 GB)
      25,2
    • Radeon RX 7900 XT (20 GB)
      28,5
    • Radeon RX 7900 GRE (16 GB)
      34,2
    • Arc A770 (16 GB)
      34,2
    • Radeon RX 7800 XT (16 GB)
      42,2
    • Arc A580 (8 GB)
      43,4
    • Radeon RX 7700 XT (12 GB)
      47,5
    • Radeon RX 7600 (8 GB)
      Absturz
    • Radeon RX 6800 XT (16 GB)
      Absturz
    • Radeon RX 6700 XT (12 GB)
      Absturz
    • GeForce RTX 5060 (8 GB)
      Absturz
    • GeForce RTX 4060 Ti (8 GB)
      Absturz
    • GeForce RTX 4060 (8 GB)
      Absturz
    • GeForce RTX 3060 Ti (8 GB)
      Absturz
Einheit: Sekunden pro Bild

Topaz Video AI 6 – Aufhübschen von Videos

Neben dem Erstellen von Bildern gehört das (zumindest theoretische) Aufhübschen von Bildern zu klassischen KI-Aufgaben. Hierfür kommt der Integrierte Benchmark Topaz Video AI 6.2, den in der freien Version auch jeder selbst kostenlos und ohne Einschränkungen ausführen kann. Der Benchmark nutzt verschiedene neuronale Netzwerke, die dazu benutzt werden, verschiedene Effekte auf Videos anzuwenden. Die Ergebnisse werden in klassischen Frames per Second dargestellt, so viele Bilder kann die Hardware in Echtzeit bei einem 1.080p-Video berechnen. ComputerBase fasst dabei alle Ergebnisse der verschiedenen Effekte zu einem einzelnen Wert zusammen und nutzt dafür das geometrische Mittel.

Topaz Video AI 6
    • GeForce RTX 5090 (32 GB)
      29,1
    • GeForce RTX 4090 (24 GB)
      24,9
    • GeForce RTX 5080 (16 GB)
      22,4
    • Radeon RX 9070 XT (16 GB)
      22,0
    • GeForce RTX 4080 Super (16 GB)
      20,6
    • Radeon RX 9070 (16 GB)
      20,1
    • GeForce RTX 5070 Ti (16 GB)
      19,3
    • Radeon RX 7900 XTX (24 GB)
      18,8
    • GeForce RTX 4070 Ti Super (16 GB)
      18,2
    • Radeon RX 7900 XT (20 GB)
      16,4
    • GeForce RTX 5070 (12 GB)
      16,3
    • GeForce RTX 4070 Super (12 GB)
      15,8
    • Radeon RX 7900 GRE (16 GB)
      14,9
    • GeForce RTX 4070 (12 GB)
      13,2
    • Radeon RX 7800 XT (16 GB)
      12,7
    • GeForce RTX 5060 Ti (16 GB)
      11,6
    • Radeon RX 7700 XT (12 GB)
      11,5
    • GeForce RTX 5060 Ti (8 GB)
      11,5
    • GeForce RTX 5060 (8 GB)
      10,4
    • GeForce RTX 3060 Ti (8 GB)
      9,8
    • GeForce RTX 4060 Ti (8 GB)
      9,6
    • Arc B580 (12 GB)
      8,1
    • Arc A770 (16 GB)
      7,9
    • GeForce RTX 4060 (8 GB)
      7,7
    • Radeon RX 6700 XT (12 GB)
      6,7
    • Radeon RX 7600 (8 GB)
      6,6
Einheit: Bilder pro Sekunde (FPS)

ON1 Resize AI – Bildervergrößerung

Der dritte und letzte AI-Benchmark beschäftigt sich mit der Vergrößerung von Bildern. Mit Hilfe der Software ON1 Resize AI werden 10 verschiedene Fotos in der Auflösung pro Achse verdoppelt. Dabei handelt es sich um 10 ohnehin schon hoch aufgelöste Bilder mit einer Auflösung von 5.472 × 3.078 bis zu 7.657 × 5.119, die Anforderungen sind entsprechend hoch. Mittels Log-Datei wird die genaue Berechnungszeit der einzelnen Bilder erfasst und das geometrische Mittel gebildet. Die Ergebnisse werden in „Sekunden pro Bild“ ausgegeben.

ON1 Resize AI 2023.5
    • GeForce RTX 5090 (32 GB)
      4,9
    • Radeon RX 9070 XT (16 GB)
      5,3
    • GeForce RTX 4090 (24 GB)
      5,3
    • Radeon RX 9070 (16 GB)
      5,6
    • GeForce RTX 5080 (16 GB)
      6,8
    • GeForce RTX 4080 Super (16 GB)
      6,9
    • GeForce RTX 5070 Ti (16 GB)
      7,2
    • GeForce RTX 4070 Ti Super (16 GB)
      7,3
    • GeForce RTX 4070 Super (12 GB)
      8,0
    • GeForce RTX 5070 (12 GB)
      8,1
    • Radeon RX 7900 XTX (24 GB)
      9,1
    • GeForce RTX 3080 (10 GB)
      9,4
    • Radeon RX 7900 XT (20 GB)
      9,6
    • GeForce RTX 4070 (12 GB)
      9,9
    • Radeon RX 7900 GRE (16 GB)
      10,6
    • Arc B580 (12 GB)
      10,9
    • GeForce RTX 5060 Ti (16 GB)
      11,3
    • GeForce RTX 4060 Ti (8 GB)
      11,4
    • Radeon RX 7800 XT (16 GB)
      12,2
    • Radeon RX 7700 XT (12 GB)
      12,4
    • GeForce RTX 5060 (8 GB)
      13,0
    • Radeon RX 6800 XT (16 GB)
      13,7
    • GeForce RTX 3060 Ti (8 GB)
      14,9
    • GeForce RTX 4060 (8 GB)
      15,6
    • Radeon RX 6700 XT (12 GB)
      16,4
    • Radeon RX 7600 (8 GB)
      18,7
    • Arc A770 (16 GB)
      47,5
    • Arc A580 (8 GB)
      56,8
Einheit: Sekunden pro Bild
📊 Intel, AMD oder Nvidia? Mach' jetzt noch mit bei unserer großen Jahresumfrage!