@Breaktivity
Türlich bringt gezieltes Scheduling auf einem CCD etwas beim 3D2. Core2Core Latenz innerhalb von eines Zen5 CCDs ist irgendwo bei ~20ns und zwischen den CCDs grob 200ns [1]. Bein Zen4 war es besser mit ~18ns zu ~77ns. Ram ist in ~130ns erreichbar.
Vom L3 eines anderen CCDs lesen geht mit ~32GB/s, lesen vom RAM durch ein CCD hingegen mit ~64GB/s.
Für Spiele bleibt es daher sinnvoll, nur auf einem CCD zu laufen. Prozesse bzw. Daten zwischen den CCDs zu verschieben ist schlicht zu teuer und Spiele skalieren nicht genügend über entsprechend viele Threads.
PS: Wobei es je nach Firmware bei Zen5 bei CCD zu CCD mittlerweile wohl auf 90..95ns optimiert wurde. Das ist halt noch immer nicht so viel schneller als die Latenz zum RAM und die Bandbreite bleibt. Auf dem Die bleiben ist und bleibt besser.
[1]
https://old.chipsandcheese.com/2024/08/14/amds-ryzen-9950x-zen-5-on-desktop/