CDLABSRadonP...
Vice Admiral
- Registriert
- Feb. 2021
- Beiträge
- 6.862
Von was für Dimensionen geht ihr denn überhaupt so bzgl. eines der IO-Tiles aus? Ist ja auch mal eine spannende Frage.
Folge dem Video um zu sehen, wie unsere Website als Web-App auf dem Startbildschirm installiert werden kann.
Anmerkung: Diese Funktion ist in einigen Browsern möglicherweise nicht verfügbar.
CDLABSRadonP... schrieb:Aber: Ich gehe mit ziemlicher Sicherheit davon aus, dass die MLCCs bislang einfach nah an die Chiplets gepackt wurden und das alles war.
Wenn ich mir die alten Dieshots ansehe, dann passt das eher nicht.CDLABSRadonP... schrieb:Also zwei Speicherkanäle pro Chiplettchen könnte ich mir schon vorstellen. Waren in der Vergangenheit ja so etwa zehn mm².
AMD hat für das Koppeln von IOD und CCD gedrosselte PCIe PHY verwender. Das Infinity Fabric on Chip verwendet AFAIU kein PCIe Protokoll.stefan92x schrieb:Richtig. Der Unterschied ist aber, dass PCIe (bzw InfinityFabric darüber) zur Verbindung von CPUs untereinander bei AMD etabliert ist und ich mir eine Lösung vorstellen kann, die sowohl die direkte Kopplung ohne PHY als auch die off package Verbindung via PHY erlaubt. Deshalb sehe ich bei PCIe einen Sinn in eigenen Chiplets, beim DRAM aber nicht.
Dazwischen müsste aber IMO noch ein PCIe Controllerstefan92x schrieb:Was ich vermute: Es ist eben kein PCIe PHY in den IOD, sondern einfach nur ein "Ring-Node", der per Sea of Wires mit dem nächsten Chiplet gekoppelt wird. Was dann entweder ein weiterer IOD ist, oder eben ein PCIe-PHY
Möglich.stefan92x schrieb:Ein jedes dieser Mini-Chiplets wäre ein PCIe x16 Host/PHY, mehr wohl nicht, da AMD schon angekündigt hat, bei 128 Lanes pro Sockel zu bleiben. Das sollte passen.
Ich hätte schon gerne ein bisschen mehr Futter. aber es hatte auch sein Gutes, nie war ich so schnell durch eine AMD Keynote durch.stefan92x schrieb:Auch ein spannender Gedanke (haben wir nicht gerätselt, was Verano sein wird?). Der sich auch gar nicht widersprechen muss. Vielleicht will AMD ja die Flexibilität im Design gewinnen, entweder Kupfer-PHYs oder optische im Chip einbauen zu können?
Aber das macht doch am meisten Spaß bei solchen News![]()
Anlässlich des Zen 5 Architecture Days gab Mike Clark ein Interview für Toms Hardware. Das hatte einige bemerkenswerte Aussagen zu den Dense Kernen.stefan92x schrieb:Ja. Bei Zen 4 kamen sie später, bei Zen 5 gleichzeitig, hier möglichlerweise früher, oder auch gleichzeitig - sie stehen aber derzeit definitiv mehr im Fokus
Es gibt zwei Konfigurationen SP7 und SP8. Einige Leute behaupten, dass SP7 nur mit Zen 6 Dense sei.stefan92x schrieb:Nein. Man braucht den großen Sockel für die IODs, und hat halt bei diesem Packaging die Wahl entweder 8x12 oder 8x32 Cores zu verbauen. Es gibt aber keinen Grund, das 8x12 Design nicht auf den großen Sockel zu bringen. Da bleibt vielleicht mehr freie Fläche auf dem Package, aber die RAM-Kanäle und PCIe-Konnektivität braucht man auch dafür und damit alle PINs auf dem Sockel.
Zen 6 bleibt auf AM5, das haben die ganzen Mainboardhersteller schon verkündet.Sun_set_1 schrieb:Anschließender Gedanke, ob ein solches Re-Design überhaupt noch in AM5 passen würde, habe da aktuell so meine Zweifel.
Wie kommst du drauf, dass die GPU in einer APU kostenfrei wäre? Eine APU holt man sich als idR. nicht um Geld zu sparen …RaptorTP schrieb:Also, der Plan ist doch eine richtig schnelle APU. Dann kann man das gesparte Geld für die Graka in RAM investieren![]()
Bei der geringen Anzahl Betroffener?RaptorTP schrieb:Muss keinen 12VHPWR Stecker nutzen
Aber auch nur bei entsprechend deutlich weniger GPU-Leistung …RaptorTP schrieb:😎
Schön ITX und den 420er Radiator der AiO als "MORA" nutzen xD
MalWiederIch schrieb:Unterhalb der 5090 kann man die ja an einer Hand abzählen - bei der 5090 selbst vermutlich auch …
Sun_set_1 schrieb:Da geht nur entweder / oder.
ETI1120 schrieb:Wir sehen hier das Dense CCD mit 32 Kernen. Das Classic CCD sollte deutlich kleiner sein.
Stimmt, aber die Verbindung zwischen Sockeln schon (EDIT: Also auch da nicht das Protokoll soweit ich weiß... aber eben den kompletten physischen Layer)ETI1120 schrieb:AMD hat für das Koppeln von IOD und CCD gedrosselte PCIe PHY verwender. Das Infinity Fabric on Chip verwendet AFAIU kein PCIe Protokoll.
Für mich ist bei meiner Vermutung selbst völlig unklar, ob der im IOD sein müsste, oder im PCIeD sitzen könnte - es spielt im Top Level auch erstmal keine Rolle, auf dem es heißt: Wir verbinden Chiplets per Sea of Wire, und alle Chiplets hängen irgendwie am Ringbus innerhalb des IOD.ETI1120 schrieb:Dazwischen müsste aber IMO noch ein PCIe Controller
Wer nichtETI1120 schrieb:Ich hätte schon gerne ein bisschen mehr Futter
Was ja tatsächlich AMDs Weg ist. Wie du selbst verlinkst, ist das bei Zen 5 mit maximal 16 Kernen noch alles im Rahmen. 24 Kerne Zen 6 aus effizienterer Fertigung sollten sich dann ähnlich Verhalten können, so dass das ganze noch relativ problemlos zu rechtfertigen ist.ETI1120 schrieb:Im Desktop ist mit 16 Kernen noch alles OK, wie die Zahlen von TPU zeigen. Aber es gibt im Desktop zwei Optionen:
- Wenige Kerne: Alle mit hoher Frequenz
Hallo Intel, die Nova Lake mit bis zu 52 Kernen bringen wollen.ETI1120 schrieb:
- Viele Kerne: Hybrid, ein paar Kerne mit hoher Frequenz, der rest mit niedriger Frequenz.
In der Tat... da glaube ich eher noch daran, dass AMD einen 12c-CCD zusätzlich zum 12C und 32c auflegt und den verbaut, als dass wir dieses Konstrukt aus der Gerüchteküche zu Gesicht bekommenETI1120 schrieb:
- Deshalb bin ich nach wie vor sehr skeptisch was die Option anbelangt Medusa 1 (4P+4C) mit einem 12P CCD auf 16P+4C zu erweitern. (Die LP Cores die es abgeblich mit Zen 6 geben soll ignoriert)
Das ergibt fürs Notebook keinen Sinn.
Ist ja schon bei Zen 5 so, die takten durchgängig höher als die Zen 5c SKUs. Nur vermute ich auch, dass der Takt von Zen 6c gegenüber Zen 5c soweit steigt, dass sich die Grenze dazwischen verschiebt, so dass mehr als 96 Kerne mit Zen 6c sinnvoll sind.ETI1120 schrieb:
- Meine Vermutung: AMD setzt Zen 6 Classic nur noch für die Server SKUs ein, bei denen die Frequenzen über der von Zen 6 Dense liegen.
Es gibt da viele merkwürdige Informationen, die so rumgeistern.ETI1120 schrieb:Es gibt zwei Konfigurationen SP7 und SP8. Einige Leute behaupten, dass SP7 nur mit Zen 6 Dense sei.
Wenn das Package nicht von der Seite fotografiert wäre und die Dimensionen des SP7 Packages bekannt wären, dann wäre es eine kleinigkeit.CDLABSRadonP... schrieb:Von was für Dimensionen geht ihr denn überhaupt so bzgl. eines der IO-Tiles aus? Ist ja auch mal eine spannende Frage.
Die Aussparungen kosten Fläche. Sie wurden notwendig weil bei AM5 unten nur noch Pins sind.CDLABSRadonP... schrieb:Dennoch bringen die Aussparungen durch den cleveren AM5-Heatspreader potentiell noch mehr Fläche. Also, nochmals ganz klar:
Nein. GPUs wurden nie mit so verteilten Chiplets gebauts wie CPUs. Es ist eher so, dass das was wir hier jetzt für CPUs sehen ungefähr dem Packaging von RDNA3 (was ja auch Chiplets hatte, zumindest bei den großen Versionen) entspricht.ThePlayer schrieb:Das wird dann auch auf UDNA übertragbar sein? Somit würde man einige der bisherigen Hürden, die wir seit RDNA3 haben. Eliminieren oder zumindest stark abschwächen, oder?
Nein, das sind aber sechs. Der Abstand am jeweiligen Ende sieht nur so aus als wären es mehr, weil der genau so groß ist wie ein stack. Das ist aber blanker Space.scooter010 schrieb:
Bereits Zen1 hatte LDOs auf dem Die:Sun_set_1 schrieb:Das ist mit heutiger Siutation imho einfach nicht vergleichbar. AMD ist aktueller Marktführer im Gaming / Consumer Bereich, speziell was X3D+ >8 Kerne angeht. Dann die für sie "teure" Lösung mit potentem Wandler-Controller zu gehen halte ich für absolut unrealistisch. Lass mich aber natürlich sehr gerne täuschen.
https://fuse.wikichip.org/news/1177/amds-zen-cpu-complex-cache-and-smu/Each of the Zen cores has its own local low drop-out regulator that takes the RVDD as input, forming its own voltage domains.
AMD verwendet PCIe PHY, was nicht bedeutet dass AMD den Infinity Fabric als PCIe Bus betreibt. Bei AMD heißt es IFoP Infinity Fabric over Package. Die neue Verbindung hei0t Infinity Fabric Advanced Packagingstefan92x schrieb:Stimmt, aber die Verbindung zwischen Sockeln schon
Der Punkt ist Schaltungen brauchen Fläche, für die PHY könnten die Chiplet reichen dass auch die Controller reinpassen, ...stefan92x schrieb:Für mich ist bei meiner Vermutung selbst völlig unklar, ob der im IOD sein müsste, oder im PCIeD sitzen könnte - es spielt im Top Level auch erstmal keine Rolle, auf dem es heißt: Wir verbinden Chiplets per Sea of Wire, und alle Chiplets hängen irgendwie am Ringbus innerhalb des IOD.
Das ganze verändert sich aber auch wenn die Frequenzen steigen.stefan92x schrieb:Was ja tatsächlich AMDs Weg ist. Wie du selbst verlinkst, ist das bei Zen 5 mit maximal 16 Kernen noch alles im Rahmen. 24 Kerne Zen 6 aus effizienterer Fertigung sollten sich dann ähnlich Verhalten können, so dass das ganze noch relativ problemlos zu rechtfertigen ist.
AMD wird darauf reagieren müssen.stefan92x schrieb:Hallo Intel, die Nova Lake mit bis zu 52 Kernen bringen wollen.
oder einen 4P+8Cstefan92x schrieb:In der Tat... da glaube ich eher noch daran, dass AMD einen 12c-CCD zusätzlich zum 12C und 32c auflegt und den verbaut, als dass wir dieses Konstrukt aus der Gerüchteküche zu Gesicht bekommen
Wenn die Zen 6 über die 4 GHz springen, ...stefan92x schrieb:Ist ja schon bei Zen 5 so, die takten durchgängig höher als die Zen 5c SKUs. Nur vermute ich auch, dass der Takt von Zen 6c gegenüber Zen 5c soweit steigt, dass sich die Grenze dazwischen verschiebt, so dass mehr als 96 Kerne mit Zen 6c sinnvoll sind.
https://pics.computerbase.de/1/1/8/0/0/5-261891101ff81251/2-312.5076dd1f.jpgstefan92x schrieb:Es gibt da viele merkwürdige Informationen, die so rumgeistern.
stefan92x schrieb:Was ich mir jetzt aus dem gesehenen zusammenreime, ist aber eher, dass SP7 der hier gezeigte Vollausbau ist mit 2 IODs, 8 CCDs und 16 RAM-Channeln, und SP8 dann die Sparvariante mit 1 IOD, 4 CCDs und 8 RAM-Channeln. Ja ich weiß, dass SP8 irgendwo mit 2 IODs aufgetaucht ist, aber Venice sollte auch mal 4 IODs haben und was weiß ich nicht alles...
| Gen | Classic max Cores | Dense max Cores | Verhältnis |
| Zen 4 | 96 | 128 | 3:4 |
| Zen 5 | 128 | 192 | 2:3 |
| Zen 6 | 96 | 256 | 3:8 |
Introducing Next-Generation AMD AI Rack Infrastructure: “Helios”
The future of AI demands more integration, more compute, and seamless capabilities that blend compute engines, software and more. And we are doing that with, “Helios.”
We are aligning our silicon, software, and systems expertise to deliver a fully integrated AI rack platform that is engineered with scale-up and scale out capabilities to deliver leadership performance in both large-scale training and distributed inference. This is more than a next-generation upgrade, “Helios” redefines what is possible at the rack level.
“Helios” is a reference design built to deliver the compute density, memory bandwidth, performance and scale out bandwidth needed for the most demanding AI workloads, in a ready-to-deploy solution that accelerates time to market. From training the next wave of frontier models, to running distributed inference at scale and fine-tuning enterprise models on proprietary business data, “Helios” is designed to do it all - with openness, efficiency and unmatched flexibility.
This solution integrates a powerful combination of the next generation of AMD technology including:
- Next-Gen AMD Instinct MI400 Series GPUs. Expected to offer up to 432 GB of HBM4 memory, 40 petaflops of MXFP4 performance and 300 gigabytes per second of scale-out bandwidth3. These GPUs will bring rack-scale AI performance leadership for training massive models and running distributed inference at scale.
- Open Scale-Up with UALink™. With the “Helios” reference design, performance scales effortlessly across 72 GPUs—thanks to UALink. The UALink standard is an open standard that will enable customer choice and interoperability in scale up fabrics. In “Helios,” we use UAL in several ways, to interconnect the GPUs and scale-out NICs, and, tunneled over ethernet, to interconnect the GPUs. This connects every GPU in the rack, enabling them to communicate as one unified system—delivering breakthrough performance at rack scale.
- 6th Gen AMD EPYC "Venice" CPU. Powered by the groundbreaking "Zen 6" architecture, the CPUs are expected to offer up to 256 cores up to 1.7X the performance4 and 1.6 TBs of memory bandwidth5 to help sustain maximum performance across the entire “Helios” rack.
- AMD Pensando "Vulcano" AI NICs. The next-generation NIC for AI scale out is UEC 1.0 compliant and supports both PCIe® and UALink interfaces for direct connectivity to CPUs and GPUs. It will also support 800G network throughput and an expected 8x the scale-out bandwidth per GPU3 compared to the previous generation. “Vulcano” is crucial for enabling rapid and seamless data transfer within high-density clusters, effectively eliminating communication bottlenecks for large-scale AI deployments.
Wieso sollte man so kleine CPUs in ein so großes Package packen?stefan92x schrieb:Die Classic-Cores nur auf dem kleinen Sockel zu verbauen macht für mich aber überhaupt keinen Sinn, daran glaube ich definitiv nicht.
Serandi.87 schrieb:Extrem gespannt darauf, welche CPU denn die ultimative neue Gaming-CPU sein wird. Ein 10800X und später gefolgt vom 10800X3D?
Wenn ein Teil des frei gewordenen Platzes L3 als L2 genutzt wird wäre eine leicht höhere Latenz bei L3 auszugleichen.CDLABSRadonP... schrieb:Der Moment, in dem sie es schaffen würden, den L3 ohne signifikanten Latenzverlust komplett als V-Cache zu realisieren, wäre definitiv ein großer. Ich glaube da in nächster Zeit noch nicht dran. Eher kommt es, wie gesagt, erst mal zu einem Aufbau eines L4-Caches als H-Cache. Vielleicht hat der wiederum zusätzliche V-Cache-Ebenen, aber eben als H-Cache neben den CCDs.
Was die gemessenen Latenzwerte Werte anbelangt, sind diese bei Strix Halo nicht besser als beim 9950X.ThePlayer schrieb:Aber wenn ich das richtig verstehe wird mit diesem Design die Latenz verbessert und der Stromverbrauch deutlich gesenkt.
Es wird kein UDNA geben. Es geht mit CDNA und RDNA weiter wie bisher.ThePlayer schrieb:Das wird dann auch auf UDNA übertragbar sein?
Also wenn IOD die Abkürzung von Input-Output-Die ist, dann ist doch IOD-Dies doppelt-gemoppelt, oder?Volker schrieb:Zwei große IO-Dies in der Mitte des Prozessors werden im Beispiel nun von insgesamt acht CCDs flankiert. Die IOD-Dies wiederum