stefan92x schrieb:
Klar will man sowas nicht unbedingt auf den P-Cores haben, aber warum LPE statt E-Cores dafür nutzen?
Die Aktuellen Skymont E-Cores sind schon recht potent. Je nach Anwendung schwanken die bei Durchsatz (IPC) an Instruktionen je Takt zwischen Zen2 bis Zen4. Die Dinger sind für viele I/O-Aufgaben gnadenlos unterfordert. Es ist also prinzipiell kaum ein Nachteil die Aufgaben auf noch langsamere Kerne zu verteilen.
Dafür gibt es Nachteile E-Cores mit solchen Aufgaben zu belasten. Die Kerne wären belegt und sollte es etwas zu berechnen geben, müsste ein teurer Kontextwechsel erfolgen. Zusätzlich wollen euch I/O-Prozesse mit viel Warterei immer mal wieder arbeiten, knappern also am thermischem Budget und sind Konkurrenz auf L2- u. L3-Cache.
Nighteye schrieb:
Wieder Zurück zu Klassischen Intel CPU,s ohne überforderten Ringbus der 3 Verschiedene Kerne Managen muss, und zurück zu Hyperthreading für alle Kerne etc.
Wenn die kommenden Architekturen das nicht bereits mindestens als Option vorsehen, dann kann diese Vorstellung vergessen werden. Zudem Zeitpunkt, wo der Herr CEO wurde, hätte die Eingabe von SMT ins Lastenheft für zukünftige Architekturen kaum eine Chance gehabt. Bei Darkmont und den dreigeteilten Decodern stelle ich mir SMT auch schwer vor und die Kürzungen die Intel zuletzt bei der Softwareentwicklung betrieben hat passt nicht zum Aufwand der getrieben werden muss um SMT über P&E-Cores gescheit zu verwalten.
Cr4y schrieb:
Ein Gedanke: Könnte es sein, dass das Chiplayout nicht anders gestaltet werden konnte, und man quasi ein bisschen Fläche zu füllen hatte und sich dachte "warum nicht? Warum sollten wir nicht ein paar E-Cores da hin setzen? Vielleicht finden wir sogar noch einen nutzbaren Nutzen dafür!".
Kann sowas beim Chipdesign passieren?
Es kann durchaus vorkommen, dass bei der Synthese Flächen mit wenig bis keiner Belegung herauskommen. Die Flächen sind aber normalerweise damit begründet, dass die Flexibilität der IP-Blöcke und vom Routing der Signalleitungen/Energie ausgeschöpft sind. Das da rein zufällig mal noch ein CPU-Cluster samt Cache, Anbindung an den BUS möglich sein soll ist unrealistisch.
Ganz abgesehen davon, dass die Verwaltunglogik von modernen Prozessoren auch komplex ist. Da an einem Punkt wo man die Synthese die ersten male probiert, einfach mal einen neuen CPU-Cluster mit eigener Energieverwaltung, Taktdomäne, Cache, Speicheranbindung einzuführen ist eigentlich ausgeschlossen. Das ist für viele Teams dann eine Änderung im Lastenheft zu einem Zeitpunkt, wo man sich auf finale Validierung und Probefertigung vorbereitet..