syfsyn
Admiral
- Registriert
- Nov. 2010
- Beiträge
- 8.891
Ai im genauen will nur tensor also fp16 performance aktuell arbeitet nvidia mit cuda an einen fp8 modell
Das ist viertel genau LLLm sind um genau zu nehmen Statistiken diese sind am effektivsten bei einfacher Genauigkeit aber auch am langsamsten da die Modelle an der Bandbreite und vram am verhungern sind.
Dies lässt sich lösen indem man die bisherigen gpu also den normalen alu dies berechnen lassen oder spezifizierte hardware dies übernimmt asics werden sich durchsetzen da billiger und weniger Energie benötigt wird. Aber und das ist das problem sie sind ungenau ein mix aus doppelter Genauigkeit und asics wird die Lösung sein.
Dafür braucht man aber den neuesten node und neue Halbleiter in analoger Technik
Das wird aktuell entwickelt
bismut Halbleiter sind vermutlich Mitte 2030 bereit für Massenfertigung
analoge pc später ende der 2030er
neue nodes bis dahin wäre zum Übergang gaa und bspd das den verbrauch zumindest senkt aber die chips sind groß und teuer. +- 360mm² nach gaa halbiert sich die Belichtungsfläche der wafer
Dies kann man nicht mehr in consumer gpu designen und müssten dediziert für ai Beschleuniger entwickelt werden. bsp 16 tensor kerne per sm (derzeit 4) mit 256 alu (derzeit 128) an min doppelter L1 L2 cache was dann 512kb (derzeit 128kb) und L2 auf 8gpc (derzeit 12) 512mb (derzeit 128mb) sind. Das geht ist aber dann das absolute maximum. Gaming wäre so ein chip nicht schneller als ne rtx4090.
Darum kommt ein hybrid der kann nur als apu kommen für lokale ai. Mit mehr alu und gleichen tensor kerne wie bisher bis maxed 200w tdp .mit intels razer lake auf 18a foveros apu perf auf etwa dem level der rtx5090 mit Fokus auf vgpu.
Die Stagnation ist sicher und nein das hat keine api limitierung oder fertigungsgründe sondern schlicht ai hat Vorrang.
Den normalerweise wäre man längst in taktrennen bei dgpu gewesen bei 5,0ghz dgpu und min doppelter alu also dann mit derzeitiger design bei 384 sm mit 4,0ghz und 500w tbp aber gaming ist nicht der Fokus sondern ai.
Der a16 node verspricht bis zu 5,1ghz bei gleicher tbp
bei cpu kommt glücklicherweise der halbe Weg bis 8,0ghz hin (zen7 auf am6) normal wäre man bei 9,5ghz
zumindest wird dass cpu limit ab zen6 (q1 2027) Geschichte sein (6,7ghz)
Das ist viertel genau LLLm sind um genau zu nehmen Statistiken diese sind am effektivsten bei einfacher Genauigkeit aber auch am langsamsten da die Modelle an der Bandbreite und vram am verhungern sind.
Dies lässt sich lösen indem man die bisherigen gpu also den normalen alu dies berechnen lassen oder spezifizierte hardware dies übernimmt asics werden sich durchsetzen da billiger und weniger Energie benötigt wird. Aber und das ist das problem sie sind ungenau ein mix aus doppelter Genauigkeit und asics wird die Lösung sein.
Dafür braucht man aber den neuesten node und neue Halbleiter in analoger Technik
Das wird aktuell entwickelt
bismut Halbleiter sind vermutlich Mitte 2030 bereit für Massenfertigung
analoge pc später ende der 2030er
neue nodes bis dahin wäre zum Übergang gaa und bspd das den verbrauch zumindest senkt aber die chips sind groß und teuer. +- 360mm² nach gaa halbiert sich die Belichtungsfläche der wafer
Dies kann man nicht mehr in consumer gpu designen und müssten dediziert für ai Beschleuniger entwickelt werden. bsp 16 tensor kerne per sm (derzeit 4) mit 256 alu (derzeit 128) an min doppelter L1 L2 cache was dann 512kb (derzeit 128kb) und L2 auf 8gpc (derzeit 12) 512mb (derzeit 128mb) sind. Das geht ist aber dann das absolute maximum. Gaming wäre so ein chip nicht schneller als ne rtx4090.
Darum kommt ein hybrid der kann nur als apu kommen für lokale ai. Mit mehr alu und gleichen tensor kerne wie bisher bis maxed 200w tdp .mit intels razer lake auf 18a foveros apu perf auf etwa dem level der rtx5090 mit Fokus auf vgpu.
Die Stagnation ist sicher und nein das hat keine api limitierung oder fertigungsgründe sondern schlicht ai hat Vorrang.
Den normalerweise wäre man längst in taktrennen bei dgpu gewesen bei 5,0ghz dgpu und min doppelter alu also dann mit derzeitiger design bei 384 sm mit 4,0ghz und 500w tbp aber gaming ist nicht der Fokus sondern ai.
Der a16 node verspricht bis zu 5,1ghz bei gleicher tbp
bei cpu kommt glücklicherweise der halbe Weg bis 8,0ghz hin (zen7 auf am6) normal wäre man bei 9,5ghz
zumindest wird dass cpu limit ab zen6 (q1 2027) Geschichte sein (6,7ghz)