Schlappe für Zuckerberg: Metas KI-Spitzenmodell Llama 4 Behemoth verzögert sich
Zuckerberg ist auf AI-Kurs, er will den Meta-Konzern als einen der führenden Anbieter etablieren und investiert dafür zweistellige Milliarden-Summen pro Jahr. Bei der Entwicklung strauchelt man derzeit aber, die Leistung der Llama-Modelle liegt hinter den Erwartungen und das neue Spitzenmodell verzögert sich.
Bei dem Modell handelt es sich um Llama 4 Behemoth, das bereits Anfang April angekündigt wurde. Final vorgestellt werden sollte es eigentlich Ende April bei Metas KI-Konferenz, die Leistung reicht aber nicht aus. Die Fortschritte im Vergleich zu den Vorgängern sowie der Konkurrenz sind zu klein.
Daher verzögert sich der Start weiter, berichtet das Wall Street Journal. Ursprünglich visierte Meta den Juni an, jetzt steht der Herbst als Termin im Raum. Womöglich dauert es sogar noch länger. Denkbar wäre in diesem Kontext auch, dass Meta eine abgespeckte Version des Modells vorzieht. Offiziell will sich der Konzern nicht zum Zeitplan äußern.
Erwartungsdruck angesichts der Milliarden-Investitionen
Das Kernproblem ist aber laut dem Bericht des Wall Street Journal: Wenn das Modell erscheint, müsse es auch die öffentlichen Erwartungen rechtfertigen, die insbesondere mit den Investitionen verbunden sind. Bis zu 72 Milliarden US-Dollar hat der Konzern für dieses Jahr verplant, vieles davon entfällt auf den KI-Bereich.
Sollten die Modelle also nicht mit konkurrierenden Anbietern wie OpenAI oder Anthropic mithalten, dürfte es Zweifel an Zuckerbergs KI-Kurs wecken. Angesichts der enormen KI-Investitionen bestehen diese ohnehin branchenweit. Die Frage ist stets, ob und wie schnell sich diese Ausgaben monetarisieren lassen.
Dass Meta bei der KI-Entwicklung strauchelt, löst auch intern Bedenken aus. Speziell das Entwicklerteam steht in der Kritik, berichtet das Wall Street Journal mit Verweis auf Personen, die mit den Vorgängen vertraut sind. Eines der Probleme ist demnach die Fluktuation im Team: Ein Großteil der Entwickler, die 2023 an der Entstehung des ersten Llama-Modells beteiligt waren, soll mittlerweile nicht mehr bei Meta tätig sein.
Holpriger Start der Llama-4-Reihe
Schon der Auftakt der Llama-4-Reihe verlief holprig. Meta bewarb die ersten Modelle unter anderem mit einer Top-Position in der Chatbot Arena des LLM-Leaderboard. Es ist ein populärer Benchmark, bei der menschliche Nutzer die Antworten von Modellen bewerten. Der Haken war nur: Meta reichte dort nicht die für die Allgemeinheit freigegebenen Modelle ein, sondern eine Version, die explizit für den Chat-Dienst optimiert waren.
Zuckerberg musste das Vorgehen einräumen. Die Betreiber erklärten, Meta hätte mitteilen müssen, dass angepasste Modelle eingereicht worden sind.
Darüber hinaus waren die Modelle Llama 4 Maverick und Scout laut Metas internen Benchmarks zwar effizient, die Performance sorgte im Branchen-Vergleich aber nicht für Aufsehen. Auffällig ist zudem: Meta hat noch kein Reasoning-Modell im Angebot. Solche Modelle verlagern Teile der Berechnungen auf die Inferenzphase. Wenn Nutzer eine Anfrage eingegebenen haben, startet das Modell also eine Art „Denkprozess“, bei dem Aufgaben in mehrere Schritte unterteilt und verschiedene Lösungswege geprüft werden. Das bringt vor allem Fortschritte bei Logikaufgaben aus Bereichen wie Mathematik oder dem Programmieren.
Nur geringe Fortschritte über alle KI-Labore hinweg
Meta kämpft aber nicht allein damit, neue Modelle auf den Markt zu bringen, die sich merklich absetzen. „Derzeit sind die Fortschritte über alle Labore und Modelle hinweg recht gering“, sagt Ravid Shwartz-Ziv, Assistenzprofessor am Center for Data Science der New York University.
Das gilt vor allem für neue Spitzenmodelle. Bei OpenAI wartet man auf GPT-5, das sämtliche Fähigkeiten in einem Modell vereinen soll. Diese Integration ist aber schwerer als gedacht, der Start hat sich daher mehrmals verschoben. Anthropic arbeitet seit geraumer Zeit an Claude 3.5 Opus, einer größeren Version der bisherigen KI-Modelle. Das soll aber bald erscheinen, erklärte eine Anthropic-Sprecherin dem Wall Street Journal.