Fireplace April 2026

News Mythos 5 nur für ausgewählte Partner: Anthropics Fable 5 ist zu mächtig ohne Ketten

Achja, das klassische "Wir haben nun die krasseste KI, die ist so krass, die können wir garnicht öffentlich verfügbar machen. Viel zu gefährlich!"-Playbook welches mindestens seit GTP-2 (2019) bei quasi jedem Release irgendwelcher neuen Modelle auf's neue abgespielt wird.

Und damit bekommt man dann eben immer und immer wieder die mediale Aufmerksamkeit wie auch hier.
 
  • Gefällt mir
Reaktionen: Flutefox und Alphanerd
chr1zZo schrieb:
AI schafft freie Zeit bei gleicher Personalstärke. Weniger Überstunden, weniger sinnlose Stunde werden gespart (Geldverbrennung, sehe ich in so vielen Unternehmen aufgrund von schlechter Planung und Organisation), Fokus auf Bereiche die bisher liegen geblieben sind. Bis hin zum Abschaffen gewisser Arbeitsplätze, weil da eh nur Rumpimmler sitzen,…
Dem kann ich nicht zustimmen. Wir werten Dora Metriken und Umfagen bezüglich AI aus und das deckt sich nicht mit dem was du schilderst. Es gibt Aufgaben da ist AI super. Gerade wenn es eine Vorlage hat und stupide das gleiche machen muss was wir schon haben nur in grün. Da bin ich dabei. Da spare ich mir die Tipparbeit. Aber bei anderen Problemen löst es das zwar auch kein Thema und wenn ich das mir nicht anschauen würde, dann würde das vielleicht auch irgendwie gehen. Aber auf prod zerfällt dir auf einmal die Datenbank und dein Service, weil das Teil halt manchmal doch zu blöd ist und dir auf einmal die ganze DB in den Memory lädt. Dann weißt du das Modell darauf hin und es schnallt es dennoch nicht. Es denkt halt nicht. Es ist halt zum Teil mit ***** trainiert und diesen Müll gibt es dann wieder.
Wir testen auch AI native. Hast du dann auf grüner Wiese zum Teil Klassen mit 4000 Zeilen code. Keiner kann mehr was erkennen. Toter Code fliegt rum. Ich mein man kann es so lassen muss die AI halt mit klar kommen.

Sinnlose Planung? Wenn du AI planlos laufen lässt kommt auch nur ne schlechte Suppe bei rum. Denn das Teil wird auf jeden Fall irgendwas machen. Heißt nicht das es sich mit dem deckt was du vielleicht irgendwo im Kopf hast, aber für die AI nicht auf Papier gebracht hast. Und du musst planen. In kleinen Stücken. Sonst explodiert dir der Kontext und dann fängt Alzheimer an.

Wir haben einen Agenten der den Plan schreibt und dann einen für die Implementierung. Das funktioniert gut wenn alles mit dem Plan stimmt und nach „Plan“ verläuft.

Und die kleinen und gar die offline Modelle kannst du in der Pfeife rauchen. MCP nutzung meiner Erfahrung nach absolute Katastrophe. Tool: „id in uuid format“
AI: id: „<your id goes here>“
AI: There was a Problem while using tool xyz.

Ai trainieren? Für was Programmiersprache oder wie ne Postgresql funktioniert? Das werden wir bestimmt besser hinbekommen als Anthropic etc. Für Domainenspezifisches Wissen vielleicht. Aber das ist nicht mal das Problem und das nötige Wissen liefern wir mit für die kleinen Aufgaben. Sehe ich absolut nicht.

Nachtrag: ganz vergessen. Nochmal zu Zeit etc. wir haben immer was zu tun. AI stresst auf jeden Fall mehr. Ich sitze nicht rum wenn es 15-30min „denkt“. Ich sitze an 3-4 Themen gleichzeitig. Ist das gut? Ka. Ich glaube eigentlich nicht. Aber so kommt vielleicht deine Zeitersparnis zusammen. Arbeitskollege sagt nur zu mir: „Wenn du so weiter machst hast du bald Burnout“. Und man merkt die Mehrbelastung dadurch.
 
Zuletzt bearbeitet:
Ich frag mich ehrlich gesagt wie gefährlich es werden könnte, ai steigern sich alle paar Jahre enorm, wir Menschen stehen dagegen eher , als einzelnen Individuum, wir automatisieren alles was wir nur können, was sich irgendwie fahrlässig ist. Wir bauen Roboter, die uns überlegen sind und statten sie irgendwann mit einer höheren Intelligenz aus, gleichzeitig bringen wir Ihnen bei Menschen Algorihmisch zu töten.

Wenn das mal nicht in die Hose geht, ich mein wir sehen es doch bri uns , wir würden uns kein Tier beugen.

Ich glaub an den Konsequenzen wird nicht gedacht sondern nur an Cash.

https://de.wikipedia.org/wiki/Existenzielles_Risiko_durch_künstliche_Intelligenz
 
chr1zZo schrieb:
Fable 5 ballert richtig geil bei sehr komplexen Aufgaben. I like it.
Ich kann mich nur anschließen. Ich habe es vorhin kurz ausprobiert (hab aktuell das 20$ Abo bei Claude).
Letzte Woche habe ich mittels Claude ein kleines Python Script erstellt, das tut im Endefffekt ganz gut. Jetzt habe ich es testhalber einfach mal in Fable reingeschmissen mit der Bitte um Verbesserungsvorschläge.
Und siehe da, es wurden doch noch einige Bugs ausgemerzt. Nachteil: mit nur dieser einen Anfrage (+ Output) ist das Tageslimit erreicht worden.
 
  • Gefällt mir
Reaktionen: konkretor, Flutefox und Solavidos
Das Model ist wirklich sehr gut!
Ich verstehe auch nicht warum auf Reddit jeder zweite behauptet das Tageslimit oder 5h Limit nach einem Prompt zu erreichen. Sorry aber was läuft bei denen schief.
Klar komme mit Fable auch ins Limit aber ich Code damit Stunden in mehrere Repos / Sessions Parallel! (Ich verteile viel an Opus + Sonnet Subagenten) Fable überwacht, plant und orchestriert!
 
@DeusExMachina Du musst nicht immer alles wörtlich nehmen. Wie ich etwas Einschränke oder Erziehe spielt keine Rolle, ob durch Filter oder Skills. Das ist wie ein Mensch, der etwas gelernt hat und strikt darauf beruht und diesen Ansatz immer wieder verfolgt.. du kannst ihm aber klare Leitplanken setzen, punkt.

Hier mal ein Ansatz aus einem älteren Eval Build der jetzt schon weitaus fortgeschrittener ist.

@Meckie Der Nutzer der eine AI nutzt und anweist ist entweder die Schwachstelle oder König. Ja natürlich, eine AI arbeitet nur so gut, so wie ich sie Nutze/Anweise, punkt. Manchmal hab ich das Gefühl das hier draußen die meisten das völlig falsch nutzen :D

@gaelic Das kann auch Opus und Sonnet. Du musst es Ihnen nur sagen! Fable ist da eben "Eigenständiger".
 

Anhänge

Zuletzt bearbeitet:
Ja jedes Modell ist immer dann 1000x besser als der Vorgänger letztlich hat sich aber bei ChatGPT für mich seit 2 Jahren 0 geändert und wenn dann nicht zwingend zum positiven.

Ja bei manchen Spezialanwendungen für Firmen mag da viel passieren aber für den Normalo der nicht bezahlt tut sich wenig und die bekommen ja die Bezahlmodelle nur mit Chatbegrenzung und mit einem zeitlichen Verzug aber schon klar die nächste Version wird Plötzlich der super intelligente Vorstoss der gigantisch ist wie immer in der Werbung.
 
chr1zZo schrieb:
ob durch Filter oder Skills. Das ist wie ein Mensch, der etwas gelernt hat und strikt darauf beruht und diesen Ansatz immer wieder verfolgt.. du kannst ihm aber klare Leitplanken setzen, punkt.

Ein Harness ja, aber war das nicht letzte Woche sind wir nicht schon beim Loop Prompting?
 
chr1zZo schrieb:
Es ist doch immer das gleiche, entweder du bist dabei, oder nicht!
Dabei bei was?

Und WAS ist "immer" das Gleiche?

Arbeitest du beim Marketing, als Motivationscoach oder in der Astrologie?
 
@gaelic Genau da kommen wir zum Punkt. Hier mal ein Simpler Text "Analysiere als Developer Experte, als UI/UX Experte, führe ein Sicherheitsaudit durch nach neusten Standards Juni 2026, prüfe ob wir die neusten Libs nutzen (dann kannst du noch konkretisieren wie PHP, Python, Torch, NGINX, Next.js oder was auch immer du nutzt). Dann spuckt er dir eine Menge aus und schlägt dir viel vor.

@DeusExMachina ja Headless nenne ich es :) Dafür nutze ich aber auch Agenten, dafür habe ich mein eigenes Agent OS, das macht im Sinne nichts anderes. Aber viele würden schon mit Harness besser fahren als jetzt.

@Tevur Dabei, damit Geld zu verdienen oder eben nicht. Es ist immer das gleiche, bei jedem neuen Trend oder Hype. Ich bin eigentlich nur IT Security Dully, tatsächlich brauch ich aber Marketingskills, Motivationscoaching hab tatsächlich mal genossen und auch mal ausgeübt und Astrologie ist genau mein Ding, das funzt ziemlich gut um die ein oder andere um den Finger zu wickeln :D
 
gaelic schrieb:
Was muss ich ihnen sagen?
Du kannst von Claude Code alles was er bis jetzt gemacht hat "reviewen" lassen. Ich mache das sehr regelmässig bei meinen Projekten - immer bevor gepushed (oder auch gemerged wird) läuft Minimum ein Reviewer drüber. Oft auch mehrere, die das ganze aus verschiedenen Winkeln analysieren (die kannst du entweder selbst vorgeben was oder er wählt dann selbst). Je nach Thema ist das z.B. Regression, Codequalität, Sicherheit, etc. Oder du kannst auch einen Spezialisten spawnen lassen, wenn dir bei einer Implementation / Architektur der zündende Funke fehlt. Der challenged dann auch alles nochmals und bringt frischen Wind rein.



Zu Fable selbst:
Muss sagen nach ein paar Stunden damit: Eher ernüchternd. Auf Code macht der ebenso Fehler wie Opus und man rennt sehr regelmässig in die Anthropic Sicherheitsschranken rein - die Tokens bis dahin sind dann halt verbrannt, und Fable verbrennt einiges an Tokens. Für Code habe ich wieder auf Opus zurück gewechselt, ich sehe den Vorteil nicht.

Im Claude Design und auch bei generelleren Anfragen im Web sehe ich ein paar Fortschritte, allerdings nichts weltbewegendes. Ist alles immer noch nicht optimal (und auch recht langsam).

Fazit von mir: Vor allem Schall und Rauch für den Börsengang von Anthropic.
 
  • Gefällt mir
Reaktionen: konkretor, Drahminedum und Brrr
chr1zZo schrieb:
Dabei, damit Geld zu verdienen oder eben nicht.
Du verdienst Geld damit. Das ist ok.

Daraus abzuleiten bei irgendwas "dabei" zu sein, sich von anderen abzugrenzen, sogar mit der Andeutung, dass man sich über andere erhebt...
du willst das Thema Gesellschaft vermeiden? Ich weiß sehr genau, warum!
 
GML schrieb:
Du kannst von Claude Code alles was er bis jetzt gemacht hat "reviewen" lassen.
Klar, nur hab ich hier eben mit Fable nochmal deutliche Verbesserungen erzielt. Während Opus etwas im Kreis getanzt ist.
 
Meckie schrieb:
Nachtrag: ganz vergessen. Nochmal zu Zeit etc. wir haben immer was zu tun. AI stresst auf jeden Fall mehr. Ich sitze nicht rum wenn es 15-30min „denkt“. Ich sitze an 3-4 Themen gleichzeitig. Ist das gut? Ka. Ich glaube eigentlich nicht. Aber so kommt vielleicht deine Zeitersparnis zusammen. Arbeitskollege sagt nur zu mir: „Wenn du so weiter machst hast du bald Burnout“. Und man merkt die Mehrbelastung dadurch.
Ich hatte schon 10 Tabs offen in der Sptize. Das Ergebnis war dann aber deutlich mehr Fehler. Ich versuche es auf 2 zu begrenzen. Oft code ich halt selber noch während Claude im Hintergrund noch am "denken" ist. Jetzt ist es zwar ChatGPT. GPT 5.5 ist nach meinem emfpinden mittlerweile besser als Opus 4.6 - 4.8 und hat den benefit dass man nicht die Claude CLI verwenden muss. Ich mag z.B. OpenCode lieber.
Edit: Generell gehe ich aktuell wieder etwas mehr auf manuelles Coding zurück. Aber selbst bei 100% manuell wäre es mindestens als Reviewer ganz nützlich.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Meckie
@gaelic solltest du via Claude Console auf einem Server arbeiten empfehle ich dir OpenWolf von GitHub. Neben einem 2nd Brain und sogar einer grafischen Oberfläche, trägt man da schön den Projektverlauf ein inkl. Bugs und DoNotRepeat Actions :)

@Tevur Ich möchte mich über niemanden stellen. Es gibt nur genug Hater und Trolls in der AI Branche, was ich durchaus verstehen kann.
 
  • Gefällt mir
Reaktionen: gaelic
Naja selbst wenn Fable auch nur 5% besser ist - alle 2 Monate kommt ein neues Model, dass summiert sich auf!
Jedenfalls war ich eh gerade mitten in einem größerem Brocken an Implementierungen, Fable deckte gleich noch paar Sachen auch welche Opus übersehen hatte.
 
@gaelic Ich war mit Fable vorher auch grad im Kreis am drehen - aber natürlich ist das bei uns beiden auch nur eine sehr kleine sample Size und das grosse Bild wird sich dann erst noch zeigen :)
Jede Entwicklung nach vorne ist da super in dem Gebiet. Bis jetzt hat mich Fable aber noch nicht so überzeugen können damit es die Tokens rechtfertigt.
 
Mal eben etwas OT:

Ich kann jedem das Hörspiel Takimo
https://www.polaris-hörspiele.de/TAKIMO
http://takimo.de/ (derzeit in Überarbeitung)

empfehlen.

Die Geschichte der Menscheit in der Zukunft, AI/KI etc wird dort dann am Ende höchst interessant.
Nehmt euch die 40 Stunden die bisher 36 Folgen dauern. Leider sehr Kostenintensiv, aber bei einigen Anbietern (z.B. Audible) hörbar.

Es wird euch in einigen Dingen sicher dazu bringen, ein wenig nachdenklicher zu werden!

@chr1zZo Du scheinst mir da ausgenommen zu sein! Das seh ich in den Sternen, dass es bei Dir nicht fruchten wird!

Und zu Claude... Bin da nicht aktiv am Code produzieren usw. Nutze es aber für Analysen, erarbeite gewisse methodische wiederholende Abläufte und Aufgaben sinnvoller umgesetzt zu bekommen.
Ausschließlich um meine persönliche Arbeit zu unterstützen!
 
Zurück
Oben