Overkee schrieb:
Die Schrift im Original ist schon für mich als Menschen teilweise nur schwer zu entziffern bis hin zu schlicht unleserlich. Das das KI Ergebnis hier Fehler macht, würde ich jetzt nicht negativ auslegen
Anhang anzeigen 1651555
Schrift ist halt rein logisch und konzeptionell sehr tricky, die Information genau in jenen kleinen Details steckt die ein Generativer Algorithmus bei jedem anderen Objekt einfach frei hinzudichten kann, ohne dass es falsch aussieht.
Bei wörtern steckt die gesamte Information eben in den Details. Bei sämtlichen anderen Objekten aber nicht. Da reicht es einen Stein wie einen Stein aussehen zu lassen und es ist dabei völlig irrelevant für uns WIE die Details angeordnet werden, solange es plausibel aussieht. Bei schrift kann das aber nicht funktionieren.
Das ist eigentlich kein Problem oder Schwäche von KI sondern einfach der Natur von Schriftzeichen geschuldet.
Wenn der Algorithmus eine Linie erkennt, die unscharf ist, kann sich der Algorithmus eine Linie ausdenken, die scharf ist. Die Information = "Linie". Wenn er eine unscharfe Stein Textur erkennt, dann kann er eine scharfe Stein Textur generieren. Die notwendige Information dafür steckt bereits im Vorhandensein dieses Steins (Umrisse, Farbe etc).
Der Algorithmus kann auch Schrift wie Schrift aussehen lassen. Geordnete Formen auf einfarbigem Hintergrund sind meistens schrift, aber die wichtige Information ist für uns in dem Fall nicht das Vorhandensein von Schrift, sondern deren bedeutung. Und die steckt in den Details die die Kamera nicht auffangen konnte und welche die KI daher niemals rekonstruieren kann, da generierte Details die Bedeutung verändern würden.
Ich finde das ist ein ziemlich interessantes Problem, das aufzeigt, wo uns die Algorithmen weiterhelfen können und wo es rein logisch völlig unmöglich ist.
Wir sollten uns vielleicht andere Schriftzeichen einfallen lassen, die auch unter schlechten Sichtbedingungen und Unschärfe besser die ursprüngliche Information übermitteln können. Incl. eingebauter Fehlerkorrektur und redundanzen. Das wär doch mal was

. Am besten farbig codierte einsen und nullen. Oder Striche und kreise

Die sind auch aus großer entfernung noch gut erkennbar.