Hype-Modell im Alltagstest: Welche Fortschritte Googles Nano Banana Pro bei Infografiken macht

Andreas Frischholz
47 Kommentare
Hype-Modell im Alltagstest: Welche Fortschritte Googles Nano Banana Pro bei Infografiken macht

Im Rahmen des Starts der Gemini-3-Reihe aktualisiert Google auch die Bild-KI Nano Banana. Das Modell Nano Banana Pro (Gemini 3 Pro Image) wurde beim Reasoning und dem Faktenwissen optimiert. Damit soll es nun in der Lage sein, etwa bessere Infografiken zu erstellen.

Info-Grafiken sind bislang noch eine Baustelle bei den generativen KI-Systemen. Viral gehen immer wieder Beispiele, die beeindruckend aussehen. Im Alltag sind die Ergebnisse tendenziell eher durchwachsen bis banal oder erhalten gravierende Fehler.

Was Google in dem Blog-Beitrag präsentiert, ist beeindruckend. Das gilt sowohl für das Hintergrundwissen zu einer Zimmerpflanze als auch zu einem Rezept. Wie viel lässt sich davon nun in den Alltag übertragen?

Alltagstest: Hält Nano Banana Pro, was Google verspricht?

Bei Rezepten lässt sich die Vorlage wiederholen. Fragt man etwa nach einem klassischen Cookie-Rezept, generiert Gemini ein grundsätzlich brauchbares Resultat, das optisch ansprechend die Zubereitung erklärt. Etwas unklar bleibt das Zusammenmixen mit dem Mehl. Als relevante Information fehlt zudem, dass man die Cookies bei Ober-/Unterhitze backen soll. Ein Ersatz für ein Rezept ist diese Infografik definitiv nicht, erfüllt als visueller Ratgeber aber ihren Zweck.

Gemini mit Nano Banana Pro generiert Cookies-Rezept
Gemini mit Nano Banana Pro generiert Cookies-Rezept
Gemini mit Nano Banana Pro generiert Cookies-Rezept – auf Deutsch
Gemini mit Nano Banana Pro generiert Cookies-Rezept – auf Deutsch
ChatGPT mit GPT-5.1 generiert Cookie-Rezept
ChatGPT mit GPT-5.1 generiert Cookie-Rezept

Mit englischem Prompt fällt das Ergebnis besser aus als mit deutschem. Auf Deutsch fehlte im ersten Anlauf etwa die Zutatenliste, die wurde erst auf Nachfrage generiert. Dennoch generiert Nano Banana Pro ein Resultat, das besser ausfällt als das, was ChatGPT generiert.

Anmerkung: Das waren die ersten Ergebnisse, die die Modelle generiert haben. Mit Geduld und weiteren Eingaben lassen sich die Ergebnisse noch verbessern.

Bei der Snapdragon-3-Architektur scheitern die Modelle

Bei komplexeren Beispielen werden die Grenzen sichtbar. Die Aufgabe ist, die neue Snapdragon-Architektur X2 Elite visuell zu präsentieren. Grundlage für die Aufgabe ist die Tabelle aus dem entsprechenden Bericht. Der Prompt lautet: „Erstelle eine Infografik über die neue Snapdragon-Architektur basierend auf dieser Tabelle.

Technische Daten des Snapdragon X2 Elite (Extreme)
Snapdragon X2 Elite Extreme Snapdragon X2 Elite
SKU X2E‑96‑100 X2E‑88‑100 X2E‑80‑100
Fertigung TSMC 3 nm
CPU Typ Oryon Gen 3
Kerne 18 12
Cluster 6 Prime + 6 Prime + 6 Perf 6 Prime + 6 Perf
Prime Boost
(Single‑Core)
5,0 GHz 4,7 GHz
Boost
(Dual‑Core)
4,7 GHz 4,4 GHz
Multi‑Core 4,4 GHz 4,0 GHz
Perf Boost
(Single‑Core)
Boost
(Dual‑Core)
Multi‑Core 3,6 GHz 3,4 GHz
Total Cache 53 MB 34 MB
GPU Typ Adreno X2-90 Adreno X2-85
Takt 1,85 GHz 1,70 GHz
Leistung ? TFLOPS
Displays Intern 1 × 4K144, HDR10
Extern 3 × 4K144, HDR10 oder 2 × 5K60
Video Encode 2 × 8K30/4K30 in H.264, HEVC (H.265), 1 × 8K15/4K60 in AV1 1 × 8K30/4K30 in H.264, HEVC (H.265), 1 × 8K15/4K60 in AV1
Decode 2 × 8K60 in H.264, HEVC (H.265), AV1 1 × 8K60 in H.264, HEVC (H.265), AV1
NPU 80 TOPS (INT8)
RAM 12-Lane, Triple-Channel (192-Bit)
LPDDR5X-9523 @ 228 GB/s
8-Lane, Dual-Channel (128-Bit)
LPDDR5X-9523 @ 152 GB/s
Storage SSD NVMe, PCIe 5.0
UFS UFS 4.0
SD SD Express, SD 3.0
USB 3 × USB 4.0
ISP Spectra Dual ISP, 2 × 36 MP oder 1 × 64 MP, 4K-HDR
Wi‑Fi/BT M.2 PCIe 3.0 FastConnect 7800, Wi-Fi 7, Wi-Fi 6E, Wi-Fi 6, Bluetooth 5.4
WWAN Snapdragon X75, Downlink: 10 Gbit/s, Uplink: 3,5 Gbit/s

Was Nano Banana Pro daraus macht, ist optisch zumindest ansprechend. Weil das KI-Modell die verbundenen Zeilen im Bereich der SKU aber nicht korrekt interpretiert, schleichen sich Fehler ein. So werden etwa dem X2E 88 100 auch nur 12 Kerne zugerechnet, obwohl dieser 18 hat. Dasselbe Problem gibt es auch bei der GPU.

Das Problem zeigt sich nicht nur bei Nano Banana Pro. ChatGPT schafft es ebenfalls nicht, den Unterschied bei den Snapdragon-X2-Elite-SKUs richtig zu interpretieren.

Fortschritte in vielen Bereichen

Bild-KIs kommen also mittlerweile auch in den Anwendungsbereichen voran, die im Alltag tatsächlich nützlich sind. Darüber hinaus verspricht Google weitere Fortschritte. Zu denen zählen schärfere Texte in Bildern, das nahtlosere Übertragen von Bildstilen sowie die Kombination mehrerer Bilder, um ein einziges zu erstellen.

Professionelle Produktion nimmt Google ebenfalls in den Blick. Mit einer verbesserten lokalen Bearbeitung lassen sich nun ein Teil eines Bildes auswählen, verfeinern und ändern. Anpassbar sind zudem Kamerawinkel, der Fokus, die Farbkorrektur und die Beleuchtung einer Szene – beispielsweise der Wechsel von Tag in Nacht oder das Erzeugen eines Bokeh-Effekts.

Bilder können in verschiedenen Seitenverhältnissen generiert werden, die Auflösung reicht bis auf 4K-Niveau. Damit sind diese laut Google sogar für Print geeignet.

Verfügbarkeit: Nano Banana Pro lässt sich über Gemini-App nutzen

Google verteilt das neue Nano-Banana-Pro-Modell weltweit über Gemini. Um es zu nutzen, muss man in der App die Option „Bilder erstellen“ und das „Thinking“-Modell auswählen. Nutzer der kostenlosen Gemini-Variante erhalten ein begrenztes kostenloses Kontingent. Ist es aufgebraucht, wechselt man wieder zum ursprünglichen Nano-Banana-Modell. Abonnenten von Google AI Plus, Pro- und Ultra erhalten höhere Kontingente.

Der KI-Modus in der Suche mit Nano Banana Pro ist in den USA für Abonnenten von Google AI Pro und Ultra verfügbar. Für NotebookLM ist Nano Banana Pro weltweit für Abonnenten verfügbar.

Die Bildgenerierung in Google Ads stellt Google ebenfalls auf Nano Banana Pro um. Entwickler können das Modell über die APIs in Googles Cloud-Diensten abrufen.

📊 Intel, AMD oder Nvidia? Mach' jetzt noch mit bei unserer großen Jahresumfrage!