Gemini 2.5 Pro Experimental: Googles Deep Research soll ChatGPT übertreffen

Michael Schäfer
19 Kommentare
Gemini 2.5 Pro Experimental: Googles Deep Research soll ChatGPT übertreffen
Bild: Google Deepmind

Im vergangenen Jahr hatte Google seinen KI-Assistenten für Tiefen-Recherche auf Basis von Gemini 2 veröffentlicht, nun wird dieser auch auf das neue Modell Gemini 2.5 Pro Experimental ausgeweitet. Erste Ergebnisse sollen darauf hindeuten, dass das neue Agenten-System bessere Resultate erzielt als Deep Research von OpenAI.

Erst Ende des vergangenen Monats hatte Google mit Gemini 2.5 Pro ein neues Reasoning-Modell vorgestellt, das sich laut von Google veröffentlichter Benchmarks klar von der Konkurrenz wie OpenAIs o3-mini-Modell abheben soll. Dieses basiert auf Gemini 2.0 Flash Thinking und nutzt Technologien wie Reinforcement Learning und Chain of Thought. Zusätzlich profitiert das Modell von einer deutlich verbesserten Basis sowie einem optimierten Verfahren für das Post-Training.

Nutzer sollen neue Tiefen-Recherche bevorzugen

Einen vergleichbaren Vorsprung beansprucht Google nun auch für „Gemini Deep Research powered by Gemini 2.5 Pro“ – wenn auch auf subjektiver Basis und ohne belastbare Messdaten. Nach unternehmenseigener Tests hätten menschliche Bewerter die Berichte von Gemini 2.5 Pro gegenüber den Ergebnissen von OpenAIs Deep Research im Verhältnis von mehr als 2:1 bevorzugt. Teil der positiven Rückmeldungen sei laut Google auch, dass die erzeugten Zusammenfassungen spürbare Verbesserungen bei analytischer Schlussfolgerung und Informationssynthese aufweisen sollen, was die Gesamtqualität der Inhalte erhöhen würde. Diese Aussagen lassen sich jedoch nicht unabhängig verifizieren.

Nur für zahlende Kunden

Das neue experimentelle Modell Gemini 2.5 Pro ist derzeit ausschließlich für zahlende Nutzer von Gemini Advanced verfügbar. Für die kostenlose Nutzung von Gemini Deep Research steht weiterhin das Gemini-2.0-Flash-Modell sowohl auf dem Desktop als auch auf mobilen Geräten in 150 Ländern bereit. Mit diesem kann der Agent Hunderte von Websites analysieren, seine Ergebnisse reflektieren und Berichte verfassen, die sich bei Bedarf auch in gesprochene, Podcast-ähnliche Dialoge umwandeln lassen.

📊 Intel, AMD oder Nvidia? Mach' jetzt noch mit bei unserer großen Jahresumfrage!