Werbung

Google erweitert sein KI-Portfolio um Gemini 3, ein Modell, das gegenüber den vorherigen Versionen deutlich verbesserte Analyse-, Planungs- und Codefähigkeiten aufweisen kann. Die neue Generation ist laut Google darauf ausgelegt, komplexe Aufgaben verlässlicher zu verarbeiten und sich direkt in bestehende Entwicklungsabläufe einzufügen. Das System unterstützt dabei ein breites Spektrum an Eingaben, darunter Text, Audio, Bilder, Videos und Code, und arbeitet mit einem Kontextfenster von einer Million Tokens. Damit lassen sich auch umfangreiche Dokumente, lange Videoinhalte oder verschachtelte Arbeitsabläufe in einem Zug auswerten.

Gemini 3 Pro erreicht zudem in gängigen Benchmarks aktuell die Spitzenwerte und kann sich in mathematischen, textverständlichen und multimodalen Tests klar über den Vorgängerversionen positionieren. Neben der Standardausführung bietet Google einen Deep-Think-Modus an, der für Aufgaben mit größerer logischer Tiefe optimiert wurde. Dieser Modus befindet sich allerdings noch im Testbetrieb und richtet sich vor allem an Nutzer, die besonders anspruchsvolle Analyse- oder Beweisführungsaufgaben automatisieren möchten.

Ein zentraler Bestandteil des Ökosystems ist die Entwicklerplattform Antigravity, die Arbeitsprozesse mit autonomen Code-Agenten ermöglicht. Diese Agenten können Softwarekomponenten planen, erstellen, testen und über verschiedene Werkzeuge hinweg ausführen. Dazu erhalten sie direkten Zugriff auf Editoren, Terminals und Browser. Die Plattform kombiniert Gemini 3 Pro mit zusätzlichen Modellen für Browser-Steuerung, Bildverarbeitung und strukturiertes Datenhandling.

Für die Integration in Anwendungen stellt Google zudem erweiterte API-Funktionen bereit. Dazu zählen ein zusätzlicher Denk-Level, feinere Steuerungsparameter für visuelle Auflösung sowie eine validierte Verwaltung von Thought Signatures, um konsistente Ergebnisse in längeren Interaktionen gewährleisten zu können. Die API kann über Google AI Studio und Vertex AI genutzt werden; dort stehen auch neue Optionen für Vision-Verarbeitung zur Verfügung, etwa einstellbare Detailgrade zur Optimierung von Kosten und Latenz.

Ein weiterer Schwerpunkt liegt auf dem "Vibe Coding", bei dem Entwickler Ideen in natürlicher Sprache beschreiben und das Modell daraus vollständige Anwendungen erzeugt. Das System übernimmt so mehrstufige Planung, Code-Generierung und Interaktionslogik, sodass mit einem einzigen Prompt Apps, Spiele oder visuelle Oberflächen entstehen können. Google AI Studio dient hierbei als zentrale Entwicklungsumgebung, in der Modelle, APIs und Tools automatisch verbunden werden.

In den Bereichen visueller und räumlicher Analyse erreicht Gemini 3 Pro ebenfalls Leistungszuwächse. Verbesserungen im räumlichen Verständnis unterstützen etwa Anwendungen in Robotik, autonomen Systemen oder XR-Geräten und ermöglichen eine genauere Interaktion mit digitalen Oberflächen, beispielsweise durch Analyse von Mausbewegungen oder Bildschirminhalten über längere Zeiträume.

Gemini 3 Pro ist über die Gemini-App frei zugänglich und steht Unternehmen über Vertex AI sowie Gemini Enterprise bereit. Die API-Preise liegen in der Vorschauversion bei zwei US-Dollar pro Million Eingabetokens und zwölf US-Dollar pro Million Ausgabetokens für Prompts bis 200.000 Tokens.