Intelligente Revolution: Google DeepMind Dual-Modell-KI-System verleiht Robotern Schlussfolgerungs- und Suchfähigkeiten

September 28, 2025
GOOGLE
3 min

Zusammenfassung

Google DeepMind hat kürzlich die brandneuen Modelle Gemini Robotics 1.5 und Gemini Robotics-ER 1.5 vorgestellt, was einen Wendepunkt darstellt, da KI-Technologie zum ersten Mal wirklich in die Welt der physischen Robotik vordringt. Diese beiden Modelle nutzen ein duales Architekturdesign, das es Robotern ermöglicht, nicht nur Anweisungen auszuführen, sondern auch zu schlussfolgern, zu planen und proaktiv Werkzeuge einzusetzen, wodurch sie fortgeschrittenere Interaktionsfähigkeiten mit der physischen Welt erlangen.

Bahnbrechende Dual-Modell-Architektur

Gemini Robotics-ER 1.5 und Gemini Robotics 1.5 verwenden ein innovatives Dual-Architekturdesign, bei dem beide Modelle zusammenarbeiten, um ein leistungsstarkes Roboter-KI-System zu bilden. Gemini Robotics-ER 1.5 fungiert als "höheres Gehirn", das für Planung und Entscheidungen im physischen Raum zuständig ist, während Gemini Robotics 1.5 visuelle und sprachliche Verständnisse in konkrete Aktionen umsetzt. Diese Architektur ermöglicht es Robotern, komplexe mehrstufige Aufgaben auszuführen, wie z.B. Müll nach online gefundenen lokalen Recyclingregeln zu sortieren oder Gepäck basierend auf der Wettervorhersage zu packen.

Ein Paradigmenwechsel: Von der Reaktion zum Schlussfolgern

Carolina Parada, Leiterin der Robotikabteilung bei Google DeepMind, betont, dass das neue System Maschinen ermöglicht, "mehrere Schritte vorauszudenken", anstatt sich nur auf einen einzelnen Schritt zu konzentrieren. Im Gegensatz zu früheren Generationen, die nur einfache Anweisungen ausführen konnten, bringt das neue System das Verhalten von Robotern der menschlichen Denkweise näher – zuerst planen, dann handeln.

Roboterübergreifende Lernfähigkeit

Eine weitere revolutionäre Neuerung dieses Updates ist die Funktion des "roboterübergreifenden Lernens". DeepMind demonstrierte, dass Fähigkeiten, die von einem zweiarmigen ALOHA2-Roboter erlernt wurden, ohne zusätzliche Einrichtung auf Franka-Roboter oder den humanoiden Roboter Apollo von Apptronik übertragen werden können. Dies bedeutet, dass derselbe Satz von Modellen verschiedene Robotertypen steuern und Erfahrungen übertragen kann, was die Entwicklungsgeschwindigkeit der Robotik erheblich beschleunigt.

Intelligente Websuche und Werkzeugnutzung

Gemini Robotics-ER 1.5 ist in der Lage, komplexe Herausforderungen zu bewerten, native Tools (wie Google Search) zur Informationssuche aufzurufen und detaillierte Schritt-für-Schritt-Pläne zur Problemlösung zu erstellen. Dies ermöglicht es Robotern, Informationen wie Menschen zu suchen und auf praktische Aufgaben anzuwenden, was den Fähigkeitsbereich von Robotern erheblich erweitert.

Verbesserte Sicherheit und Transparenz

DeepMind hat die Sicherheit während des Entwicklungsprozesses in den Mittelpunkt gestellt. Beide Modelle sind mit Schutzmaßnahmen und Erklärbarkeitsfunktionen ausgestattet, die das Roboterverhalten vorhersehbarer und nachvollziehbarer machen. Google hat auch eine aktualisierte Version des ASIMOV-Benchmarks zur Bewertung und Verbesserung der semantischen Sicherheit veröffentlicht, wobei Gemini Robotics-ER 1.5 bei den Sicherheitsbewertungen eine hochmoderne Leistung zeigte.

Verfügbarkeit für Entwickler

Dieses Update ist nun für Entwickler verfügbar: Gemini Robotics-ER 1.5 kann über die Gemini API in Google AI Studio getestet werden, während Gemini Robotics 1.5 derzeit nur ausgewählten Partnern zur Verfügung steht. Dies wird eine breitere Innovation in der Robotik und die Entwicklung von Anwendungen fördern.

Ein wichtiger Meilenstein auf dem Weg zur Allgemeinen Künstlichen Intelligenz

Google DeepMind beschreibt diese Veröffentlichung als einen wichtigen Schritt zur Lösung der Allgemeinen Künstlichen Intelligenz (AGI) in der physischen Welt. Durch die Einführung proaktiver Fähigkeiten geht Google über Modelle hinaus, die nur auf Befehle reagieren, und schafft Systeme, die wirklich schlussfolgern, planen, proaktiv Werkzeuge einsetzen und generalisieren können.

Brancheauswirkungen und Zukunftsaussichten

Diese bahnbrechende Technologie verspricht, mehrere Branchen neu zu gestalten. Im Gesundheitswesen könnten Assistenzroboter je nach Patientenbedürfnissen Hilfe leisten; in häuslichen Umgebungen könnten sie zu intelligenteren persönlichen Assistenten werden. Obwohl die Robotik noch in den Kinderschuhen steckt, zeigt diese Veröffentlichung, dass die Zukunft nicht nur um intelligentere KI geht, sondern um KI, die mit uns leben und agieren kann.

Während Google DeepMind die Konvergenz von Robotik und Künstlicher Intelligenz weiter vorantreibt, können wir weitere innovative Anwendungen erwarten, die die Lücke zwischen virtueller Intelligenz und der physischen Welt weiter schließen.