Google Gemini AI hält umfassend Einzug in den Chrome-Browser und eröffnet eine neue Ära des intelligenten Agenten-Browsings
Zusammenfassung
Google hat am 18. September angekündigt, den Gemini AI-Assistenten vollständig in den Chrome-Browser zu integrieren. Diese Funktion, die zuvor nur Google AI Pro- und Ultra-Abonnenten vorbehalten war, steht nun allen Mac- und Windows-Desktop-Nutzern in den USA zur Verfügung. Dieser Schritt verwandelt Chrome in einen "Agenten-Browser" und markiert eine neue, KI-gesteuerte Phase in den Browserkriegen.
Google kündigte dieses wichtige Update in seinem offiziellen Blog an. Die Integration von Gemini in Chrome umfasst mehrere neue Funktionen, die als Browsing-Assistent für die Nutzer dienen. Über das Gemini-Symbol in der oberen rechten Ecke des Browsers können Nutzer den KI-Assistenten bitten, komplexe Informationen auf Webseiten zu erklären. Wenn beispielsweise eine Seite mit einem Bananenbrot-Rezept geöffnet ist, kann Gemini gebeten werden, dieses in eine glutenfreie Version umzuwandeln.
Kernfunktions-Upgrades
Zusammenarbeit über mehrere Tabs hinweg
Gemini kann jetzt über mehrere Tabs hinweg arbeiten, sodass Nutzer schnell Informationen von verschiedenen Websites vergleichen und zusammenfassen können. Beispielsweise können Nutzer gleichzeitig Tabs für Flüge, Hotels und Urlaubsaktivitäten öffnen und Gemini dann bitten, alle Informationen zu einem übersichtlichen Reiseplan zusammenzufassen.
Tiefe App-Integration
Google hat auch eine tiefe Integration von Gemini in Chrome mit anderen Google-Anwendungen wie Kalender, YouTube und Maps eingeführt. Nutzer können Besprechungen planen, Standortdetails anzeigen und vieles mehr, ohne die aktuelle Seite verlassen zu müssen. Wenn ein Nutzer beispielsweise einen bestimmten Abschnitt in einem YouTube-Video finden möchte, kann er Gemini einfach fragen, um direkt zur relevanten Stelle zu springen.
Intelligente Verlaufssuche
Gemini wird in Kürze in der Lage sein, zuvor besuchte Webseiten abzurufen, was es den Nutzern erleichtert, zu früheren Browsing-Sitzungen zurückzukehren, ohne den Browserverlauf durchsuchen zu müssen. Nutzer können Fragen stellen wie: "Auf welcher Website habe ich letzte Woche den Walnusstisch gesehen?" oder "Was war der Blogbeitrag über Schulanfangseinkäufe, den ich gelesen habe?".
Vorschau auf Agenten-KI-Funktionen
Am bemerkenswertesten sind die bevorstehenden Agentenfunktionen. Google gibt an, dass der KI-Assistent in der Lage sein wird, mühsame Aufgaben zu erledigen, wie z.B. einen Friseurtermin zu buchen oder wöchentliche Lebensmitteleinkäufe zu bestellen. Gemini navigiert zu den relevanten Websites, fügt Artikel dem Warenkorb hinzu und überlässt dem Nutzer dann den abschließenden Bezahlvorgang.
In den kommenden Monaten wird Gemini in Chrome Agentenfähigkeiten erhalten. Nutzer können "Gemini in Chrome sagen, was sie erledigen möchten, und es wird die Aktionen auf der Webseite in ihrem Namen ausführen". Dies umfasst Aufgaben wie das Buchen eines Friseurtermins oder das Bestellen von Lebensmitteln, wenn eine Zutatenliste vorhanden ist.
Adressleisten-KI-Modus
Google führt auch den KI-Modus, eine erweiterte Suchfunktion, direkt in die Chrome-Adressleiste ein. Mit dem KI-Modus können Nutzer komplexe Fragen stellen und diese weiterverfolgen, um tiefer in ein Thema einzutauchen. Anstatt einfach nach "beste Matratze" zu suchen, können Nutzer beispielsweise direkt in die Adressleiste eingeben: "Ich bin Seitenschläfer und habe gelegentlich Schmerzen im unteren Rücken, bitte erstellen Sie mir eine Tabelle zum Vergleich verschiedener Matratzentypen."
Verbesserte Sicherheitsfunktionen
Google gibt an, dass Chrome bald auch in der Lage sein wird, sein Gemini Nano-Modell zu verwenden, um Betrug zu erkennen und zu verhindern, wie z.B. gefälschte Virenwarnungen und betrügerische Gewinnspiele. Diese Betrügereien geben sich oft als vertrauenswürdige Marken aus und nutzen generative KI, um überzeugende Phishing-Versuche zu erstellen.
Google hat außerdem angekündigt, KI zu nutzen, um Nutzern auf unterstützten Websites (wie Coursera, Spotify, Duolingo, H&M usw.) mit einem Klick bei der Behebung kompromittierter Passwörter zu helfen. Wenn Chrome den Nutzer warnt, dass ein Passwort bei einer Datenpanne offengelegt wurde, kann der Nutzer dem System erlauben, ein neues Passwort zu erstellen und zu speichern.
Branchenwettbewerb
KI-Konkurrenten bringen Browser auf den Markt, um mehr Kontrolle über die Nutzererfahrung zu erlangen. Im Januar kündigte OpenAI Operator an, einen Agenten, der den Browser nutzt, um Aufgaben zu erledigen, wie z.B. Einkäufe über die Instacart-App. Das Unternehmen entwickelt Berichten zufolge einen eigenen Browser, der auf der Open-Source-Chromium-Codebasis basiert.
Im letzten Monat stellte Anthropic einen browserbasierten KI-Agenten vor, der von seinem Claude AI-Modell angetrieben wird. Perplexity führte im Juli seinen Browser Comet für KI-Aufgaben ein, der für zahlende Abonnenten verfügbar ist.
Zukünftige Erweiterungspläne
Google plant außerdem, Gemini in die iOS-Version der Chrome-App zu integrieren, eine Funktion, die in naher Zukunft eingeführt werden soll. In den kommenden Wochen wird die Funktion auch für Unternehmenskunden von Google Workspace verfügbar sein, die "Datenschutz auf Unternehmensniveau" genießen werden.
Diese Reihe von Updates markiert einen grundlegenden Wandel des Browsers von einem passiven Werkzeug zu einem aktiven intelligenten Assistenten. Google betrachtet dies als einen Übergang "von einer passiven Erfahrung zu einer proaktiveren und intelligenteren Erfahrung", um einen Browser zu schaffen, der "über das Rendern von Webseiten hinausgeht, Webseiten verstehen, Nutzern helfen kann, ihre Produktivität zu steigern und die Online-Sicherheit zu gewährleisten".
Technische Implementierungsdetails
Laut dem Entwickler-Blog sind Gemini-Funktionen, einschließlich KI-Funktionen wie Console Insights, auch in Chrome DevTools integriert, um Entwicklern zu helfen, Fehler und Warnungen in der Konsole zu verstehen. Dies zeigt, dass Google sich nicht nur auf die allgemeine Nutzererfahrung konzentriert, sondern auch KI-verbesserte Tools für die Entwicklergemeinschaft bereitstellt.
Derzeit wird die Funktion zunächst in den USA für Nutzer mit englischer Spracheinstellung eingeführt und soll in Zukunft auf weitere Länder und Sprachen ausgeweitet werden. Diese strategische Bereitstellung spiegelt Googles Entschlossenheit wider, eine führende Position im Bereich der KI-Browser zu etablieren, und zeigt gleichzeitig, wie künstliche Intelligenz unsere Interaktion mit dem Internet neu definiert.