谷歌Gemini AI全面进驻Chrome浏览器 开启智能代理浏览新纪元
摘要
Google于9月18日宣布,将Gemini AI助手全面集成到Chrome浏览器中,面向美国所有Mac和Windows桌面用户开放,此前该功能仅限于Google AI Pro和Ultra订阅用户使用。这一举措将Chrome转变为"代理浏览器",标志着浏览器大战进入AI驱动的新阶段。
谷歌在官方博客中宣布了这一重大更新,Gemini在Chrome中的集成包含了多项新功能,可作为用户的浏览助手。用户可以通过浏览器右上角的Gemini图标,要求AI助手解释网页上的复杂信息,例如打开香蕉面包食谱页面后,要求Gemini将其修改为无麸质版本。
核心功能升级
跨标签页协作能力
Gemini现在可以跨多个标签页工作,让用户快速比较和总结来自不同网站的信息。例如,用户可以同时打开航班、酒店和度假活动的标签页,然后要求Gemini将所有信息整合成一个清晰的行程安排。
深度应用集成
谷歌还推出了Gemini在Chrome中与其他Google应用(如Calendar、YouTube和Maps)的深度集成。用户可以在不离开当前页面的情况下安排会议、查看位置详情等。例如,如果用户想要找到YouTube视频中的特定片段,只需询问Gemini即可直接跳转到相关位置。
智能历史记录搜索
Gemini即将能够检索用户之前访问过的网页,让用户更容易回到过去的浏览会话,而无需翻找浏览器历史记录。用户可以询问类似"我上周在哪个网站看到胡桃木桌子?"或"我读过的那篇返校购物博客是什么?"这样的问题。
代理AI功能预告
最引人注目的是即将推出的代理功能。Google表示,AI助手将能够完成繁琐的任务,如预订理发或订购每周杂货。Gemini将导航到相关网站,将商品添加到购物车,然后让用户进行最终的结账操作。
在未来几个月内,Gemini在Chrome中将获得代理能力。用户可以"告诉Chrome中的Gemini你想要完成什么,它会代表你在网页上执行操作"。这包括预订理发或在有食材清单时订购杂货等任务。
地址栏AI模式
Google还将AI模式这一高级搜索功能直接引入Chrome地址栏。通过AI模式,用户可以询问复杂问题并进行后续跟进以深入了解主题。例如,用户可以直接在地址栏中输入"我是侧睡者,偶尔有下背部疼痛,请为我制作一个比较不同床垫类型的表格",而不是简单搜索"最佳床垫"。
安全功能增强
Google表示Chrome还将很快能够使用其Gemini Nano模型来检测和防范诈骗,如虚假病毒警报和欺诈性赠品。这些诈骗通常冒充可信品牌,并使用生成式AI创建令人信服的钓鱼尝试。
Google还宣布正在使用AI帮助用户在支持的网站(如Coursera、Spotify、Duolingo、H&M等)上一键修复被泄露的密码。如果Chrome警告用户密码在数据泄露中被暴露,用户可以允许系统为其创建并保存新密码。
行业竞争背景
AI竞争对手正在推出浏览器以试图控制更多用户体验。今年1月,OpenAI宣布了Operator,这是一个使用浏览器完成任务的代理,例如使用Instacart应用程序购物。该公司据报道正在开发基于开源Chromium代码库的自己的浏览器。
上个月,Anthropic推出了由其Claude AI模型驱动的基于浏览器的人工智能代理。Perplexity在7月推出了其浏览器Comet用于AI任务,面向付费订阅用户开放。
未来扩展计划
Google还计划将Gemini引入iOS版Chrome应用,该功能将在不久的将来推出。在未来几周内,该功能还将面向Google Workspace的企业用户开放,用户将享有"企业级数据保护"。
这一系列更新标志着浏览器从被动工具向主动智能助手的根本性转变,Google将此视为"从被动体验向更主动和智能体验"的转变,创建一个"超越渲染网页,能够理解网页、帮助用户提高生产力并确保在线安全的浏览器"。
技术实现细节
据开发者博客显示,Chrome DevTools中也集成了Gemini功能,包括console insights等AI功能,帮助开发者理解控制台中记录的错误和警告。这表明谷歌不仅专注于普通用户体验,也在为开发者社区提供AI增强的工具。
目前,该功能首先在美国推出,面向语言设置为英文的用户,未来将扩展到更多国家和语言。这一战略性部署反映了谷歌在AI浏览器领域建立领先地位的决心,同时也展示了人工智能如何重新定义我们与互联网交互的方式。