谷歌部署Gemini 3 Flash:前沿AI智能遇上全球闪电般的速度性能
新闻摘要
谷歌已正式推出其最新人工智能模型 Gemini 3 Flash,该模型将前沿智能与高速性能和成本效益相结合。该模型于 2025 年 12 月 18 日(太平洋时间)开始在全球范围内推出,标志着 Gemini 3 系列的重大扩展,该系列最初于上个月推出了 Gemini 3 Pro。
全球推广和可用性
Gemini 3 Flash 即日起通过多个平台向全球数百万用户部署。该模型现已成为 Gemini 应用中的默认 AI,取代了之前的 Gemini 2.5 Flash。用户可以通过 Gemini 应用和 Google 搜索中的 AI 模式免费访问它。
对于开发者和企业而言,Gemini 3 Flash 可通过 Google AI Studio 中的 Gemini API、Google Antigravity(谷歌新的代理开发平台)、Gemini CLI、Android Studio、Vertex AI 和 Gemini Enterprise 进行预览。
基准性能和技术能力
Gemini 3 Flash 在高级基准测试中表现出色,在 GPQA Diamond 上达到 90.4%,在 Humanity's Last Exam 上达到 33.7%(未使用工具),其得分可与更大的前沿模型相媲美。该模型在 MMMU Pro 上也达到了 81.2%,与 Gemini 3 Pro 在多模态理解方面的表现持平。
根据 Artificial Analysis 基准测试数据,与前代产品相比,Gemini 3 Flash 在多个基准测试中显著优于 Gemini 2.5 Pro,同时运行速度提高了三倍。
定价和成本效益
对于使用 API 的开发者,谷歌设定的价格为每百万输入 token 0.50 美元,每百万输出 token 3.00 美元,音频输入 token 每百万 1.00 美元。虽然这比 Gemini 2.5 Flash 的定价(分别为 0.30 美元和 2.50 美元)略有上涨,但谷歌强调性能的提升证明了成本差异的合理性。
增强功能和用例
Gemini 3 Flash 在多模态推理能力方面表现出色,能够实现视频分析、视觉问答、复杂编码任务和数据提取等高级应用。该模型可以同时处理图像、视频、音频录音和文本,提供结合实时信息和实用建议的全面响应。
用户可以上传视频和图像进行内容分析,绘制草图以进行实时 AI 识别,或提交音频录音以进行自定义内容生成。该模型还支持语音听写以构建应用程序,允许用户无需传统编码技能即可将想法转化为功能性应用程序。
企业采用和行业响应
主要科技公司已开始将 Gemini 3 Flash 整合到其运营中。早期采用者包括 JetBrains、Figma、Cursor、Harvey、Latitude 和 Bridgewater Associates,它们正在利用该模型的速度、效率和推理能力来实现业务转型。
自上个月 Gemini 3 Pro 发布以来,谷歌通过其 API 每天处理超过一万亿个 token,这表明 Gemini 3 系列在开发者和企业中得到了强劲的采用。
竞争格局
此次发布正值人工智能领域竞争日益激烈之际。OpenAI 最近发布了 GPT-5.2,有报道称随着谷歌市场份额的增长,ChatGPT 的流量有所下降。Gemini 3 Flash 的发布时机似乎具有战略意义,旨在维持谷歌在快速发展的人工智能领域中的竞争地位。
技术架构
Gemini 3 Flash 的设计旨在推动质量与效率的帕累托前沿,这意味着它以最低的计算成本提供最大的性能。在可比任务中,该模型使用的 token 比 Gemini 2.5 Pro 少 30%,同时保持了卓越的推理能力。
该模型包含可调节的思考级别(最小、低、中或高)等高级功能,允许开发者根据具体用例平衡响应质量、推理复杂性、延迟和成本。
消费者体验改进
在 Google 搜索的 AI 模式中,Gemini 3 Flash 带来了增强的推理能力和对查询细微差别的改进理解。该模型可以更有效地解析复杂问题,考虑用户查询的多个方面,以提供结合研究和即时操作的全面、视觉上易于理解的响应。
此外,美国用户现在可以访问具有高级 AI 创建工具的 Gemini 3 Pro 模型,包括用于在搜索中进行最先进图像生成和编辑的 Nano Banana Pro。
未来影响
Gemini 3 Flash 的发布代表了谷歌致力于通过大规模普及前沿智能来普及高级人工智能能力的承诺。通过将 Pro 级模型的复杂推理与 Flash 级速度和效率相结合,谷歌旨在实现从面向消费者的聊天机器人到复杂的企业工作流程等更广泛的应用,同时保持成本效益。
该公司继续扩展 Gemini 3 系列,该系列现在包括 Gemini 3 Pro、Gemini 3 Deep Think 和 Gemini 3 Flash,为开发者和用户提供一套全面的 AI 模型,以满足不同的性能和成本要求。