Google 以開源 TranslateGemma 模型徹底改變AI翻譯,支援55種語言

January 16, 2026
Google,TranslateGemma
4 min

新聞摘要

Google 發布了 TranslateGemma,這是一套基於 Gemma 3 架構的開源翻譯模型,標誌著 AI 翻譯技術的重大進步。該公告於 2026 年 1 月 15 日(美國東部時間)發布,推出了三種模型變體,它們在支援跨多個語系家族的 55 種語言的同時,展現了卓越的效率。

革命性的效率突破

TranslateGemma 最顯著的成就體現在其前所未有的效率上:12B 參數模型在 WMT24++ 基準測試中的表現優於 Google 更大的 27B 基線 Gemma 3 模型。這代表了 AI 模型開發的一個根本性轉變,效率優先於原始規模,以顯著更少的參數實現了最先進的翻譯品質。

三層架構,通用部署

TranslateGemma 推出三種不同的配置,專為不同的部署場景設計:

4B 模型:專門針對行動推論和邊緣部署進行優化,無需雲端連線即可直接在智慧型手機和平板電腦上實現高品質翻譯。

12B 模型:專為在消費級筆記型電腦上順暢運行而設計,將研究級翻譯功能帶入本地開發環境和日常運算設備。

27B 模型:為最大保真度而建,設計用於在雲端環境中的單個 NVIDIA H100 GPU 或 TPU 上運行,目標是需要最高翻譯品質的企業和研究應用。

先進的訓練方法

Google 透過專門的兩階段微調流程實現了這種效能密度,該流程從先進的 Gemini 模型中提煉知識。訓練方法結合了在多樣化平行資料集上的監督式微調和強化學習技術,利用 MetricX-QE 和 AutoMQM 等先進指標來優化翻譯的自然度和語境準確性。

全面的語言支援

這些模型為 55 種經過嚴格測試的語言提供了強大的支援,包括西班牙語、法語、中文和印地語等主要語言,以及眾多低資源語言。Google 已將訓練擴展到近 500 種額外的語言對,儘管此擴展集的評估指標仍在開發中。

保留多模態功能

TranslateGemma 展現了強大的基於圖像的翻譯能力,即使沒有特定的多模態微調,也能準確翻譯圖像中的文字。此功能為直接從照片翻譯標誌、菜單和文件打開了應用程式。

策略性市場時機

此公告發布後僅數小時,OpenAI 便發布了 ChatGPT Translate,凸顯了 AI 翻譯服務日益激烈的競爭。雖然 OpenAI 的解決方案側重於語氣和語境準確性,但 Google 的方法強調開源的可及性以及跨不同硬體配置的部署靈活性。

行業影響與可及性

TranslateGemma 的開源性質代表了 Google 在推動先進 AI 翻譯技術民主化方面的承諾。這些模型可透過 Kaggle、Hugging Face 和 Google 的 Vertex AI 平台等多個平台立即取得,使全球研究人員和開發人員能夠基於該技術進行構建並針對特定用例進行適配。

技術驗證

在 WMT24++ 資料集上的測試表明,TranslateGemma 在所有支援的語言中,與基線 Gemma 模型相比,顯著降低了錯誤率,在保持卓越效率的同時,為開源翻譯模型樹立了新的效能標準。

此發布使 Google 處於更高效、更專業的 AI 模型這一新興趨勢的前沿,這些模型無需龐大的計算資源即可提供卓越的效能,並可能重塑組織對 AI 翻譯部署策略的處理方式。