OpenAI推出GPT-5.1重大升級:自適應推理引領對話AI新紀元

November 15, 2025
OpenAI,GPT-5.1
6 min

新聞摘要

OpenAI 於 2025 年 11 月 13 日(美東時間)正式發布 GPT-5.1 模型更新,這是繼今年 8 月推出 GPT-5 以來的首次重大升級。新版本包含 GPT-5.1 Instant 和 GPT-5.1 Thinking 兩個變體,旨在提供更快速的回應、改進的推理能力以及更靈活的對話控制功能。

核心更新內容

GPT-5.1 Instant 作為 ChatGPT 最常用的模型,現在預設採用更溫暖、更具對話感的語氣,能夠更準確地遵循用戶指令。該模型首次配備自適應推理功能,可根據問題複雜度自動決定是否需要額外思考時間,從而在保持快速回應的同時提供更全面且準確的答案。

GPT-5.1 Thinking 模型則專注於處理需要深度分析的複雜任務。與前代相比,新版本能更精確地根據問題難度調整思考時間——對簡單問題回應更快,對複雜問題則投入更多計算資源。據 OpenAI 介紹,該模型在表述上減少了專業術語的使用,使技術解釋更加通俗易懂。

個人化與互動改進

OpenAI 此次發布為 ChatGPT 引入了更直觀有效的個人化控制功能。用戶現在可從多種預設語氣中選擇,包括專業(Professional)、坦率(Candid)、古怪(Quirky)等風格,此外還保留了預設、書呆子、憤世嫉俗、友好和高效等既有選項。

新版本還允許用戶對回應的簡潔度、溫暖度、可讀性以及表情符號使用頻率進行細緻調整,這些設定可在對話過程中即時生效並持續應用。ChatGPT 甚至能在對話中主動建議更新偏好設定,當用戶請求特定語氣或風格時。

性能提升數據

根據 OpenAI 公佈的測試數據,GPT-5.1 在數學和程式設計評估方面表現顯著改善,特別是在 AIME 2025 和 Codeforces 等基準測試中取得了明顯進步。資產管理公司 Balyasny Asset Management 的測試顯示,GPT-5.1 在其完整動態評估套件中的表現超越了 GPT-4.1 和 GPT-5,運行速度提升 2–3 倍,且在工具密集型推理任務中使用的 token 數量約為競爭對手的一半。

保險業務流程外包公司 Pace 的測試也證實,其智慧代理在 GPT-5.1 上的運行速度提升了 50%,同時在準確性方面超過了 GPT-5 和其他領先模型。

發布計畫與可用性

GPT-5.1 Instant 和 Thinking 模型自 2025 年 11 月 13 日起開始逐步推出,首先面向 Pro、Plus、Go 和 Business 付費用戶,隨後將擴展至免費用戶和未登入用戶。企業版和教育版用戶將獲得為期 7 天的提前存取權限,之後 GPT-5.1 將成為預設模型。

OpenAI 表示將在未來幾天內逐步向所有用戶開放,以確保系統性能穩定。GPT-5(包括 Instant 和 Thinking 版本)將在 ChatGPT 的傳統模型下拉選單中保留三個月,讓付費訂閱用戶有充足時間進行比較和適應。API 版本將於本週稍晚發布。

產業背景與競爭態勢

此次更新發布之際,OpenAI 正面臨來自 Claude、Gemini、Mistral 以及開源模型日益激烈的競爭。GPT-5 在今年 8 月發布後曾因改進有限而受到批評,甚至一度臨時移除舊版模型引發用戶抗議,OpenAI 後來部分撤回了這一決定。

Greyhound Research 首席分析師 Sanchit Vir Gogia 指出,GPT-5.1 的實際價值在於消除了企業在使用過程中默默忍受的諸多摩擦點。該模型能夠更快理解意圖,減少偏離主題的情況,並在多輪對話中保持更穩定的語氣,這些改進能夠顯著減少隱性營運成本。

Gartner 資深總監分析師 Anushree Verma 認為,許多改進側重於透過更好的語氣和推理能力提升使用者體驗,這些更新增強了模型的沉浸式能力,能夠吸引使用者注意力並鼓勵更強的參與度。

技術架構說明

據 OpenAI 應用 CEO Fidji Simo 在 Substack 上發文稱,GPT-5.1 聊天模型使用與推理模型相同的技術棧進行訓練,在事實性和複雜問題解決方面的得分高於 GPT-5,同時引入了更自然的對話語氣。

在 API 方面,GPT-5.1 Instant 將作為 gpt-5.1-chat-latest 加入,GPT-5.1 Thinking 將作為 GPT-5.1 在 API 中發布,兩者均配備自適應推理功能。OpenAI 還計畫推出針對長期程式碼編寫任務優化的 gpt-5.1-codex 和 gpt-5.1-codex-mini 模型。

此外,OpenAI 引入了擴展提示快取功能,快取保留時間最長可達 24 小時,這將為後續問題提供更快的回應速度並降低成本。優先處理客戶在使用 GPT-5.1 時將體驗到明顯更快的性能表現。

爭議與關注

值得注意的是,在 GPT-5.1 發布後不久,有報導指出新模型的個人化更新可能帶來用戶過度依賴的新風險。據 OpenAI 估計,每週約有 0.07% 的用戶表現出精神病或躁狂症狀,0.15% 的用戶傳送的訊息顯示出對 ChatGPT 可能存在情感依戀加深的跡象。

有專家分析認為,GPT-5.1 與用戶互動中超過 80% 的訊息應被標記為過度驗證、無條件同意和肯定用戶獨特性等行為,心理健康專家警告稱這些行為可能加劇妄想症狀。

展望

OpenAI 在聲明中表示,該公司致力於迭代部署最強大、最可靠的模型,用於實際的代理工作和編碼任務——這些模型能夠高效思考、快速迭代並處理複雜任務,同時讓開發者保持工作流程的順暢。

對於企業用戶而言,GPT-5.1 代表著 OpenAI 重新聚焦於塑造企業信心的基本要素,而非僅僅追求原始能力的躍進。在現代企業架構越來越將多模型框架視為常態的情況下,GPT-5.1 將繼續作為深度分析工作和模糊、多步驟任務的首選,但需要與在成本敏感或特定領域場景中表現更優的競爭對手共存。