一個開源的深度研究助手,使用AI智能體自動進行深度研究並生成綜合性報告
Open Deep Research 專案詳細介紹
專案概述
Open Deep Research 是由 LangChain AI 開發的一個實驗性、完全開源的深度研究助手,能夠自動化深度研究並生成任何主題的綜合性報告。此專案的核心目標是提供一個簡單、可配置的開源解決方案,以與 OpenAI、Anthropic、Perplexity 和 Google 等公司的深度研究產品競爭。
核心特性
🎯 雙架構設計
專案提供兩種不同的實現方式,各有優勢:
工作流程架構(Workflow Architecture)
- 結構化的計畫-執行工作流程
- 人機互動循環,允許使用者回饋和批准報告計畫
- 逐節建立,在搜尋迭代之間進行反思
- 支援所有搜尋工具供應商
多代理架構(Multi-Agent Architecture)
- 監督者-研究員架構
- 多個獨立代理並行工作
- 顯著減少報告生成時間
- 專業化工具設計
🔧 高度可配置性
Open Deep Research 提供廣泛的配置選項來客製化研究過程和模型行為。所有配置都可以透過 Web UI、環境變數或直接修改配置來設定:
- Max Structured Output Retries (預設: 3): 結構化輸出呼叫的最大重試次數
- Allow Clarification (預設: true): 是否允許研究員在開始研究前詢問澄清問題
- Max Concurrent Research Units (預設: 5): 使用子代理並發運行的最大研究單元數
- Search API (預設: Tavily): 支援多種搜尋 API 選擇
- Max Researcher Iterations (預設: 3): 研究監督者反思研究並提出後續問題的次數
🤖 多模型支援
Open Deep Research 為不同的研究任務使用多個專業化模型:
- 摘要模型 (預設: openai:gpt-4.1-nano): 總結搜尋 API 的研究結果
- 研究模型 (預設: openai:gpt-4.1): 進行研究和分析
- 壓縮模型 (預設: openai:gpt-4.1-mini): 壓縮子代理的研究發現
- 最終報告模型 (預設: openai:gpt-4.1): 撰寫最終綜合報告
所有模型都使用 init_chat_model() API 配置,支援 OpenAI、Anthropic、Google Vertex AI 等供應商。
🔍 豐富的搜尋工具整合
專案支援多種搜尋 API:
- Tavily API - 通用網路搜尋
- Perplexity API - 通用網路搜尋
- Exa API - 強大的類神經網路搜尋
- ArXiv - 物理、數學、電腦科學等學術論文
- PubMed - 生物醫學文獻
- Linkup API - 通用網路搜尋
- DuckDuckGo API - 通用網路搜尋
- Google Search API - 自訂搜尋引擎
技術架構
基於 LangGraph 建構
Open Deep Research 基於 LangGraph 建構,這是一個用於建構彈性語言代理圖的框架。這種架構使得專案能夠:
- 靈活應用不同的研究策略
- 使用中間結果指導探索
- 處理開放式研究任務
三步驟研究流程
Open Deep Research 使用代理作為三步驟流程的一部分進行研究:
範圍界定(Scoping)
- 使用者澄清:收集研究所需的所有使用者上下文
- 簡要生成:將詳細的聊天互動轉換為綜合、專注的研究簡要
研究(Research)
- 使用監督代理進行研究
- 將研究任務委託給適當數量的子代理
- 確定研究簡要是否可以分解為獨立的子主題
報告生成(Report Generation)
- 一次性撰寫報告
- 避免多代理並行寫作的協調困難
安裝和使用
快速開始
# 複製儲存庫
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research
# 設定環境變數
cp .env.example .env
# 安裝並啟動 LangGraph 伺服器
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking
作為 Python 套件安裝
pip install open-deep-research
使用方式
透過 Studio UI:
- 🚀 API: http://127.0.0.1:2024
- 🎨 Studio UI: https://smith.langchain.com/studio/?baseUrl=http://127.0.0.1:2024
- 📚 API Docs: http://127.0.0.1:2024/docs
Jupyter Notebook:
- 查看範例:
src/open_deep_research/graph.ipynb
- 多代理範例:
src/open_deep_research/multi_agent.ipynb
- 查看範例:
平台整合
Open Agent Platform (OAP)
Open Agent Platform (OAP) 是一個使用者介面,非技術使用者可以從中建構和配置自己的代理。OAP 非常適合讓使用者配置深度研究員,使用最適合他們需求的不同 MCP 工具和搜尋 API。
效能和評估
基準測試結果
根據結果,Open Deep Research 在基礎模型上持續顯著改善答案品質,這在 Llama、DeepSeek 和 Qwen 旗艦模型中都有體現,展現了工作流程的品質。
測試功能
# 使用預設 Anthropic 模型測試
python tests/run_test.py --all
# 使用 OpenAI o3 模型測試
python tests/run_test.py --all \
--supervisor-model "openai:o3" \
--researcher-model "openai:o3" \
--planner-provider "openai" \
--planner-model "o3" \
--writer-provider "openai" \
--writer-model "o3" \
--eval-model "openai:o3" \
--search-api "tavily"
部署選項
- 本地部署: 透過 LangGraph 伺服器本地運行
- 雲端部署: 可輕鬆部署到 LangGraph Platform
專案生態
相關專案
- local-deep-researcher: 完全本地的網路研究和報告寫作助手
- LangGraph: 建構彈性語言代理圖的框架
- LangChain: 建構上下文感知推理應用程式
社群與開源
自 OpenAI 發布以來,開源社群在開發深度研究替代方案方面做出了卓越的努力。此專案旨在為社群提供一個可存取的開源深度研究工具包。
技術要求
模型相容性
- 結構化輸出支援: 所有模型必須支援結構化輸出
- 工具呼叫支援: 代理模型需要支援工具呼叫
- 搜尋 API 相容性: 研究和壓縮模型必須支援所選的搜尋 API
已測試模型
- Claude 3.7
- o3 和 o3-mini
- gpt-4.1
- llama-3.3-70b-versatile (透過 Groq)
優勢與特點
設計原則
Open Deep Research 的一個關鍵設計原則是靈活性,能夠根據請求探索不同的研究策略。代理非常適合研究,因為它們可以靈活地應用不同的策略,使用中間結果來指導探索。
核心優勢
- 開源透明: 完全開源,社群可以審查和改進
- 高度可配置: 支援自訂模型、搜尋工具和報告結構
- 多架構支援: 提供工作流程和多代理兩種實現方式
- 廣泛相容: 支援多種 AI 模型供應商和搜尋 API
- 人機互動: 支援使用者回饋和報告計畫審批
- 專業化設計: 針對不同任務使用專業的模型
未來發展
專案正在持續發展中,計畫加入更多功能和改進:
- 擴展多代理架構對更多搜尋工具的支援
- 改進報告生成品質
- 增強使用者互動體驗
- 優化效能和資源利用
總結
Open Deep Research 代表了開源 AI 研究工具的重要進步,它不僅提供了與商業產品競爭的功能,還保持了開源專案的透明性和可客製化性。無論是研究人員、開發者還是企業使用者,都可以根據自己的需求客製化和部署這個強大的研究助手。