一個開源的深度研究助手,使用AI智能體自動進行深度研究並生成綜合性報告

MITPythonopen_deep_researchlangchain-ai 7.2k Last Updated: August 06, 2025

Open Deep Research 專案詳細介紹

專案概述

Open Deep Research 是由 LangChain AI 開發的一個實驗性、完全開源的深度研究助手,能夠自動化深度研究並生成任何主題的綜合性報告。此專案的核心目標是提供一個簡單、可配置的開源解決方案,以與 OpenAI、Anthropic、Perplexity 和 Google 等公司的深度研究產品競爭。

核心特性

🎯 雙架構設計

專案提供兩種不同的實現方式,各有優勢:

  1. 工作流程架構(Workflow Architecture)

    • 結構化的計畫-執行工作流程
    • 人機互動循環,允許使用者回饋和批准報告計畫
    • 逐節建立,在搜尋迭代之間進行反思
    • 支援所有搜尋工具供應商
  2. 多代理架構(Multi-Agent Architecture)

    • 監督者-研究員架構
    • 多個獨立代理並行工作
    • 顯著減少報告生成時間
    • 專業化工具設計

🔧 高度可配置性

Open Deep Research 提供廣泛的配置選項來客製化研究過程和模型行為。所有配置都可以透過 Web UI、環境變數或直接修改配置來設定:

  • Max Structured Output Retries (預設: 3): 結構化輸出呼叫的最大重試次數
  • Allow Clarification (預設: true): 是否允許研究員在開始研究前詢問澄清問題
  • Max Concurrent Research Units (預設: 5): 使用子代理並發運行的最大研究單元數
  • Search API (預設: Tavily): 支援多種搜尋 API 選擇
  • Max Researcher Iterations (預設: 3): 研究監督者反思研究並提出後續問題的次數

🤖 多模型支援

Open Deep Research 為不同的研究任務使用多個專業化模型:

  • 摘要模型 (預設: openai:gpt-4.1-nano): 總結搜尋 API 的研究結果
  • 研究模型 (預設: openai:gpt-4.1): 進行研究和分析
  • 壓縮模型 (預設: openai:gpt-4.1-mini): 壓縮子代理的研​​究發現
  • 最終報告模型 (預設: openai:gpt-4.1): 撰寫最終綜合報告

所有模型都使用 init_chat_model() API 配置,支援 OpenAI、Anthropic、Google Vertex AI 等供應商。

🔍 豐富的搜尋工具整合

專案支援多種搜尋 API:

  • Tavily API - 通用網路搜尋
  • Perplexity API - 通用網路搜尋
  • Exa API - 強大的類神經網路搜尋
  • ArXiv - 物理、數學、電腦科學等學術論文
  • PubMed - 生物醫學文獻
  • Linkup API - 通用網路搜尋
  • DuckDuckGo API - 通用網路搜尋
  • Google Search API - 自訂搜尋引擎

技術架構

基於 LangGraph 建構

Open Deep Research 基於 LangGraph 建構,這是一個用於建構彈性語言代理圖的框架。這種架構使得專案能夠:

  • 靈活應用不同的研究策略
  • 使用中間結果指導探索
  • 處理開放式研究任務

三步驟研究流程

Open Deep Research 使用代理作為三步驟流程的一部分進行研究:

  1. 範圍界定(Scoping)

    • 使用者澄清:收集研究所需的所有使用者上下文
    • 簡要生成:將詳細的聊天互動轉換為綜合、專注的研究簡要
  2. 研究(Research)

    • 使用監督代理進行研究
    • 將研究任務委託給適當數量的子代理
    • 確定研究簡要是否可以分解為獨立的子主題
  3. 報告生成(Report Generation)

    • 一次性撰寫報告
    • 避免多代理並行寫作的協調困難

安裝和使用

快速開始

# 複製儲存庫
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research

# 設定環境變數
cp .env.example .env

# 安裝並啟動 LangGraph 伺服器
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking

作為 Python 套件安裝

pip install open-deep-research

使用方式

  1. 透過 Studio UI:

  2. Jupyter Notebook:

    • 查看範例:src/open_deep_research/graph.ipynb
    • 多代理範例:src/open_deep_research/multi_agent.ipynb

平台整合

Open Agent Platform (OAP)

Open Agent Platform (OAP) 是一個使用者介面,非技術使用者可以從中建構和配置自己的代理。OAP 非常適合讓使用者配置深度研究員,使用最適合他們需求的不同 MCP 工具和搜尋 API。

效能和評估

基準測試結果

根據結果,Open Deep Research 在基礎模型上持續顯著改善答案品質,這在 Llama、DeepSeek 和 Qwen 旗艦模型中都有體現,展現了工作流程的品質。

測試功能

# 使用預設 Anthropic 模型測試
python tests/run_test.py --all

# 使用 OpenAI o3 模型測試
python tests/run_test.py --all \
  --supervisor-model "openai:o3" \
  --researcher-model "openai:o3" \
  --planner-provider "openai" \
  --planner-model "o3" \
  --writer-provider "openai" \
  --writer-model "o3" \
  --eval-model "openai:o3" \
  --search-api "tavily"

部署選項

  • 本地部署: 透過 LangGraph 伺服器本地運行
  • 雲端部署: 可輕鬆部署到 LangGraph Platform

專案生態

相關專案

  • local-deep-researcher: 完全本地的網路研究和報告寫作助手
  • LangGraph: 建構彈性語言代理圖的框架
  • LangChain: 建構上下文感知推理應用程式

社群與開源

自 OpenAI 發布以來,開源社群在開發深度研究替代方案方面做出了卓越的努力。此專案旨在為社群提供一個可存取的開源深度研究工具包。

技術要求

模型相容性

  1. 結構化輸出支援: 所有模型必須支援結構化輸出
  2. 工具呼叫支援: 代理模型需要支援工具呼叫
  3. 搜尋 API 相容性: 研究和壓縮模型必須支援所選的搜尋 API

已測試模型

  • Claude 3.7
  • o3 和 o3-mini
  • gpt-4.1
  • llama-3.3-70b-versatile (透過 Groq)

優勢與特點

設計原則

Open Deep Research 的一個關鍵設計原則是靈活性,能夠根據請求探索不同的研究策略。代理非常適合研究,因為它們可以靈活地應用不同的策略,使用中間結果來指導探索。

核心優勢

  1. 開源透明: 完全開源,社群可以審查和改進
  2. 高度可配置: 支援自訂模型、搜尋工具和報告結構
  3. 多架構支援: 提供工作流程和多代理兩種實現方式
  4. 廣泛相容: 支援多種 AI 模型供應商和搜尋 API
  5. 人機互動: 支援使用者回饋和報告計畫審批
  6. 專業化設計: 針對不同任務使用專業的模型

未來發展

專案正在持續發展中,計畫加入更多功能和改進:

  • 擴展多代理架構對更多搜尋工具的支援
  • 改進報告生成品質
  • 增強使用者互動體驗
  • 優化效能和資源利用

總結

Open Deep Research 代表了開源 AI 研究工具的重要進步,它不僅提供了與商業產品競爭的功能,還保持了開源專案的透明性和可客製化性。無論是研究人員、開發者還是企業使用者,都可以根據自己的需求客製化和部署這個強大的研究助手。

Star History Chart