一个开源的深度研究助手,使用AI智能体自动进行深度研究并生成综合性报告

MITPythonopen_deep_researchlangchain-ai 7.2k Last Updated: August 06, 2025

Open Deep Research 项目详细介绍

项目概述

Open Deep Research 是由 LangChain AI 开发的一个实验性、完全开源的深度研究助手,能够自动化深度研究并生成任何主题的综合性报告。该项目的核心目标是提供一个简单、可配置的开源解决方案,与 OpenAI、Anthropic、Perplexity 和 Google 等公司的深度研究产品相竞争。

核心特性

🎯 双架构设计

项目提供两种不同的实现方式,各有优势:

  1. 工作流架构(Workflow Architecture)

    • 结构化的计划-执行工作流程
    • 人机交互循环,允许用户反馈和批准报告计划
    • 逐节创建,在搜索迭代之间进行反思
    • 支持所有搜索工具提供商
  2. 多智能体架构(Multi-Agent Architecture)

    • 监督者-研究员架构
    • 多个独立智能体并行工作
    • 显著减少报告生成时间
    • 专门化工具设计

🔧 高度可配置性

Open Deep Research 提供广泛的配置选项来定制研究过程和模型行为。所有配置都可以通过Web UI、环境变量或直接修改配置来设置:

  • Max Structured Output Retries (默认: 3): 结构化输出调用的最大重试次数
  • Allow Clarification (默认: true): 是否允许研究员在开始研究前询问澄清问题
  • Max Concurrent Research Units (默认: 5): 使用子智能体并发运行的最大研究单元数
  • Search API (默认: Tavily): 支持多种搜索API选择
  • Max Researcher Iterations (默认: 3): 研究监督者反思研究并提出后续问题的次数

🤖 多模型支持

Open Deep Research 为不同的研究任务使用多个专门化模型:

  • 摘要模型 (默认: openai:gpt-4.1-nano): 总结搜索API的研究结果
  • 研究模型 (默认: openai:gpt-4.1): 进行研究和分析
  • 压缩模型 (默认: openai:gpt-4.1-mini): 压缩子智能体的研究发现
  • 最终报告模型 (默认: openai:gpt-4.1): 撰写最终综合报告

所有模型都使用 init_chat_model() API 配置,支持 OpenAI、Anthropic、Google Vertex AI 等提供商。

🔍 丰富的搜索工具集成

项目支持多种搜索API:

  • Tavily API - 通用网络搜索
  • Perplexity API - 通用网络搜索
  • Exa API - 强大的神经网络搜索
  • ArXiv - 物理、数学、计算机科学等学术论文
  • PubMed - 生物医学文献
  • Linkup API - 通用网络搜索
  • DuckDuckGo API - 通用网络搜索
  • Google Search API - 自定义搜索引擎

技术架构

基于 LangGraph 构建

Open Deep Research 基于 LangGraph 构建,这是一个用于构建弹性语言智能体图的框架。这种架构使得项目能够:

  • 灵活应用不同的研究策略
  • 使用中间结果指导探索
  • 处理开放式研究任务

三步研究流程

Open Deep Research 使用智能体作为三步流程的一部分进行研究:

  1. 范围界定(Scoping)

    • 用户澄清:收集研究所需的所有用户上下文
    • 简要生成:将详细的聊天交互转换为综合、专注的研究简要
  2. 研究(Research)

    • 使用监督智能体进行研究
    • 将研究任务委托给适当数量的子智能体
    • 确定研究简要是否可以分解为独立的子主题
  3. 报告生成(Report Generation)

    • 一次性撰写报告
    • 避免多智能体并行写作的协调困难

安装和使用

快速开始

# 克隆仓库
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research

# 设置环境变量
cp .env.example .env

# 安装并启动 LangGraph 服务器
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking

作为 Python 包安装

pip install open-deep-research

使用方式

  1. 通过 Studio UI:

  2. Jupyter Notebook:

    • 查看示例:src/open_deep_research/graph.ipynb
    • 多智能体示例:src/open_deep_research/multi_agent.ipynb

平台集成

Open Agent Platform (OAP)

Open Agent Platform (OAP) 是一个用户界面,非技术用户可以从中构建和配置自己的智能体。OAP 非常适合让用户配置深度研究员,使用最适合他们需求的不同 MCP 工具和搜索API。

性能和评估

基准测试结果

根据结果,Open Deep Research 在基础模型上持续显著改善答案质量,这在 Llama、DeepSeek 和 Qwen 旗舰模型中都有体现,展现了工作流的质量。

测试功能

# 使用默认 Anthropic 模型测试
python tests/run_test.py --all

# 使用 OpenAI o3 模型测试
python tests/run_test.py --all \
  --supervisor-model "openai:o3" \
  --researcher-model "openai:o3" \
  --planner-provider "openai" \
  --planner-model "o3" \
  --writer-provider "openai" \
  --writer-model "o3" \
  --eval-model "openai:o3" \
  --search-api "tavily"

部署选项

  • 本地部署: 通过 LangGraph 服务器本地运行
  • 云部署: 可轻松部署到 LangGraph Platform

项目生态

相关项目

  • local-deep-researcher: 完全本地的网络研究和报告写作助手
  • LangGraph: 构建弹性语言智能体图的框架
  • LangChain: 构建上下文感知推理应用程序

社区和开源

自 OpenAI 发布以来,开源社区在开发深度研究替代方案方面做出了卓越的努力。该项目旨在为社区提供一个可访问的开源深度研究工具包。

技术要求

模型兼容性

  1. 结构化输出支持: 所有模型必须支持结构化输出
  2. 工具调用支持: 智能体模型需要支持工具调用
  3. 搜索API兼容性: 研究和压缩模型必须支持所选的搜索API

已测试模型

  • Claude 3.7
  • o3 和 o3-mini
  • gpt-4.1
  • llama-3.3-70b-versatile (通过 Groq)

优势与特点

设计原则

Open Deep Research 的一个关键设计原则是灵活性,能够根据请求探索不同的研究策略。智能体非常适合研究,因为它们可以灵活地应用不同的策略,使用中间结果来指导探索。

核心优势

  1. 开源透明: 完全开源,社区可以审查和改进
  2. 高度可配置: 支持自定义模型、搜索工具和报告结构
  3. 多架构支持: 提供工作流和多智能体两种实现方式
  4. 广泛兼容: 支持多种AI模型提供商和搜索API
  5. 人机交互: 支持用户反馈和报告计划审批
  6. 专业化设计: 针对不同任务使用专门的模型

未来发展

项目正在持续发展中,计划加入更多功能和改进:

  • 扩展多智能体架构对更多搜索工具的支持
  • 改进报告生成质量
  • 增强用户交互体验
  • 优化性能和资源利用

总结

Open Deep Research 代表了开源AI研究工具的重要进步,它不仅提供了与商业产品竞争的功能,还保持了开源项目的透明性和可定制性。无论是研究人员、开发者还是企业用户,都可以根据自己的需求定制和部署这个强大的研究助手。

Star History Chart