langchain-ai/open_deep_researchView GitHub Homepage for Latest Official Releases

一个开源的深度研究助手，使用AI智能体自动进行深度研究并生成综合性报告

MITPythonopen_deep_researchlangchain-ai 7.2k Last Updated: August 06, 2025

Open Deep Research 项目详细介绍

项目概述

Open Deep Research 是由 LangChain AI 开发的一个实验性、完全开源的深度研究助手，能够自动化深度研究并生成任何主题的综合性报告。该项目的核心目标是提供一个简单、可配置的开源解决方案，与 OpenAI、Anthropic、Perplexity 和 Google 等公司的深度研究产品相竞争。

核心特性

🎯 双架构设计

项目提供两种不同的实现方式，各有优势：

工作流架构（Workflow Architecture）
- 结构化的计划-执行工作流程
- 人机交互循环，允许用户反馈和批准报告计划
- 逐节创建，在搜索迭代之间进行反思
- 支持所有搜索工具提供商
多智能体架构（Multi-Agent Architecture）
- 监督者-研究员架构
- 多个独立智能体并行工作
- 显著减少报告生成时间
- 专门化工具设计

🔧 高度可配置性

Open Deep Research 提供广泛的配置选项来定制研究过程和模型行为。所有配置都可以通过Web UI、环境变量或直接修改配置来设置：

Max Structured Output Retries (默认: 3): 结构化输出调用的最大重试次数
Allow Clarification (默认: true): 是否允许研究员在开始研究前询问澄清问题
Max Concurrent Research Units (默认: 5): 使用子智能体并发运行的最大研究单元数
Search API (默认: Tavily): 支持多种搜索API选择
Max Researcher Iterations (默认: 3): 研究监督者反思研究并提出后续问题的次数

🤖 多模型支持

Open Deep Research 为不同的研究任务使用多个专门化模型：

摘要模型 (默认: openai:gpt-4.1-nano): 总结搜索API的研究结果
研究模型 (默认: openai:gpt-4.1): 进行研究和分析
压缩模型 (默认: openai:gpt-4.1-mini): 压缩子智能体的研究发现
最终报告模型 (默认: openai:gpt-4.1): 撰写最终综合报告

所有模型都使用 init_chat_model() API 配置，支持 OpenAI、Anthropic、Google Vertex AI 等提供商。

🔍 丰富的搜索工具集成

项目支持多种搜索API：

Tavily API - 通用网络搜索
Perplexity API - 通用网络搜索
Exa API - 强大的神经网络搜索
ArXiv - 物理、数学、计算机科学等学术论文
PubMed - 生物医学文献
Linkup API - 通用网络搜索
DuckDuckGo API - 通用网络搜索
Google Search API - 自定义搜索引擎

技术架构

基于 LangGraph 构建

Open Deep Research 基于 LangGraph 构建，这是一个用于构建弹性语言智能体图的框架。这种架构使得项目能够：

灵活应用不同的研究策略
使用中间结果指导探索
处理开放式研究任务

三步研究流程

Open Deep Research 使用智能体作为三步流程的一部分进行研究：

范围界定（Scoping）
- 用户澄清：收集研究所需的所有用户上下文
- 简要生成：将详细的聊天交互转换为综合、专注的研究简要
研究（Research）
- 使用监督智能体进行研究
- 将研究任务委托给适当数量的子智能体
- 确定研究简要是否可以分解为独立的子主题
报告生成（Report Generation）
- 一次性撰写报告
- 避免多智能体并行写作的协调困难

安装和使用

快速开始

# 克隆仓库
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research

# 设置环境变量
cp .env.example .env

# 安装并启动 LangGraph 服务器
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking

作为 Python 包安装

pip install open-deep-research

使用方式

通过 Studio UI:
- 🚀 API: http://127.0.0.1:2024
- 🎨 Studio UI: https://smith.langchain.com/studio/?baseUrl=http://127.0.0.1:2024
- 📚 API Docs: http://127.0.0.1:2024/docs
Jupyter Notebook:
- 查看示例：src/open_deep_research/graph.ipynb
- 多智能体示例：src/open_deep_research/multi_agent.ipynb

平台集成

Open Agent Platform (OAP)

Open Agent Platform (OAP) 是一个用户界面，非技术用户可以从中构建和配置自己的智能体。OAP 非常适合让用户配置深度研究员，使用最适合他们需求的不同 MCP 工具和搜索API。

性能和评估

基准测试结果

根据结果，Open Deep Research 在基础模型上持续显著改善答案质量，这在 Llama、DeepSeek 和 Qwen 旗舰模型中都有体现，展现了工作流的质量。

测试功能

# 使用默认 Anthropic 模型测试
python tests/run_test.py --all

# 使用 OpenAI o3 模型测试
python tests/run_test.py --all \
  --supervisor-model "openai:o3" \
  --researcher-model "openai:o3" \
  --planner-provider "openai" \
  --planner-model "o3" \
  --writer-provider "openai" \
  --writer-model "o3" \
  --eval-model "openai:o3" \
  --search-api "tavily"

部署选项

本地部署: 通过 LangGraph 服务器本地运行
云部署: 可轻松部署到 LangGraph Platform

项目生态

社区和开源

自 OpenAI 发布以来，开源社区在开发深度研究替代方案方面做出了卓越的努力。该项目旨在为社区提供一个可访问的开源深度研究工具包。

技术要求

模型兼容性

结构化输出支持: 所有模型必须支持结构化输出
工具调用支持: 智能体模型需要支持工具调用
搜索API兼容性: 研究和压缩模型必须支持所选的搜索API

已测试模型

Claude 3.7
o3 和 o3-mini
gpt-4.1
llama-3.3-70b-versatile (通过 Groq)

优势与特点

设计原则

Open Deep Research 的一个关键设计原则是灵活性，能够根据请求探索不同的研究策略。智能体非常适合研究，因为它们可以灵活地应用不同的策略，使用中间结果来指导探索。

核心优势

开源透明: 完全开源，社区可以审查和改进
高度可配置: 支持自定义模型、搜索工具和报告结构
多架构支持: 提供工作流和多智能体两种实现方式
广泛兼容: 支持多种AI模型提供商和搜索API
人机交互: 支持用户反馈和报告计划审批
专业化设计: 针对不同任务使用专门的模型

未来发展

项目正在持续发展中，计划加入更多功能和改进：

扩展多智能体架构对更多搜索工具的支持
改进报告生成质量
增强用户交互体验
优化性能和资源利用

总结

Open Deep Research 代表了开源AI研究工具的重要进步，它不仅提供了与商业产品竞争的功能，还保持了开源项目的透明性和可定制性。无论是研究人员、开发者还是企业用户，都可以根据自己的需求定制和部署这个强大的研究助手。