一个开源的深度研究助手,使用AI智能体自动进行深度研究并生成综合性报告
Open Deep Research 项目详细介绍
项目概述
Open Deep Research 是由 LangChain AI 开发的一个实验性、完全开源的深度研究助手,能够自动化深度研究并生成任何主题的综合性报告。该项目的核心目标是提供一个简单、可配置的开源解决方案,与 OpenAI、Anthropic、Perplexity 和 Google 等公司的深度研究产品相竞争。
核心特性
🎯 双架构设计
项目提供两种不同的实现方式,各有优势:
工作流架构(Workflow Architecture)
- 结构化的计划-执行工作流程
- 人机交互循环,允许用户反馈和批准报告计划
- 逐节创建,在搜索迭代之间进行反思
- 支持所有搜索工具提供商
多智能体架构(Multi-Agent Architecture)
- 监督者-研究员架构
- 多个独立智能体并行工作
- 显著减少报告生成时间
- 专门化工具设计
🔧 高度可配置性
Open Deep Research 提供广泛的配置选项来定制研究过程和模型行为。所有配置都可以通过Web UI、环境变量或直接修改配置来设置:
- Max Structured Output Retries (默认: 3): 结构化输出调用的最大重试次数
- Allow Clarification (默认: true): 是否允许研究员在开始研究前询问澄清问题
- Max Concurrent Research Units (默认: 5): 使用子智能体并发运行的最大研究单元数
- Search API (默认: Tavily): 支持多种搜索API选择
- Max Researcher Iterations (默认: 3): 研究监督者反思研究并提出后续问题的次数
🤖 多模型支持
Open Deep Research 为不同的研究任务使用多个专门化模型:
- 摘要模型 (默认: openai:gpt-4.1-nano): 总结搜索API的研究结果
- 研究模型 (默认: openai:gpt-4.1): 进行研究和分析
- 压缩模型 (默认: openai:gpt-4.1-mini): 压缩子智能体的研究发现
- 最终报告模型 (默认: openai:gpt-4.1): 撰写最终综合报告
所有模型都使用 init_chat_model() API 配置,支持 OpenAI、Anthropic、Google Vertex AI 等提供商。
🔍 丰富的搜索工具集成
项目支持多种搜索API:
- Tavily API - 通用网络搜索
- Perplexity API - 通用网络搜索
- Exa API - 强大的神经网络搜索
- ArXiv - 物理、数学、计算机科学等学术论文
- PubMed - 生物医学文献
- Linkup API - 通用网络搜索
- DuckDuckGo API - 通用网络搜索
- Google Search API - 自定义搜索引擎
技术架构
基于 LangGraph 构建
Open Deep Research 基于 LangGraph 构建,这是一个用于构建弹性语言智能体图的框架。这种架构使得项目能够:
- 灵活应用不同的研究策略
- 使用中间结果指导探索
- 处理开放式研究任务
三步研究流程
Open Deep Research 使用智能体作为三步流程的一部分进行研究:
范围界定(Scoping)
- 用户澄清:收集研究所需的所有用户上下文
- 简要生成:将详细的聊天交互转换为综合、专注的研究简要
研究(Research)
- 使用监督智能体进行研究
- 将研究任务委托给适当数量的子智能体
- 确定研究简要是否可以分解为独立的子主题
报告生成(Report Generation)
- 一次性撰写报告
- 避免多智能体并行写作的协调困难
安装和使用
快速开始
# 克隆仓库
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research
# 设置环境变量
cp .env.example .env
# 安装并启动 LangGraph 服务器
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking
作为 Python 包安装
pip install open-deep-research
使用方式
通过 Studio UI:
- 🚀 API: http://127.0.0.1:2024
- 🎨 Studio UI: https://smith.langchain.com/studio/?baseUrl=http://127.0.0.1:2024
- 📚 API Docs: http://127.0.0.1:2024/docs
Jupyter Notebook:
- 查看示例:
src/open_deep_research/graph.ipynb
- 多智能体示例:
src/open_deep_research/multi_agent.ipynb
- 查看示例:
平台集成
Open Agent Platform (OAP)
Open Agent Platform (OAP) 是一个用户界面,非技术用户可以从中构建和配置自己的智能体。OAP 非常适合让用户配置深度研究员,使用最适合他们需求的不同 MCP 工具和搜索API。
性能和评估
基准测试结果
根据结果,Open Deep Research 在基础模型上持续显著改善答案质量,这在 Llama、DeepSeek 和 Qwen 旗舰模型中都有体现,展现了工作流的质量。
测试功能
# 使用默认 Anthropic 模型测试
python tests/run_test.py --all
# 使用 OpenAI o3 模型测试
python tests/run_test.py --all \
--supervisor-model "openai:o3" \
--researcher-model "openai:o3" \
--planner-provider "openai" \
--planner-model "o3" \
--writer-provider "openai" \
--writer-model "o3" \
--eval-model "openai:o3" \
--search-api "tavily"
部署选项
- 本地部署: 通过 LangGraph 服务器本地运行
- 云部署: 可轻松部署到 LangGraph Platform
项目生态
相关项目
- local-deep-researcher: 完全本地的网络研究和报告写作助手
- LangGraph: 构建弹性语言智能体图的框架
- LangChain: 构建上下文感知推理应用程序
社区和开源
自 OpenAI 发布以来,开源社区在开发深度研究替代方案方面做出了卓越的努力。该项目旨在为社区提供一个可访问的开源深度研究工具包。
技术要求
模型兼容性
- 结构化输出支持: 所有模型必须支持结构化输出
- 工具调用支持: 智能体模型需要支持工具调用
- 搜索API兼容性: 研究和压缩模型必须支持所选的搜索API
已测试模型
- Claude 3.7
- o3 和 o3-mini
- gpt-4.1
- llama-3.3-70b-versatile (通过 Groq)
优势与特点
设计原则
Open Deep Research 的一个关键设计原则是灵活性,能够根据请求探索不同的研究策略。智能体非常适合研究,因为它们可以灵活地应用不同的策略,使用中间结果来指导探索。
核心优势
- 开源透明: 完全开源,社区可以审查和改进
- 高度可配置: 支持自定义模型、搜索工具和报告结构
- 多架构支持: 提供工作流和多智能体两种实现方式
- 广泛兼容: 支持多种AI模型提供商和搜索API
- 人机交互: 支持用户反馈和报告计划审批
- 专业化设计: 针对不同任务使用专门的模型
未来发展
项目正在持续发展中,计划加入更多功能和改进:
- 扩展多智能体架构对更多搜索工具的支持
- 改进报告生成质量
- 增强用户交互体验
- 优化性能和资源利用
总结
Open Deep Research 代表了开源AI研究工具的重要进步,它不仅提供了与商业产品竞争的功能,还保持了开源项目的透明性和可定制性。无论是研究人员、开发者还是企业用户,都可以根据自己的需求定制和部署这个强大的研究助手。