基于开源模型构建、运行和评估自主智能体的强大框架,支持自动配置生成、多模态工具集成和深度研究能力

NOASSERTIONPythonyoutu-agentTencentCloudADP 2.8k Last Updated: September 11, 2025

Youtu-Agent 项目详细介绍

项目概述

Youtu-Agent 是一个灵活、高性能的智能体框架,专门用于构建、运行和评估自主智能代理。该框架不仅在基准测试中表现卓越,还基于开源模型提供强大的智能体能力,包括数据分析、文件处理和深度研究等功能。

项目来源

核心特性

🌟 验证的性能表现

  • WebWalkerQA: 使用 DeepSeek-V3.1 实现 71.47% 准确率 (pass@1)
  • GAIA 基准测试: 在文本子集上达到 72.8% pass@1 成绩
  • 纯开源模型: 完全使用 DeepSeek-V3 系列模型,无需依赖 Claude 或 GPT

🚀 开源友好和成本意识

  • 专为可访问、低成本部署而优化,无需依赖闭源模型
  • 支持多种模型 API,从 DeepSeek 到 gpt-oss
  • 具有可扩展的工具集成和框架实现

💡 实际应用场景

框架提供开箱即用的任务支持:

  • CSV 数据分析
  • 文献综述
  • 个人文件整理
  • 播客和视频生成(即将推出)
  • 深度研究报告
  • 网页生成

🛠️ 灵活的架构设计

  • 模块化设计: 关键组件如 Environment 和 ContextManager 封装完善且高度可定制
  • YAML 配置: 基于 YAML 的结构化配置,易于管理
  • 全异步: 实现高性能和高效执行,特别适合基准测试评估
  • 追踪和分析: 提供深度的工具调用和智能体轨迹分析

系统架构

核心组件

  1. Agent (智能体): 配置了特定提示、工具和环境的 LLM
  2. Toolkit (工具集): 智能体可以使用的封装工具集合
  3. Environment (环境): 智能体运行的世界(如浏览器、Shell)
  4. ContextManager (上下文管理器): 管理智能体上下文窗口的可配置模块
  5. Benchmark (基准测试): 特定数据集的封装工作流程

智能体模式

框架支持两种主要的智能体模式:

  • SimpleAgent: 经典的单智能体模型,采用推理-行动循环 (ReAct 风格)
  • OrchestraAgent: 多智能体系统,使用计划-执行策略,协调规划器、工作者和报告者

安装和快速开始

系统要求

  • Python 3.12+
  • 推荐使用 uv 进行依赖管理

安装步骤

# 克隆仓库
git clone https://github.com/TencentCloudADP/youtu-agent.git
cd youtu-agent

# 同步依赖
uv sync # 或者使用 make sync

# 激活虚拟环境
source ./.venv/bin/activate

# 复制环境配置文件
cp .env.example .env

环境配置

.env 文件中配置必要的 API 密钥:

# LLM 配置 (DeepSeek 示例)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-chat
UTU_LLM_BASE_URL=https://api.deepseek.com/v1
UTU_LLM_API_KEY=replace-to-your-api-key

# 腾讯云 DeepSeek API (新用户可获得300万免费 tokens)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1
UTU_LLM_API_KEY=replace-with-your-api-key

# 工具 API 密钥
SERPER_API_KEY=<从 https://serper.dev/playground 获取>
JINA_API_KEY=<从 https://jina.ai/reader 获取>

使用方法

1. 基础对话

# 启动默认配置的交互式聊天机器人
python scripts/cli_chat.py --stream --config default

# 不使用搜索工具的基础版本
python scripts/cli_chat.py --stream --config base

2. 自动生成智能体配置

Youtu-Agent 的一个突出特性是能够自动生成智能体配置。与其他需要编写代码或精心制作提示的框架不同,Youtu-Agent 使用简单的 YAML 配置,内置的"元智能体"与您对话以了解需求,然后自动生成和保存配置。

# 交互式生成配置
python scripts/gen_simple_agent.py

# 运行生成的配置
python scripts/cli_chat.py --stream --config generated/xxx

3. 示例应用

SVG 图像生成

python examples/svg_generator/main.py

Web UI 版本

# 下载前端包
curl -LO https://github.com/Tencent/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl

# 安装前端包
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl

# 运行 Web 版本
python examples/svg_generator/main_web.py

访问 http://127.0.0.1:8848/ 即可使用 Web 界面。

4. 基准测试评估

# 准备数据集(下载并处理 WebWalkerQA 数据集)
python scripts/data/process_web_walker_qa.py

# 运行评估
python scripts/run_eval.py --config_name ww --exp_id <your_exp_id> --dataset WebWalkerQA_15 --concurrency 5

实际应用案例

数据分析

智能体可以分析 CSV 文件并生成 HTML 报告,自动识别数据模式、生成可视化图表和洞察报告。

文件管理

智能体能够重命名和分类本地文件,根据内容自动整理文档结构。

广泛研究

类似 Manus 功能,收集大量信息生成综合性研究报告。

论文分析

解析给定论文,执行分析,并编译相关文献以产生最终结果。

技术特色

1. 最小化设计

框架努力保持简单易用,避免不必要的开销。

2. 流式处理和追踪

基于 openai-agents SDK,继承了流式处理、追踪和智能体循环能力。

3. 深度分析系统

除了 OTEL,DBTracingProcessor 系统提供工具调用和智能体轨迹的深度分析。

4. 轨迹收集

支持用于训练和研究目的的数据收集。

目标用户群体

研究人员

  • 提供强大的开源基准和灵活架构
  • 支持模型训练、评估和消融研究
  • 一键评估脚本简化实验过程

应用开发者

  • 实用的使用案例和易用的脚手架
  • 快速构建现实世界的智能体应用

AI 和智能体爱好者

  • 丰富的示例和直观的开发工具
  • 易于上手,适合学习和探索

企业技术团队

  • 支持低成本部署和开源模型
  • 适用于企业环境中的智能客服、数据分析等应用

教育工作者和学生

  • 提供个性化学习和自动评分等功能
  • 帮助教学和学习过程

未来发展

项目路线图包括:

  • 工具评估和自动化优化
  • 定制工具生成
  • 扩展多模态工具集成
  • 增强基准测试覆盖
  • 完善追踪和分析系统

社区和支持

引用

如果您发现这个项目有用,请考虑引用:

@misc{youtu-agent-2025,
title={Youtu-agent: A Simple yet Powerful Agent Framework},
author={Tencent Youtu Lab},
year={2025},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}},
}

总结

Youtu-Agent 是一个功能强大、易于使用的开源智能体框架,为开发者提供了构建高性能 AI 应用的完整解决方案。其基于开源模型的设计理念、出色的性能表现以及丰富的功能特性,使其成为智能体开发领域的重要工具。无论是研究用途还是商业应用,Youtu-Agent 都能为用户提供可靠、高效的智能体解决方案。

Star History Chart