基於開源模型構建、運行和評估自主智能體的強大框架,支持自動配置生成、多模態工具集成和深度研究能力

NOASSERTIONPythonyoutu-agentTencentCloudADP 2.8k Last Updated: September 11, 2025

Youtu-Agent 專案詳細介紹

專案概述

Youtu-Agent 是一個靈活、高效能的智能體框架,專門用於建構、運行和評估自主智能代理。該框架不僅在基準測試中表現卓越,還基於開源模型提供強大的智能體能力,包括數據分析、檔案處理和深度研究等功能。

專案來源

核心特性

🌟 驗證的效能表現

  • WebWalkerQA: 使用 DeepSeek-V3.1 實現 71.47% 準確率 (pass@1)
  • GAIA 基準測試: 在文本子集上達到 72.8% pass@1 成績
  • 純開源模型: 完全使用 DeepSeek-V3 系列模型,無需依賴 Claude 或 GPT

🚀 開源友善和成本意識

  • 專為可存取、低成本部署而優化,無需依賴閉源模型
  • 支援多種模型 API,從 DeepSeek 到 gpt-oss
  • 具有可擴展的工具整合和框架實現

💡 實際應用場景

框架提供開箱即用的任務支援:

  • CSV 數據分析
  • 文獻綜述
  • 個人檔案整理
  • 播客和影片生成(即將推出)
  • 深度研究報告
  • 網頁生成

🛠️ 靈活的架構設計

  • 模組化設計: 關鍵組件如 Environment 和 ContextManager 封裝完善且高度可客製化
  • YAML 配置: 基於 YAML 的結構化配置,易於管理
  • 全非同步: 實現高效能和高效執行,特別適合基準測試評估
  • 追蹤和分析: 提供深度的工具呼叫和智能體軌跡分析

系統架構

核心組件

  1. Agent (智能體): 配置了特定提示、工具和環境的 LLM
  2. Toolkit (工具集): 智能體可以使用的封裝工具集合
  3. Environment (環境): 智能體運行的世界(如瀏覽器、Shell)
  4. ContextManager (上下文管理器): 管理智能體上下文視窗的可配置模組
  5. Benchmark (基準測試): 特定數據集的封裝工作流程

智能體模式

框架支援兩種主要的智能體模式:

  • SimpleAgent: 經典的單智能體模型,採用推理-行動循環 (ReAct 風格)
  • OrchestraAgent: 多智能體系統,使用計畫-執行策略,協調規劃器、工作者和報告者

安裝和快速開始

系統要求

  • Python 3.12+
  • 推薦使用 uv 進行依賴管理

安裝步驟

# 克隆儲存庫
git clone https://github.com/TencentCloudADP/youtu-agent.git
cd youtu-agent

# 同步依賴
uv sync # 或者使用 make sync

# 啟用虛擬環境
source ./.venv/bin/activate

# 複製環境配置文件
cp .env.example .env

環境配置

.env 檔案中配置必要的 API 金鑰:

# LLM 配置 (DeepSeek 範例)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-chat
UTU_LLM_BASE_URL=https://api.deepseek.com/v1
UTU_LLM_API_KEY=replace-to-your-api-key

# 騰訊雲 DeepSeek API (新用戶可獲得300萬免費 tokens)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1
UTU_LLM_API_KEY=replace-with-your-api-key

# 工具 API 金鑰
SERPER_API_KEY=<從 https://serper.dev/playground 獲取>
JINA_API_KEY=<從 https://jina.ai/reader 獲取>

使用方法

1. 基礎對話

# 啟動預設配置的互動式聊天機器人
python scripts/cli_chat.py --stream --config default

# 不使用搜尋工具的基礎版本
python scripts/cli_chat.py --stream --config base

2. 自動生成智能體配置

Youtu-Agent 的一個突出特性是能夠自動生成智能體配置。與其他需要編寫程式碼或精心製作提示的框架不同,Youtu-Agent 使用簡單的 YAML 配置,內建的「元智能體」與您對話以了解需求,然後自動生成和保存配置。

# 互動式生成配置
python scripts/gen_simple_agent.py

# 運行生成的配置
python scripts/cli_chat.py --stream --config generated/xxx

3. 範例應用

SVG 圖像生成

python examples/svg_generator/main.py

Web UI 版本

# 下載前端套件
curl -LO https://github.com/Tencent/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl

# 安裝前端套件
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl

# 運行 Web 版本
python examples/svg_generator/main_web.py

訪問 http://127.0.0.1:8848/ 即可使用 Web 介面。

4. 基準測試評估

# 準備數據集(下載並處理 WebWalkerQA 數據集)
python scripts/data/process_web_walker_qa.py

# 運行評估
python scripts/run_eval.py --config_name ww --exp_id <your_exp_id> --dataset WebWalkerQA_15 --concurrency 5

實際應用案例

數據分析

智能體可以分析 CSV 檔案並生成 HTML 報告,自動識別數據模式、生成視覺化圖表和洞察報告。

檔案管理

智能體能夠重新命名和分類本地檔案,根據內容自動整理文件結構。

廣泛研究

類似 Manus 功能,收集大量資訊生成綜合性研究報告。

論文分析

解析給定論文,執行分析,並編譯相關文獻以產生最終結果。

技術特色

1. 最小化設計

框架努力保持簡單易用,避免不必要的開銷。

2. 流式處理和追蹤

基於 openai-agents SDK,繼承了流式處理、追蹤和智能體循環能力。

3. 深度分析系統

除了 OTEL,DBTracingProcessor 系統提供工具呼叫和智能體軌跡的深度分析。

4. 軌跡收集

支援用於訓練和研究目的的數據收集。

目標用戶群體

研究人員

  • 提供強大的開源基準和靈活架構
  • 支援模型訓練、評估和消融研究
  • 一鍵評估腳本簡化實驗過程

應用開發者

  • 實用的使用案例和易用的鷹架
  • 快速建構現實世界的智能體應用

AI 和智能體愛好者

  • 豐富的範例和直觀的開發工具
  • 易於上手,適合學習和探索

企業技術團隊

  • 支援低成本部署和開源模型
  • 適用於企業環境中的智能客服、數據分析等應用

教育工作者和學生

  • 提供個人化學習和自動評分等功能
  • 幫助教學和學習過程

未來發展

專案路線圖包括:

  • 工具評估和自動化優化
  • 客製化工具生成
  • 擴展多模態工具整合
  • 增強基準測試覆蓋
  • 完善追蹤和分析系統

社區和支援

引用

如果您發現這個專案有用,請考慮引用:

@misc{youtu-agent-2025,
title={Youtu-agent: A Simple yet Powerful Agent Framework},
author={Tencent Youtu Lab},
year={2025},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}},
}

總結

Youtu-Agent 是一個功能強大、易於使用的開源智能體框架,為開發者提供了建構高效能 AI 應用的完整解決方案。其基於開源模型的設計理念、出色的效能表現以及豐富的功能特性,使其成為智能體開發領域的重要工具。無論是研究用途還是商業應用,Youtu-Agent 都能為用戶提供可靠、高效的智能體解決方案。

Star History Chart