オープンソースモデルを基盤に、自律型インテリジェントエージェントの構築、実行、評価を行うための強力なフレームワーク。自動構成生成、マルチモーダルツール統合、および高度な研究能力をサポート。
Youtu-Agent プロジェクト詳細紹介
プロジェクト概要
Youtu-Agent は、自律型AIエージェントの構築、実行、評価に特化した、柔軟で高性能なエージェントフレームワークです。このフレームワークは、ベンチマークテストで優れた性能を発揮するだけでなく、データ分析、ファイル処理、深層研究などの機能を含む、オープンソースモデルに基づいた強力なエージェント能力を提供します。
プロジェクトソース
- 開発元: テンセント優図ラボ (Tencent Youtu Lab)
- プロジェクトアドレス: https://github.com/TencentCloudADP/youtu-agent
- オープンソースライセンス: 完全オープンソース
- 基本フレームワーク: openai-agents をベースに構築
主要な特徴
🌟 検証済みの性能
- WebWalkerQA: DeepSeek-V3.1 を使用し、71.47% の精度 (pass@1) を達成
- GAIA ベンチマーク: テキストサブセットで 72.8% の pass@1 スコアを達成
- 純粋なオープンソースモデル: Claude や GPT に依存せず、DeepSeek-V3 シリーズモデルのみを使用
🚀 オープンソースフレンドリーかつコスト意識
- アクセシブルで低コストなデプロイメント向けに最適化されており、クローズドソースモデルへの依存は不要
- DeepSeek から gpt-oss まで、複数のモデルAPIをサポート
- 拡張可能なツール統合とフレームワーク実装を提供
💡 実際の応用シナリオ
フレームワークは、すぐに使えるタスクサポートを提供します:
- CSVデータ分析
- 文献レビュー
- 個人ファイル整理
- ポッドキャストおよびビデオ生成(近日公開予定)
- 深層研究レポート
- ウェブページ生成
🛠️ 柔軟なアーキテクチャ設計
- モジュール設計: Environment や ContextManager などの主要コンポーネントは完全にカプセル化され、高度にカスタマイズ可能
- YAML設定: YAMLベースの構造化された設定で、管理が容易
- 完全非同期: 高性能かつ効率的な実行を実現し、特にベンチマーク評価に適しています
- 追跡と分析: ツール呼び出しとエージェントの軌跡に関する詳細な分析を提供
システムアーキテクチャ
コアコンポーネント
- Agent (エージェント): 特定のプロンプト、ツール、環境が設定されたLLM
- Toolkit (ツールキット): エージェントが使用できるカプセル化されたツールの集合
- Environment (環境): エージェントが動作する世界(例:ブラウザ、シェル)
- ContextManager (コンテキストマネージャー): エージェントのコンテキストウィンドウを管理する設定可能なモジュール
- Benchmark (ベンチマーク): 特定のデータセットのカプセル化されたワークフロー
エージェントモード
フレームワークは、主に2つのエージェントモードをサポートしています:
- SimpleAgent: 推論-行動ループ (ReActスタイル) を採用した古典的な単一エージェントモデル
- OrchestraAgent: プランナー、ワーカー、レポーターを調整する計画-実行戦略を使用するマルチエージェントシステム
インストールとクイックスタート
システム要件
- Python 3.12+
- 依存関係管理には uv の使用を推奨
インストール手順
# リポジトリをクローン
git clone https://github.com/TencentCloudADP/youtu-agent.git
cd youtu-agent
# 依存関係を同期
uv sync # または make sync を使用
# 仮想環境をアクティブ化
source ./.venv/bin/activate
# 環境設定ファイルをコピー
cp .env.example .env
環境設定
.env
ファイルに必要なAPIキーを設定します:
# LLM設定 (DeepSeekの例)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-chat
UTU_LLM_BASE_URL=https://api.deepseek.com/v1
UTU_LLM_API_KEY=replace-to-your-api-key
# テンセントクラウド DeepSeek API (新規ユーザーは300万トークンを無料で利用可能)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1
UTU_LLM_API_KEY=replace-with-your-api-key
# ツールAPIキー
SERPER_API_KEY=< https://serper.dev/playground から取得 >
JINA_API_KEY=< https://jina.ai/reader から取得 >
使用方法
1. 基本的な会話
# デフォルト設定のインタラクティブなチャットボットを起動
python scripts/cli_chat.py --stream --config default
# 検索ツールを使用しない基本バージョン
python scripts/cli_chat.py --stream --config base
2. エージェント設定の自動生成
Youtu-Agent の際立った特徴の一つは、エージェント設定を自動生成できることです。コードを書いたり、プロンプトを丹念に作成したりする必要がある他のフレームワークとは異なり、Youtu-Agent はシンプルな YAML 設定を使用し、組み込みの「メタエージェント」がユーザーと対話して要件を理解し、自動的に設定を生成して保存します。
# インタラクティブに設定を生成
python scripts/gen_simple_agent.py
# 生成された設定を実行
python scripts/cli_chat.py --stream --config generated/xxx
3. サンプルアプリケーション
SVG画像生成
python examples/svg_generator/main.py
Web UI版
# フロントエンドパッケージをダウンロード
curl -LO https://github.com/Tencent/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl
# フロントエンドパッケージをインストール
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl
# Web版を実行
python examples/svg_generator/main_web.py
http://127.0.0.1:8848/ にアクセスしてWebインターフェースを使用できます。
4. ベンチマーク評価
# データセットの準備(WebWalkerQAデータセットをダウンロードして処理)
python scripts/data/process_web_walker_qa.py
# 評価を実行
python scripts/run_eval.py --config_name ww --exp_id <your_exp_id> --dataset WebWalkerQA_15 --concurrency 5
実際の応用事例
データ分析
エージェントはCSVファイルを分析し、HTMLレポートを生成できます。データパターンを自動的に識別し、視覚化グラフと洞察レポートを作成します。
ファイル管理
エージェントはローカルファイルの名前変更と分類を行い、コンテンツに基づいてドキュメント構造を自動的に整理できます。
広範な研究
Manus機能と同様に、大量の情報を収集して包括的な研究レポートを生成します。
論文分析
与えられた論文を解析し、分析を実行し、関連文献をコンパイルして最終結果を生成します。
技術的特徴
1. 最小限のデザイン
フレームワークは、不要なオーバーヘッドを避け、シンプルで使いやすい状態を保つよう努めています。
2. ストリーミングと追跡
openai-agents SDK をベースにしており、ストリーミング処理、追跡、エージェントループの機能を継承しています。
3. 深層分析システム
OTELに加えて、DBTracingProcessorシステムはツール呼び出しとエージェントの軌跡の詳細な分析を提供します。
4. 軌跡収集
トレーニングおよび研究目的のデータ収集をサポートします。
ターゲットユーザー層
研究者
- 強力なオープンソースベンチマークと柔軟なアーキテクチャを提供
- モデルのトレーニング、評価、アブレーション研究をサポート
- ワンクリック評価スクリプトで実験プロセスを簡素化
アプリケーション開発者
- 実用的なユースケースと使いやすいスキャフォールディング
- 現実世界のエージェントアプリケーションを迅速に構築
AIおよびエージェント愛好家
- 豊富なサンプルと直感的な開発ツール
- 習得しやすく、学習と探索に適しています
企業技術チーム
- 低コストデプロイメントとオープンソースモデルをサポート
- 企業環境におけるスマートカスタマーサービス、データ分析などのアプリケーションに適しています
教育者と学生
- 個別学習や自動採点などの機能を提供
- 教育と学習プロセスを支援
将来の発展
プロジェクトのロードマップには以下が含まれます:
- ツール評価と自動最適化
- カスタムツール生成
- マルチモーダルツール統合の拡張
- ベンチマークカバレッジの強化
- 追跡および分析システムの改善
コミュニティとサポート
- ドキュメント: https://tencentcloudadp.github.io/youtu-agent/
- Discordコミュニティ: https://discord.gg/svwuqgUx
- 企業ソリューション: テンセントクラウドエージェント開発プラットフォーム (ADP)
引用
このプロジェクトが役立つと感じた場合は、以下の引用をご検討ください:
@misc{youtu-agent-2025,
title={Youtu-agent: A Simple yet Powerful Agent Framework},
author={Tencent Youtu Lab},
year={2025},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}},
}
まとめ
Youtu-Agent は、強力で使いやすいオープンソースのエージェントフレームワークであり、開発者に高性能なAIアプリケーションを構築するための完全なソリューションを提供します。オープンソースモデルに基づいた設計思想、優れた性能、豊富な機能により、エージェント開発分野における重要なツールとなっています。研究用途であろうと商用アプリケーションであろうと、Youtu-Agent はユーザーに信頼性の高い、効率的なエージェントソリューションを提供できます。