TencentCloudADP/youtu-agent View GitHub Homepage for Latest Official Releases

Un framework puissant pour construire, exécuter et évaluer des agents intelligents autonomes, basé sur des modèles open source, prenant en charge la génération automatique de configurations, l'intégration d'outils multimodaux et des capacités de recherche approfondies.

NOASSERTIONPythonyoutu-agentTencentCloudADP 4.0k Last Updated: December 15, 2025

Présentation détaillée du projet Youtu-Agent

Aperçu du projet

Youtu-Agent est un cadre d'agent intelligent flexible et performant, spécialement conçu pour la construction, l'exécution et l'évaluation d'agents autonomes. Ce cadre excelle non seulement dans les tests de référence, mais offre également de puissantes capacités d'agent basées sur des modèles open source, incluant des fonctionnalités telles que l'analyse de données, le traitement de fichiers et la recherche approfondie.

Origine du projet

Développeur: Tencent Youtu Lab
Adresse du projet: https://github.com/TencentCloudADP/youtu-agent
Licence Open Source: Entièrement open source
Cadre de base: Basé sur openai-agents

Caractéristiques principales

🌟 Performances vérifiées

WebWalkerQA: Atteint 71,47% de précision (pass@1) avec DeepSeek-V3.1
Benchmark GAIA: Obtient un score de 72,8% pass@1 sur le sous-ensemble de texte
Modèles purement open source: Utilise entièrement la série de modèles DeepSeek-V3, sans dépendre de Claude ou GPT

🚀 Favorable à l'open source et soucieux des coûts

Optimisé pour un déploiement accessible et à faible coût, sans dépendre de modèles propriétaires
Prend en charge diverses API de modèles, de DeepSeek à gpt-oss
Dispose d'une intégration d'outils et d'une implémentation de cadre extensibles

💡 Scénarios d'application réels

Le cadre offre un support de tâches prêt à l'emploi:

Analyse de données CSV
Revue de littérature
Organisation de fichiers personnels
Génération de podcasts et de vidéos (à venir)
Rapports de recherche approfondie
Génération de pages web

🛠️ Conception architecturale flexible

Conception modulaire: Les composants clés tels que Environment et ContextManager sont bien encapsulés et hautement personnalisables
Configuration YAML: Configuration structurée basée sur YAML, facile à gérer
Entièrement asynchrone: Permet des performances élevées et une exécution efficace, particulièrement adaptée à l'évaluation de benchmarks
Traçage et analyse: Fournit une analyse approfondie des appels d'outils et des trajectoires d'agents

Architecture du système

Composants clés

Agent: Un LLM configuré avec des invites, des outils et un environnement spécifiques
Toolkit (Boîte à outils): Une collection d'outils encapsulés que l'agent peut utiliser
Environment (Environnement): Le monde dans lequel l'agent opère (par exemple, navigateur, Shell)
ContextManager (Gestionnaire de contexte): Un module configurable qui gère la fenêtre de contexte de l'agent
Benchmark (Test de référence): Un flux de travail encapsulé pour des jeux de données spécifiques

Modes d'agent

Le cadre prend en charge deux modes d'agent principaux:

SimpleAgent: Le modèle classique à agent unique, utilisant une boucle de raisonnement-action (style ReAct)
OrchestraAgent: Un système multi-agents, utilisant une stratégie de planification-exécution, coordonnant les planificateurs, les travailleurs et les rapporteurs

Installation et démarrage rapide

Prérequis système

Python 3.12+
L'utilisation de uv pour la gestion des dépendances est recommandée

Étapes d'installation

# Cloner le dépôt
git clone https://github.com/TencentCloudADP/youtu-agent.git
cd youtu-agent

# Synchroniser les dépendances
uv sync # Ou utiliser make sync

# Activer l'environnement virtuel
source ./.venv/bin/activate

# Copier le fichier de configuration de l'environnement
cp .env.example .env

Configuration de l'environnement

Configurez les clés API nécessaires dans le fichier .env:

# Configuration LLM (exemple DeepSeek)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-chat
UTU_LLM_BASE_URL=https://api.deepseek.com/v1
UTU_LLM_API_KEY=remplacer-par-votre-cle-api

# API DeepSeek de Tencent Cloud (les nouveaux utilisateurs peuvent obtenir 3 millions de tokens gratuits)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1
UTU_LLM_API_KEY=remplacer-par-votre-cle-api

# Clés API des outils
SERPER_API_KEY=<Obtenir depuis https://serper.dev/playground>
JINA_API_KEY=<Obtenir depuis https://jina.ai/reader>

Mode d'emploi

1. Conversation de base

# Lancer un chatbot interactif avec la configuration par défaut
python scripts/cli_chat.py --stream --config default

# Version de base sans outil de recherche
python scripts/cli_chat.py --stream --config base

2. Génération automatique de configuration d'agent

Une caractéristique remarquable de Youtu-Agent est sa capacité à générer automatiquement des configurations d'agent. Contrairement à d'autres cadres qui nécessitent l'écriture de code ou la création minutieuse d'invites, Youtu-Agent utilise une configuration YAML simple, et un "méta-agent" intégré dialogue avec vous pour comprendre vos besoins, puis génère et enregistre automatiquement la configuration.

# Générer une configuration de manière interactive
python scripts/gen_simple_agent.py

# Exécuter la configuration générée
python scripts/cli_chat.py --stream --config generated/xxx

3. Exemples d'applications

Génération d'images SVG

python examples/svg_generator/main.py

Version Web UI

# Télécharger le package frontend
curl -LO https://github.com/Tencent/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl

# Installer le package frontend
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl

# Exécuter la version Web
python examples/svg_generator/main_web.py

Accédez à http://127.0.0.1:8848/ pour utiliser l'interface Web.

4. Évaluation des benchmarks

# Préparer le jeu de données (télécharger et traiter le jeu de données WebWalkerQA)
python scripts/data/process_web_walker_qa.py

# Exécuter l'évaluation
python scripts/run_eval.py --config_name ww --exp_id <votre_exp_id> --dataset WebWalkerQA_15 --concurrency 5

Cas d'utilisation réels

Analyse de données

L'agent peut analyser des fichiers CSV et générer des rapports HTML, identifiant automatiquement les modèles de données, générant des visualisations graphiques et des rapports d'insights.

Gestion de fichiers

L'agent est capable de renommer et de classer les fichiers locaux, organisant automatiquement la structure des documents en fonction de leur contenu.

Recherche approfondie

Similaire aux fonctionnalités de Manus, il collecte une grande quantité d'informations pour générer des rapports de recherche complets.

Analyse de publications

Analyse une publication donnée, effectue une analyse et compile la littérature pertinente pour produire un résultat final.

Caractéristiques techniques

1. Conception minimaliste

Le cadre s'efforce de rester simple et facile à utiliser, évitant les surcharges inutiles.

2. Traitement en continu et traçage

Basé sur le SDK openai-agents, il hérite des capacités de traitement en continu, de traçage et de boucles d'agent.

3. Système d'analyse approfondie

En plus d'OTEL, le système DBTracingProcessor offre une analyse approfondie des appels d'outils et des trajectoires d'agents.

4. Collecte de trajectoires

Prend en charge la collecte de données à des fins de formation et de recherche.

Public cible

Chercheurs

Fournit des benchmarks open source puissants et une architecture flexible
Prend en charge la formation, l'évaluation et les études d'ablation de modèles
Les scripts d'évaluation en un clic simplifient le processus expérimental

Développeurs d'applications

Cas d'utilisation pratiques et outils de démarrage rapide faciles à utiliser
Permet de construire rapidement des applications d'agent du monde réel

Passionnés d'IA et d'agents

Exemples riches et outils de développement intuitifs
Facile à prendre en main, idéal pour l'apprentissage et l'exploration

Équipes techniques d'entreprise

Prend en charge le déploiement à faible coût et les modèles open source
Convient aux applications telles que le service client intelligent et l'analyse de données en environnement d'entreprise

Éducateurs et étudiants

Offre des fonctionnalités telles que l'apprentissage personnalisé et la notation automatique
Aide les processus d'enseignement et d'apprentissage

Développement futur

La feuille de route du projet comprend:

Évaluation des outils et optimisation automatisée
Génération d'outils personnalisés
Extension de l'intégration d'outils multimodaux
Amélioration de la couverture des benchmarks
Perfectionnement du système de traçage et d'analyse

Communauté et support

Documentation: https://tencentcloudadp.github.io/youtu-agent/
Communauté Discord: https://discord.gg/svwuqgUx
Solutions d'entreprise: Plateforme de développement d'agents Tencent Cloud (ADP)

Citation

Si vous trouvez ce projet utile, veuillez envisager de le citer:

@misc{youtu-agent-2025,
title={Youtu-agent: A Simple yet Powerful Agent Framework},
author={Tencent Youtu Lab},
year={2025},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}},
}

Résumé

Youtu-Agent est un cadre d'agent open source puissant et facile à utiliser, offrant aux développeurs une solution complète pour la construction d'applications d'IA haute performance. Sa conception basée sur des modèles open source, ses performances exceptionnelles et ses riches fonctionnalités en font un outil important dans le domaine du développement d'agents. Que ce soit pour la recherche ou les applications commerciales, Youtu-Agent peut fournir aux utilisateurs des solutions d'agent fiables et efficaces.