Un framework puissant pour construire, exécuter et évaluer des agents intelligents autonomes, basé sur des modèles open source, prenant en charge la génération automatique de configurations, l'intégration d'outils multimodaux et des capacités de recherche approfondies.
Présentation détaillée du projet Youtu-Agent
Aperçu du projet
Youtu-Agent est un cadre d'agent intelligent flexible et performant, spécialement conçu pour la construction, l'exécution et l'évaluation d'agents autonomes. Ce cadre excelle non seulement dans les tests de référence, mais offre également de puissantes capacités d'agent basées sur des modèles open source, incluant des fonctionnalités telles que l'analyse de données, le traitement de fichiers et la recherche approfondie.
Origine du projet
- Développeur: Tencent Youtu Lab
- Adresse du projet: https://github.com/TencentCloudADP/youtu-agent
- Licence Open Source: Entièrement open source
- Cadre de base: Basé sur
openai-agents
Caractéristiques principales
🌟 Performances vérifiées
- WebWalkerQA: Atteint 71,47% de précision (pass@1) avec DeepSeek-V3.1
- Benchmark GAIA: Obtient un score de 72,8% pass@1 sur le sous-ensemble de texte
- Modèles purement open source: Utilise entièrement la série de modèles DeepSeek-V3, sans dépendre de Claude ou GPT
🚀 Favorable à l'open source et soucieux des coûts
- Optimisé pour un déploiement accessible et à faible coût, sans dépendre de modèles propriétaires
- Prend en charge diverses API de modèles, de DeepSeek à gpt-oss
- Dispose d'une intégration d'outils et d'une implémentation de cadre extensibles
💡 Scénarios d'application réels
Le cadre offre un support de tâches prêt à l'emploi:
- Analyse de données CSV
- Revue de littérature
- Organisation de fichiers personnels
- Génération de podcasts et de vidéos (à venir)
- Rapports de recherche approfondie
- Génération de pages web
🛠️ Conception architecturale flexible
- Conception modulaire: Les composants clés tels que
Environment
etContextManager
sont bien encapsulés et hautement personnalisables - Configuration YAML: Configuration structurée basée sur YAML, facile à gérer
- Entièrement asynchrone: Permet des performances élevées et une exécution efficace, particulièrement adaptée à l'évaluation de benchmarks
- Traçage et analyse: Fournit une analyse approfondie des appels d'outils et des trajectoires d'agents
Architecture du système
Composants clés
- Agent: Un LLM configuré avec des invites, des outils et un environnement spécifiques
- Toolkit (Boîte à outils): Une collection d'outils encapsulés que l'agent peut utiliser
- Environment (Environnement): Le monde dans lequel l'agent opère (par exemple, navigateur, Shell)
- ContextManager (Gestionnaire de contexte): Un module configurable qui gère la fenêtre de contexte de l'agent
- Benchmark (Test de référence): Un flux de travail encapsulé pour des jeux de données spécifiques
Modes d'agent
Le cadre prend en charge deux modes d'agent principaux:
- SimpleAgent: Le modèle classique à agent unique, utilisant une boucle de raisonnement-action (style ReAct)
- OrchestraAgent: Un système multi-agents, utilisant une stratégie de planification-exécution, coordonnant les planificateurs, les travailleurs et les rapporteurs
Installation et démarrage rapide
Prérequis système
- Python 3.12+
- L'utilisation de
uv
pour la gestion des dépendances est recommandée
Étapes d'installation
# Cloner le dépôt
git clone https://github.com/TencentCloudADP/youtu-agent.git
cd youtu-agent
# Synchroniser les dépendances
uv sync # Ou utiliser make sync
# Activer l'environnement virtuel
source ./.venv/bin/activate
# Copier le fichier de configuration de l'environnement
cp .env.example .env
Configuration de l'environnement
Configurez les clés API nécessaires dans le fichier .env
:
# Configuration LLM (exemple DeepSeek)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-chat
UTU_LLM_BASE_URL=https://api.deepseek.com/v1
UTU_LLM_API_KEY=remplacer-par-votre-cle-api
# API DeepSeek de Tencent Cloud (les nouveaux utilisateurs peuvent obtenir 3 millions de tokens gratuits)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1
UTU_LLM_API_KEY=remplacer-par-votre-cle-api
# Clés API des outils
SERPER_API_KEY=<Obtenir depuis https://serper.dev/playground>
JINA_API_KEY=<Obtenir depuis https://jina.ai/reader>
Mode d'emploi
1. Conversation de base
# Lancer un chatbot interactif avec la configuration par défaut
python scripts/cli_chat.py --stream --config default
# Version de base sans outil de recherche
python scripts/cli_chat.py --stream --config base
2. Génération automatique de configuration d'agent
Une caractéristique remarquable de Youtu-Agent est sa capacité à générer automatiquement des configurations d'agent. Contrairement à d'autres cadres qui nécessitent l'écriture de code ou la création minutieuse d'invites, Youtu-Agent utilise une configuration YAML simple, et un "méta-agent" intégré dialogue avec vous pour comprendre vos besoins, puis génère et enregistre automatiquement la configuration.
# Générer une configuration de manière interactive
python scripts/gen_simple_agent.py
# Exécuter la configuration générée
python scripts/cli_chat.py --stream --config generated/xxx
3. Exemples d'applications
Génération d'images SVG
python examples/svg_generator/main.py
Version Web UI
# Télécharger le package frontend
curl -LO https://github.com/Tencent/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl
# Installer le package frontend
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl
# Exécuter la version Web
python examples/svg_generator/main_web.py
Accédez à http://127.0.0.1:8848/ pour utiliser l'interface Web.
4. Évaluation des benchmarks
# Préparer le jeu de données (télécharger et traiter le jeu de données WebWalkerQA)
python scripts/data/process_web_walker_qa.py
# Exécuter l'évaluation
python scripts/run_eval.py --config_name ww --exp_id <votre_exp_id> --dataset WebWalkerQA_15 --concurrency 5
Cas d'utilisation réels
Analyse de données
L'agent peut analyser des fichiers CSV et générer des rapports HTML, identifiant automatiquement les modèles de données, générant des visualisations graphiques et des rapports d'insights.
Gestion de fichiers
L'agent est capable de renommer et de classer les fichiers locaux, organisant automatiquement la structure des documents en fonction de leur contenu.
Recherche approfondie
Similaire aux fonctionnalités de Manus, il collecte une grande quantité d'informations pour générer des rapports de recherche complets.
Analyse de publications
Analyse une publication donnée, effectue une analyse et compile la littérature pertinente pour produire un résultat final.
Caractéristiques techniques
1. Conception minimaliste
Le cadre s'efforce de rester simple et facile à utiliser, évitant les surcharges inutiles.
2. Traitement en continu et traçage
Basé sur le SDK openai-agents
, il hérite des capacités de traitement en continu, de traçage et de boucles d'agent.
3. Système d'analyse approfondie
En plus d'OTEL, le système DBTracingProcessor
offre une analyse approfondie des appels d'outils et des trajectoires d'agents.
4. Collecte de trajectoires
Prend en charge la collecte de données à des fins de formation et de recherche.
Public cible
Chercheurs
- Fournit des benchmarks open source puissants et une architecture flexible
- Prend en charge la formation, l'évaluation et les études d'ablation de modèles
- Les scripts d'évaluation en un clic simplifient le processus expérimental
Développeurs d'applications
- Cas d'utilisation pratiques et outils de démarrage rapide faciles à utiliser
- Permet de construire rapidement des applications d'agent du monde réel
Passionnés d'IA et d'agents
- Exemples riches et outils de développement intuitifs
- Facile à prendre en main, idéal pour l'apprentissage et l'exploration
Équipes techniques d'entreprise
- Prend en charge le déploiement à faible coût et les modèles open source
- Convient aux applications telles que le service client intelligent et l'analyse de données en environnement d'entreprise
Éducateurs et étudiants
- Offre des fonctionnalités telles que l'apprentissage personnalisé et la notation automatique
- Aide les processus d'enseignement et d'apprentissage
Développement futur
La feuille de route du projet comprend:
- Évaluation des outils et optimisation automatisée
- Génération d'outils personnalisés
- Extension de l'intégration d'outils multimodaux
- Amélioration de la couverture des benchmarks
- Perfectionnement du système de traçage et d'analyse
Communauté et support
- Documentation: https://tencentcloudadp.github.io/youtu-agent/
- Communauté Discord: https://discord.gg/svwuqgUx
- Solutions d'entreprise: Plateforme de développement d'agents Tencent Cloud (ADP)
Citation
Si vous trouvez ce projet utile, veuillez envisager de le citer:
@misc{youtu-agent-2025,
title={Youtu-agent: A Simple yet Powerful Agent Framework},
author={Tencent Youtu Lab},
year={2025},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}},
}
Résumé
Youtu-Agent est un cadre d'agent open source puissant et facile à utiliser, offrant aux développeurs une solution complète pour la construction d'applications d'IA haute performance. Sa conception basée sur des modèles open source, ses performances exceptionnelles et ses riches fonctionnalités en font un outil important dans le domaine du développement d'agents. Que ce soit pour la recherche ou les applications commerciales, Youtu-Agent peut fournir aux utilisateurs des solutions d'agent fiables et efficaces.