TencentCloudADP/youtu-agent View GitHub Homepage for Latest Official Releases

Un potente marco de trabajo de código abierto para construir, ejecutar y evaluar agentes inteligentes autónomos, que admite la generación automática de configuraciones, la integración de herramientas multimodales y capacidades de investigación profunda.

NOASSERTIONPythonyoutu-agentTencentCloudADP 4.0k Last Updated: December 15, 2025

Detalles del Proyecto Youtu-Agent

Resumen del Proyecto

Youtu-Agent es un framework de agente flexible y de alto rendimiento, diseñado específicamente para construir, ejecutar y evaluar agentes inteligentes autónomos. Este framework no solo destaca en los benchmarks, sino que también ofrece potentes capacidades de agente basadas en modelos de código abierto, incluyendo funciones como análisis de datos, procesamiento de archivos e investigación profunda.

Origen del Proyecto

Desarrollador: Tencent Youtu Lab
Dirección del Proyecto: https://github.com/TencentCloudADP/youtu-agent
Licencia de Código Abierto: Completamente de código abierto
Framework Base: Construido sobre openai-agents

Características Principales

🌟 Rendimiento Verificado

WebWalkerQA: Logra un 71.47% de precisión (pass@1) utilizando DeepSeek-V3.1
Benchmark GAIA: Alcanza un 72.8% de pass@1 en el subconjunto de texto
Modelos Puramente de Código Abierto: Utiliza completamente los modelos de la serie DeepSeek-V3, sin depender de Claude o GPT

🚀 Amigable con el Código Abierto y Consciente de los Costos

Optimizado para una implementación accesible y de bajo costo, sin depender de modelos de código cerrado
Soporta múltiples APIs de modelos, desde DeepSeek hasta gpt-oss
Cuenta con integración de herramientas y una implementación de framework escalables

💡 Escenarios de Aplicación Práctica

El framework ofrece soporte para tareas listas para usar:

Análisis de datos CSV
Revisión de literatura
Organización de archivos personales
Generación de podcasts y videos (próximamente)
Informes de investigación profunda
Generación de páginas web

🛠️ Diseño de Arquitectura Flexible

Diseño Modular: Componentes clave como Environment y ContextManager están bien encapsulados y son altamente personalizables
Configuración YAML: Configuración estructurada basada en YAML, fácil de gestionar
Completamente Asíncrono: Logra alto rendimiento y ejecución eficiente, especialmente adecuado para la evaluación de benchmarks
Rastreo y Análisis: Ofrece análisis profundo de llamadas a herramientas y trayectorias de agentes

Arquitectura del Sistema

Componentes Principales

Agente (Agent): Un LLM configurado con prompts, herramientas y un entorno específicos
Toolkit (Conjunto de Herramientas): Una colección de herramientas encapsuladas que el agente puede utilizar
Entorno (Environment): El mundo en el que opera el agente (ej. navegador, Shell)
ContextManager (Gestor de Contexto): Un módulo configurable que gestiona la ventana de contexto del agente
Benchmark (Evaluación Comparativa): Un flujo de trabajo encapsulado para conjuntos de datos específicos

Modos de Agente

El framework soporta dos modos principales de agente:

SimpleAgent: El modelo clásico de un solo agente, que utiliza un ciclo de razonamiento-acción (estilo ReAct)
OrchestraAgent: Un sistema multi-agente que utiliza una estrategia de planificación-ejecución, coordinando planificadores, trabajadores e informantes

Instalación y Inicio Rápido

Requisitos del Sistema

Python 3.12+
Se recomienda usar uv para la gestión de dependencias

Pasos de Instalación

# Clonar el repositorio
git clone https://github.com/TencentCloudADP/youtu-agent.git
cd youtu-agent

# Sincronizar dependencias
uv sync # O usar make sync

# Activar el entorno virtual
source ./.venv/bin/activate

# Copiar el archivo de configuración del entorno
cp .env.example .env

Configuración del Entorno

Configure las claves API necesarias en el archivo .env:

# Configuración de LLM (ejemplo de DeepSeek)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-chat
UTU_LLM_BASE_URL=https://api.deepseek.com/v1
UTU_LLM_API_KEY=replace-to-your-api-key

# API de DeepSeek de Tencent Cloud (los nuevos usuarios pueden obtener 3 millones de tokens gratis)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1
UTU_LLM_API_KEY=replace-with-your-api-key

# Claves API de herramientas
SERPER_API_KEY=<Obtener de https://serper.dev/playground>
JINA_API_KEY=<Obtener de https://jina.ai/reader>

Modo de Uso

1. Conversación Básica

# Iniciar el chatbot interactivo con la configuración predeterminada
python scripts/cli_chat.py --stream --config default

# Versión básica sin herramientas de búsqueda
python scripts/cli_chat.py --stream --config base

2. Generación Automática de Configuración de Agente

Una característica destacada de Youtu-Agent es su capacidad para generar automáticamente configuraciones de agente. A diferencia de otros frameworks que requieren escribir código o elaborar prompts complejos, Youtu-Agent utiliza configuraciones YAML sencillas, y un "meta-agente" incorporado interactúa con usted para entender sus necesidades, generando y guardando la configuración automáticamente.

# Generar configuración de forma interactiva
python scripts/gen_simple_agent.py

# Ejecutar la configuración generada
python scripts/cli_chat.py --stream --config generated/xxx

3. Aplicaciones de Ejemplo

Generación de Imágenes SVG

python examples/svg_generator/main.py

Versión con Interfaz Web (UI)

# Descargar el paquete frontend
curl -LO https://github.com/Tencent/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl

# Instalar el paquete frontend
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl

# Ejecutar la versión web
python examples/svg_generator/main_web.py

Acceda a http://127.0.0.1:8848/ para usar la interfaz web.

4. Evaluación de Benchmarks

# Preparar el conjunto de datos (descargar y procesar el conjunto de datos WebWalkerQA)
python scripts/data/process_web_walker_qa.py

# Ejecutar la evaluación
python scripts/run_eval.py --config_name ww --exp_id <your_exp_id> --dataset WebWalkerQA_15 --concurrency 5

Casos de Uso Prácticos

Análisis de Datos

El agente puede analizar archivos CSV y generar informes HTML, identificando automáticamente patrones de datos, creando gráficos visuales e informes de insights.

Gestión de Archivos

El agente es capaz de renombrar y clasificar archivos locales, organizando automáticamente la estructura de documentos según su contenido.

Investigación Exhaustiva

Similar a la funcionalidad de Manus, recopila una gran cantidad de información para generar informes de investigación completos.

Análisis de Artículos Científicos

Analiza un artículo dado, realiza un análisis y compila la literatura relevante para producir resultados finales.

Características Técnicas

1. Diseño Minimalista

El framework se esfuerza por ser simple y fácil de usar, evitando sobrecargas innecesarias.

2. Procesamiento en Streaming y Rastreo

Basado en el SDK de openai-agents, hereda las capacidades de procesamiento en streaming, rastreo y ciclos de agente.

3. Sistema de Análisis Profundo

Además de OTEL, el sistema DBTracingProcessor ofrece un análisis profundo de las llamadas a herramientas y las trayectorias de los agentes.

4. Recopilación de Trayectorias

Soporta la recopilación de datos para fines de entrenamiento e investigación.

Audiencia Objetivo

Investigadores

Ofrece potentes benchmarks de código abierto y una arquitectura flexible
Soporta el entrenamiento de modelos, evaluación e investigación de ablación
Scripts de evaluación con un solo clic simplifican el proceso experimental

Desarrolladores de Aplicaciones

Casos de uso prácticos y scaffolding fácil de usar
Construcción rápida de aplicaciones de agente del mundo real

Entusiastas de la IA y los Agentes

Ejemplos abundantes y herramientas de desarrollo intuitivas
Fácil de empezar, ideal para aprender y explorar

Equipos Técnicos Empresariales

Soporta despliegues de bajo costo y modelos de código abierto
Adecuado para aplicaciones como atención al cliente inteligente, análisis de datos en entornos empresariales

Educadores y Estudiantes

Ofrece funciones como aprendizaje personalizado y calificación automática
Ayuda en el proceso de enseñanza y aprendizaje

Desarrollo Futuro

La hoja de ruta del proyecto incluye:

Evaluación de herramientas y optimización automatizada
Generación de herramientas personalizadas
Expansión de la integración de herramientas multimodales
Mejora de la cobertura de benchmarks
Perfeccionamiento del sistema de rastreo y análisis

Comunidad y Soporte

Documentación: https://tencentcloudadp.github.io/youtu-agent/
Comunidad de Discord: https://discord.gg/svwuqgUx
Soluciones Empresariales: Plataforma de Desarrollo de Agentes de Tencent Cloud (ADP)

Cita

Si encuentra este proyecto útil, por favor considere citarlo:

@misc{youtu-agent-2025,
title={Youtu-agent: A Simple yet Powerful Agent Framework},
author={Tencent Youtu Lab},
year={2025},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}},
}

Resumen

Youtu-Agent es un framework de agente de código abierto potente y fácil de usar, que ofrece a los desarrolladores una solución completa para construir aplicaciones de IA de alto rendimiento. Su filosofía de diseño basada en modelos de código abierto, su excelente rendimiento y sus ricas características funcionales lo convierten en una herramienta importante en el campo del desarrollo de agentes. Ya sea para fines de investigación o aplicaciones comerciales, Youtu-Agent puede proporcionar a los usuarios soluciones de agente fiables y eficientes.