Un potente marco de trabajo de código abierto para construir, ejecutar y evaluar agentes inteligentes autónomos, que admite la generación automática de configuraciones, la integración de herramientas multimodales y capacidades de investigación profunda.

NOASSERTIONPythonyoutu-agentTencentCloudADP 2.8k Last Updated: September 11, 2025

Detalles del Proyecto Youtu-Agent

Resumen del Proyecto

Youtu-Agent es un framework de agente flexible y de alto rendimiento, diseñado específicamente para construir, ejecutar y evaluar agentes inteligentes autónomos. Este framework no solo destaca en los benchmarks, sino que también ofrece potentes capacidades de agente basadas en modelos de código abierto, incluyendo funciones como análisis de datos, procesamiento de archivos e investigación profunda.

Origen del Proyecto

Características Principales

🌟 Rendimiento Verificado

  • WebWalkerQA: Logra un 71.47% de precisión (pass@1) utilizando DeepSeek-V3.1
  • Benchmark GAIA: Alcanza un 72.8% de pass@1 en el subconjunto de texto
  • Modelos Puramente de Código Abierto: Utiliza completamente los modelos de la serie DeepSeek-V3, sin depender de Claude o GPT

🚀 Amigable con el Código Abierto y Consciente de los Costos

  • Optimizado para una implementación accesible y de bajo costo, sin depender de modelos de código cerrado
  • Soporta múltiples APIs de modelos, desde DeepSeek hasta gpt-oss
  • Cuenta con integración de herramientas y una implementación de framework escalables

💡 Escenarios de Aplicación Práctica

El framework ofrece soporte para tareas listas para usar:

  • Análisis de datos CSV
  • Revisión de literatura
  • Organización de archivos personales
  • Generación de podcasts y videos (próximamente)
  • Informes de investigación profunda
  • Generación de páginas web

🛠️ Diseño de Arquitectura Flexible

  • Diseño Modular: Componentes clave como Environment y ContextManager están bien encapsulados y son altamente personalizables
  • Configuración YAML: Configuración estructurada basada en YAML, fácil de gestionar
  • Completamente Asíncrono: Logra alto rendimiento y ejecución eficiente, especialmente adecuado para la evaluación de benchmarks
  • Rastreo y Análisis: Ofrece análisis profundo de llamadas a herramientas y trayectorias de agentes

Arquitectura del Sistema

Componentes Principales

  1. Agente (Agent): Un LLM configurado con prompts, herramientas y un entorno específicos
  2. Toolkit (Conjunto de Herramientas): Una colección de herramientas encapsuladas que el agente puede utilizar
  3. Entorno (Environment): El mundo en el que opera el agente (ej. navegador, Shell)
  4. ContextManager (Gestor de Contexto): Un módulo configurable que gestiona la ventana de contexto del agente
  5. Benchmark (Evaluación Comparativa): Un flujo de trabajo encapsulado para conjuntos de datos específicos

Modos de Agente

El framework soporta dos modos principales de agente:

  • SimpleAgent: El modelo clásico de un solo agente, que utiliza un ciclo de razonamiento-acción (estilo ReAct)
  • OrchestraAgent: Un sistema multi-agente que utiliza una estrategia de planificación-ejecución, coordinando planificadores, trabajadores e informantes

Instalación y Inicio Rápido

Requisitos del Sistema

  • Python 3.12+
  • Se recomienda usar uv para la gestión de dependencias

Pasos de Instalación

# Clonar el repositorio
git clone https://github.com/TencentCloudADP/youtu-agent.git
cd youtu-agent

# Sincronizar dependencias
uv sync # O usar make sync

# Activar el entorno virtual
source ./.venv/bin/activate

# Copiar el archivo de configuración del entorno
cp .env.example .env

Configuración del Entorno

Configure las claves API necesarias en el archivo .env:

# Configuración de LLM (ejemplo de DeepSeek)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-chat
UTU_LLM_BASE_URL=https://api.deepseek.com/v1
UTU_LLM_API_KEY=replace-to-your-api-key

# API de DeepSeek de Tencent Cloud (los nuevos usuarios pueden obtener 3 millones de tokens gratis)
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1
UTU_LLM_API_KEY=replace-with-your-api-key

# Claves API de herramientas
SERPER_API_KEY=<Obtener de https://serper.dev/playground>
JINA_API_KEY=<Obtener de https://jina.ai/reader>

Modo de Uso

1. Conversación Básica

# Iniciar el chatbot interactivo con la configuración predeterminada
python scripts/cli_chat.py --stream --config default

# Versión básica sin herramientas de búsqueda
python scripts/cli_chat.py --stream --config base

2. Generación Automática de Configuración de Agente

Una característica destacada de Youtu-Agent es su capacidad para generar automáticamente configuraciones de agente. A diferencia de otros frameworks que requieren escribir código o elaborar prompts complejos, Youtu-Agent utiliza configuraciones YAML sencillas, y un "meta-agente" incorporado interactúa con usted para entender sus necesidades, generando y guardando la configuración automáticamente.

# Generar configuración de forma interactiva
python scripts/gen_simple_agent.py

# Ejecutar la configuración generada
python scripts/cli_chat.py --stream --config generated/xxx

3. Aplicaciones de Ejemplo

Generación de Imágenes SVG

python examples/svg_generator/main.py

Versión con Interfaz Web (UI)

# Descargar el paquete frontend
curl -LO https://github.com/Tencent/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl

# Instalar el paquete frontend
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl

# Ejecutar la versión web
python examples/svg_generator/main_web.py

Acceda a http://127.0.0.1:8848/ para usar la interfaz web.

4. Evaluación de Benchmarks

# Preparar el conjunto de datos (descargar y procesar el conjunto de datos WebWalkerQA)
python scripts/data/process_web_walker_qa.py

# Ejecutar la evaluación
python scripts/run_eval.py --config_name ww --exp_id <your_exp_id> --dataset WebWalkerQA_15 --concurrency 5

Casos de Uso Prácticos

Análisis de Datos

El agente puede analizar archivos CSV y generar informes HTML, identificando automáticamente patrones de datos, creando gráficos visuales e informes de insights.

Gestión de Archivos

El agente es capaz de renombrar y clasificar archivos locales, organizando automáticamente la estructura de documentos según su contenido.

Investigación Exhaustiva

Similar a la funcionalidad de Manus, recopila una gran cantidad de información para generar informes de investigación completos.

Análisis de Artículos Científicos

Analiza un artículo dado, realiza un análisis y compila la literatura relevante para producir resultados finales.

Características Técnicas

1. Diseño Minimalista

El framework se esfuerza por ser simple y fácil de usar, evitando sobrecargas innecesarias.

2. Procesamiento en Streaming y Rastreo

Basado en el SDK de openai-agents, hereda las capacidades de procesamiento en streaming, rastreo y ciclos de agente.

3. Sistema de Análisis Profundo

Además de OTEL, el sistema DBTracingProcessor ofrece un análisis profundo de las llamadas a herramientas y las trayectorias de los agentes.

4. Recopilación de Trayectorias

Soporta la recopilación de datos para fines de entrenamiento e investigación.

Audiencia Objetivo

Investigadores

  • Ofrece potentes benchmarks de código abierto y una arquitectura flexible
  • Soporta el entrenamiento de modelos, evaluación e investigación de ablación
  • Scripts de evaluación con un solo clic simplifican el proceso experimental

Desarrolladores de Aplicaciones

  • Casos de uso prácticos y scaffolding fácil de usar
  • Construcción rápida de aplicaciones de agente del mundo real

Entusiastas de la IA y los Agentes

  • Ejemplos abundantes y herramientas de desarrollo intuitivas
  • Fácil de empezar, ideal para aprender y explorar

Equipos Técnicos Empresariales

  • Soporta despliegues de bajo costo y modelos de código abierto
  • Adecuado para aplicaciones como atención al cliente inteligente, análisis de datos en entornos empresariales

Educadores y Estudiantes

  • Ofrece funciones como aprendizaje personalizado y calificación automática
  • Ayuda en el proceso de enseñanza y aprendizaje

Desarrollo Futuro

La hoja de ruta del proyecto incluye:

  • Evaluación de herramientas y optimización automatizada
  • Generación de herramientas personalizadas
  • Expansión de la integración de herramientas multimodales
  • Mejora de la cobertura de benchmarks
  • Perfeccionamiento del sistema de rastreo y análisis

Comunidad y Soporte

Cita

Si encuentra este proyecto útil, por favor considere citarlo:

@misc{youtu-agent-2025,
title={Youtu-agent: A Simple yet Powerful Agent Framework},
author={Tencent Youtu Lab},
year={2025},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}},
}

Resumen

Youtu-Agent es un framework de agente de código abierto potente y fácil de usar, que ofrece a los desarrolladores una solución completa para construir aplicaciones de IA de alto rendimiento. Su filosofía de diseño basada en modelos de código abierto, su excelente rendimiento y sus ricas características funcionales lo convierten en una herramienta importante en el campo del desarrollo de agentes. Ya sea para fines de investigación o aplicaciones comerciales, Youtu-Agent puede proporcionar a los usuarios soluciones de agente fiables y eficientes.

Star History Chart