Home
Login

Un sistema de agente web inteligente desarrollado por el laboratorio Tongyi de Alibaba, que incluye los componentes WebWalker, WebDancer y WebSailor, y se centra en la búsqueda autónoma de información y las tareas de navegación web.

MITPython 3.1kAlibaba-NLPWebAgent Last Updated: 2025-07-10

WebAgent - Sistema Inteligente de Agente Web

Resumen del Proyecto

WebAgent es un innovador sistema inteligente de agente web desarrollado por el Laboratorio Tongyi de Alibaba, centrado en tareas de búsqueda autónoma de información y navegación web. Este proyecto integra múltiples componentes avanzados con el objetivo de construir un agente inteligente capaz de ejecutar de forma autónoma complejas tareas de recuperación de información y recorrido web.

Componentes Principales

1. WebWalker (ACL 2025)

  • Posicionamiento Funcional: Herramienta de evaluación comparativa para modelos de lenguaje grandes en tareas de recorrido web.
  • Características Clave:
    • Proporciona un marco estandarizado para la evaluación del recorrido web.
    • Soporta la búsqueda de información colaborativa entre múltiples agentes.
    • Ofrece métricas de evaluación cuantitativas para la capacidad de navegación web de los LLM.

2. WebDancer (Preimpresión 2025)

  • Posicionamiento Funcional: Marco de entrenamiento de extremo a extremo para agentes de búsqueda de información autónoma.
  • Características Clave:
    • Modelo nativo de inferencia de búsqueda inteligente, utilizando el marco ReAct.
    • Implementa agentes de búsqueda de información autónoma y modelos de tipo investigación profunda.
    • Paradigma de entrenamiento de cuatro fases:
      1. Construcción de datos de navegación
      2. Muestreo de trayectorias
      3. Ajuste fino supervisado (para un arranque en frío efectivo)
      4. Aprendizaje por refuerzo (para mejorar la capacidad de generalización)

3. WebSailor

  • Posicionamiento Funcional: Amplía el alcance funcional de los agentes web.
  • Características Clave: Proporciona capacidades más amplias de operación y navegación web.

Características Técnicas

Enfoque Centrado en Datos

  • Ajuste Fino Supervisado a Nivel de Trayectoria: Entrenamiento del modelo mediante datos de trayectoria precisos.
  • Integración de Aprendizaje por Refuerzo: Adopta la tecnología DAPO (Optimización de Políticas Aumentada por Datos).
  • Pipeline de Entrenamiento Escalable: Soporta dos modos de entrenamiento: SFT (Ajuste Fino Supervisado) y RL (Aprendizaje por Refuerzo).

Capacidad de Aprendizaje Autónomo

  • El agente inteligente puede adquirir de forma autónoma habilidades de búsqueda e inferencia.
  • Soporta tareas de inferencia complejas de múltiples pasos y de larga duración.
  • Logra el procesamiento de extremo a extremo de recorrido web, búsqueda de información y preguntas y respuestas.

Rendimiento

Según la documentación del proyecto, WebDancer muestra un rendimiento excelente en las pruebas de referencia estándar:

  • Prueba de referencia GAIA: Puntuación Pass@3 del 61.1%.
  • Prueba de referencia WebWalkerQA: Puntuación Pass@3 del 54.6%.

Escenarios de Aplicación

Tipos de Tareas Soportadas

  • Recorrido Web: Navegación inteligente y exploración de páginas.
  • Búsqueda de Información: Recopilación y organización autónoma de información.
  • Sistemas de Preguntas y Respuestas: Preguntas y respuestas complejas basadas en el contenido web.
  • Inferencia de Larga Duración: Tareas de razonamiento lógico complejas de múltiples pasos.

Entornos de Demostración

El proyecto ofrece varios entornos de demostración:

  • Demostración de WebWalkerQA
  • Demostración de la prueba de referencia GAIA
  • Demostración de escenarios de uso diario

Arquitectura Técnica

Paradigma de Entrenamiento

1. Construcción de datos de navegación → 2. Muestreo de trayectorias → 3. Ajuste fino supervisado → 4. Aprendizaje por refuerzo

Pila Tecnológica Principal

  • Marco Base: ReAct (Razonamiento y Actuación)
  • Método de Entrenamiento: SFT + RL (Ajuste Fino Supervisado + Aprendizaje por Refuerzo)
  • Procesamiento de Datos: DAPO (Optimización de Políticas Aumentada por Datos)

Conclusión

WebAgent representa el último avance en la tecnología de agentes web inteligentes, logrando capacidades autónomas de búsqueda de información y navegación en entornos web complejos mediante la integración de múltiples componentes avanzados y la adopción de un método de entrenamiento centrado en datos. Este proyecto no solo ha tenido un impacto significativo en el ámbito académico, sino que también proporciona una sólida base tecnológica para aplicaciones prácticas.

Star History Chart