Home
Login

Um sistema de agente web inteligente desenvolvido pelo Tongyi Laboratory da Alibaba, incluindo os componentes WebWalker, WebDancer e WebSailor, focado em tarefas autônomas de busca de informações e navegação na web.

MITPython 3.1kAlibaba-NLPWebAgent Last Updated: 2025-07-10

WebAgent - Sistema Inteligente de Agente Web

Visão Geral do Projeto

WebAgent é um sistema inovador de agente web inteligente desenvolvido pelo Tongyi Lab da Alibaba, focado em tarefas autônomas de busca de informações e navegação na web. Este projeto integra múltiplos componentes avançados, com o objetivo de construir um agente inteligente capaz de executar autonomamente tarefas complexas de recuperação de informações e travessia de páginas web.

Componentes Principais

1. WebWalker (ACL 2025)

  • Posicionamento Funcional: Ferramenta de benchmark para Modelos de Linguagem Grandes (LLMs) em tarefas de travessia de páginas web.
  • Características Principais:
    • Fornece uma estrutura padronizada para avaliação de travessia de páginas web.
    • Suporta busca de informações com colaboração multiagente.
    • Oferece métricas de avaliação quantitativas para a capacidade de navegação web de LLMs.

2. WebDancer (Pré-publicação 2025)

  • Posicionamento Funcional: Estrutura de treinamento de ponta a ponta para agentes autônomos de busca de informações.
  • Características Principais:
    • Modelo nativo de inferência de busca inteligente, utilizando a estrutura ReAct.
    • Implementa agentes autônomos de busca de informações e modelos de tipo pesquisa aprofundada.
    • Paradigma de treinamento em quatro fases:
      1. Construção de dados de navegação
      2. Amostragem de trajetória
      3. Ajuste fino supervisionado (para um "cold start" eficaz)
      4. Aprendizagem por Reforço (para melhorar a capacidade de generalização)

3. WebSailor

  • Posicionamento Funcional: Expande o escopo funcional dos agentes web.
  • Características Principais: Oferece capacidades mais amplas de operação e navegação na web.

Características Técnicas

Abordagem Centrada em Dados

  • Ajuste Fino Supervisionado ao Nível da Trajetória: Treinamento do modelo através de dados de trajetória precisos.
  • Integração de Aprendizagem por Reforço: Adota a tecnologia DAPO (Data-Augmented Policy Optimization).
  • Pipeline de Treinamento Escalável: Suporta dois modos de treinamento: SFT (Ajuste Fino Supervisionado) e RL (Aprendizagem por Reforço).

Capacidade de Aprendizagem Autônoma

  • O agente inteligente é capaz de adquirir autonomamente habilidades de busca e inferência.
  • Suporta tarefas de inferência complexas e multi-etapas com longa duração.
  • Realiza o processamento de ponta a ponta de travessia de páginas web, busca de informações e Q&A (perguntas e respostas).

Desempenho

De acordo com a documentação do projeto, o WebDancer demonstra excelente desempenho em benchmarks padrão:

  • Benchmark GAIA: Pontuação Pass@3 de 61.1%.
  • Benchmark WebWalkerQA: Pontuação Pass@3 de 54.6%.

Cenários de Aplicação

Tipos de Tarefas Suportadas

  • Travessia de Páginas Web: Navegação inteligente e exploração de páginas.
  • Busca de Informações: Coleta e organização autônoma de informações.
  • Sistema de Perguntas e Respostas (Q&A): Q&A complexo baseado no conteúdo da página web.
  • Inferência de Longa Duração: Tarefas de inferência lógica complexas e multi-etapas.

Ambientes de Demonstração

O projeto oferece múltiplos ambientes de demonstração:

  • Demonstração WebWalkerQA
  • Demonstração do Benchmark GAIA
  • Demonstração de Cenários de Uso Diário

Arquitetura Técnica

Paradigma de Treinamento

1. Construção de Dados de Navegação → 2. Amostragem de Trajetória → 3. Ajuste Fino Supervisionado → 4. Aprendizagem por Reforço

Pilha Tecnológica Principal

  • Estrutura Base: ReAct (Reasoning and Acting)
  • Método de Treinamento: SFT + RL (Ajuste Fino Supervisionado + Aprendizagem por Reforço)
  • Processamento de Dados: DAPO (Otimização de Políticas Aumentada por Dados)

Resumo

WebAgent representa o mais recente desenvolvimento na tecnologia de agentes web inteligentes, alcançando capacidades autônomas de busca de informações e navegação em ambientes web complexos, através da integração de múltiplos componentes avançados e da adoção de uma abordagem de treinamento centrada em dados. Este projeto não só gerou um impacto significativo na comunidade acadêmica, mas também forneceu uma base tecnológica robusta para aplicações práticas.

Star History Chart