Home
Login

알리바바 통이 실험실에서 개발한 지능형 웹 페이지 에이전트 시스템으로, WebWalker, WebDancer, WebSailor 세 가지 구성 요소로 구성되어 있으며, 자율 정보 검색 및 웹 페이지 탐색 작업에 중점을 둡니다.

MITPython 3.1kAlibaba-NLPWebAgent Last Updated: 2025-07-10

WebAgent - 지능형 웹 에이전트 시스템

프로젝트 개요

WebAgent는 알리바바 통이 연구소(Tongyi Lab)에서 개발한 혁신적인 지능형 웹 에이전트 시스템으로, 자율 정보 검색 및 웹 탐색 작업에 중점을 둡니다. 이 프로젝트는 여러 고급 구성 요소를 통합하여 복잡한 정보 검색 및 웹 순회 작업을 자율적으로 수행할 수 있는 지능형 에이전트를 구축하는 것을 목표로 합니다.

주요 구성 요소

1. WebWalker (ACL 2025)

  • 기능 포지셔닝: 대규모 언어 모델(LLM)의 웹 탐색 작업 벤치마크 도구
  • 핵심 특징:
    • 표준화된 웹 탐색 평가 프레임워크 제공
    • 다중 에이전트 협업 정보 검색 지원
    • LLM의 웹 탐색 능력에 대한 정량적 평가 지표 제공

2. WebDancer (프리프린트 2025)

  • 기능 포지셔닝: 자율 정보 검색 에이전트를 위한 엔드투엔드 훈련 프레임워크
  • 핵심 특징:
    • ReAct 프레임워크를 사용하는 네이티브 지능형 검색 추론 모델
    • 자율 정보 검색 에이전트 및 심층 연구 유형 모델 구현
    • 4단계 훈련 패러다임:
      1. 브라우징 데이터 구축
      2. 궤적 샘플링
      3. 지도 미세 조정 (효과적인 콜드 스타트 구현)
      4. 강화 학습 (일반화 능력 향상)

3. WebSailor

  • 기능 포지셔닝: 웹 에이전트의 기능 범위 확장
  • 핵심 특징: 더 광범위한 웹 조작 및 탐색 능력 제공

기술 특징

데이터 중심 접근 방식

  • 궤적 수준 지도 미세 조정: 정밀한 궤적 데이터를 통한 모델 훈련
  • 강화 학습 통합: DAPO (Data-Augmented Policy Optimization) 기술 채택
  • 확장 가능한 훈련 파이프라인: SFT (지도 미세 조정) 및 RL (강화 학습) 두 가지 훈련 모드 지원

자율 학습 능력

  • 지능형 에이전트가 검색 및 추론 기술을 자율적으로 습득
  • 장시간 범위의 다단계 복잡 추론 작업 지원
  • 웹 탐색, 정보 검색 및 질의응답의 엔드투엔드 처리 구현

성능

프로젝트 문서에 따르면, WebDancer는 표준 벤치마크에서 우수한 성능을 보였습니다:

  • GAIA 벤치마크: Pass@3 점수 61.1% 달성
  • WebWalkerQA 벤치마크: Pass@3 점수 54.6% 달성

응용 시나리오

지원되는 작업 유형

  • 웹 탐색: 지능형 탐색 및 페이지 탐색
  • 정보 검색: 자율 정보 수집 및 정리
  • 질의응답 시스템: 웹 콘텐츠 기반의 복잡한 질의응답
  • 장시간 추론: 다단계 복잡 논리 추론 작업

데모 환경

프로젝트는 여러 데모 환경을 제공합니다:

  • WebWalkerQA 데모
  • GAIA 벤치마크 데모
  • 일상 사용 시나리오 데모

기술 아키텍처

훈련 패러다임

1. 브라우징 데이터 구축 → 2. 궤적 샘플링 → 3. 지도 미세 조정 → 4. 강화 학습

핵심 기술 스택

  • 기본 프레임워크: ReAct (Reasoning and Acting)
  • 훈련 방법: SFT + RL (지도 미세 조정 + 강화 학습)
  • 데이터 처리: DAPO (데이터 증강 정책 최적화)

요약

WebAgent는 지능형 웹 에이전트 기술의 최신 발전을 대표하며, 여러 고급 구성 요소를 통합하고 데이터 중심 훈련 방식을 채택하여 복잡한 웹 환경에서 자율 정보 검색 및 탐색 능력을 구현했습니다. 이 프로젝트는 학계에 중요한 영향을 미쳤을 뿐만 아니라 실제 응용을 위한 강력한 기술 기반을 제공합니다.

Star History Chart