Home
Login

Ferramenta de agente de IA de código aberto para automatizar fluxos de trabalho do navegador usando LLMs e visão computacional

AGPL-3.0Python 13.6kSkyvern-AIskyvern Last Updated: 2025-06-23

Skyvern - Plataforma de Automação de Navegador Impulsionada por IA

Visão Geral do Projeto

Skyvern é uma plataforma que ajuda empresas a automatizar fluxos de trabalho do navegador usando LLMs (Grandes Modelos de Linguagem) e tecnologias de visão computacional, fornecendo endpoints de API simples para automatizar completamente fluxos de trabalho manuais, substituindo soluções de automação frágeis ou não confiáveis.

Contexto do Projeto

Fundada em 2023 por Suchintan Singh e Shuchang Zheng, a Skyvern está sediada em São Francisco, Califórnia, EUA, e atualmente tem 3 funcionários. A equipe fundadora conversou com centenas de empresas e descobriu que a maioria depende de fluxos de trabalho manuais repetitivos, cuja amplitude é surpreendente – a maioria das empresas começa fazendo o trabalho manualmente e acaba contratando pessoas para escalar o trabalho manual ou escrevendo scripts usando bibliotecas de automação de navegador como o Selenium.

Principais Características

1. Operações Inteligentes Impulsionadas por IA

  • Integração de LLM: Skyvern é uma ferramenta de automação nativa do navegador impulsionada por IA que simula interações humanas – clicar, digitar, navegar, fazer upload – e funciona em qualquer interface da Web.
  • Visão Computacional: Combina tecnologias de visão computacional para identificar e manipular elementos da página da web.
  • API de Linguagem Natural: Fornece uma API de linguagem natural para automatizar fluxos de trabalho manuais repetitivos que ocorrem no back office corporativo.

2. Correspondência de Informações Contextuais

Skyvern aceita blocos de informações ao navegar em fluxos de trabalho – apenas um bloco de dados JSON contendo qualquer informação que você deseja inserir e, em seguida, usa LLMs para mapeá-lo para as informações na tela. Por exemplo: se você estiver gerando uma cotação de seguro de carro nos EUA, o sistema pode mapear de forma inteligente os dados para os campos de formulário correspondentes.

3. Gerenciamento de Fluxo de Trabalho

Skyvern suporta encadear várias tarefas em um fluxo de trabalho, executando cada tarefa sequencialmente por meio de endpoints de API para concluir processos operacionais complexos.

4. Monitoramento e Depuração em Tempo Real

  • Streaming em Tempo Real: Skyvern permite que você transmita a janela do navegador em tempo real para sua máquina local, para que você possa ver exatamente o que o Skyvern está fazendo na web.
  • Depurador Visual: Ferramentas visuais permitem que você depure interações na web, e a IA do Skyvern fornece raciocínio detalhado para as operações, garantindo transparência e controle.

Vantagens Técnicas

1. Sem Necessidade de Reescrever Código

Ao contrário da automação com código, o Skyvern pode lidar com pequenas mudanças na estrutura do site sem problemas, o que resolve o problema de scripts de automação tradicionais que falham após atualizações do site.

2. Ampla Compatibilidade

  • Suporta uma variedade de sites e interfaces da Web.
  • Não requer a escrita de scripts específicos para cada site.
  • Capaz de lidar com conteúdo dinâmico e interações complexas.

3. Características de Código Aberto

O projeto é totalmente de código aberto, com o código hospedado no GitHub, permitindo que os desenvolvedores usem, modifiquem e contribuam livremente.

Instalação e Implantação

Começar a usar o Skyvern é um processo simples, com orientação abrangente para instalação local usando GitHub, Docker e ferramentas de linha de comando. O processo de instalação normalmente inclui:

# Clonar o projeto
git clone https://github.com/Skyvern-AI/skyvern.git

# Implantar usando Docker
docker-compose up -d

# Ou instalar através da ferramenta de linha de comando
pip install skyvern

Casos de Uso

1. Automação de Back Office Corporativo

  • Entrada de dados e preenchimento de formulários
  • Geração de relatórios e extração de dados
  • Operações e processamento em lote

2. E-commerce e Processos de Compra

Por exemplo, o sistema pode navegar até o carrinho de compras e verificar o status do carrinho, e finalmente comprar itens através do processo de checkout.

3. Seguros e Serviços Financeiros

  • Geração automática de cotações de seguros
  • Processamento de formulários e gerenciamento de dados de clientes
  • Verificações de conformidade e auditoria

Modelo de Negócios

Embora seja um serviço pago, na data deste documento, criar uma conta é relativamente fácil, e o projeto oferece versões de código aberto e serviços comercializados.

Resumo

Skyvern representa um avanço significativo no campo da automação de navegadores. Ele combina tecnologia de IA avançada, características de código aberto e confiabilidade de nível empresarial, fornecendo uma solução poderosa e flexível para empresas que precisam automatizar operações repetitivas na web. Ao eliminar a complexidade e a fragilidade da escrita de scripts tradicionais, o Skyvern torna a automação de navegadores mais inteligente, confiável e fácil de manter.

Star History Chart