Skyvern es una plataforma que ayuda a las empresas a automatizar los flujos de trabajo del navegador utilizando LLM (Modelos de Lenguaje Grandes) y tecnología de visión artificial. Ofrece puntos finales de API simples para automatizar completamente los flujos de trabajo manuales, reemplazando soluciones de automatización frágiles o poco confiables.
Skyvern fue fundada en 2023 por Suchintan Singh y Shuchang Zheng, tiene su sede en San Francisco, California, EE. UU., y actualmente cuenta con 3 empleados. El equipo fundador se comunicó con cientos de empresas y descubrió que la mayoría dependía de flujos de trabajo manuales repetitivos, cuya amplitud era sorprendente: la mayoría de las empresas inicialmente realizaban el trabajo manualmente y, finalmente, contrataban personal para ampliar el trabajo manual o escribían scripts utilizando bibliotecas de automatización de navegadores como Selenium.
Skyvern acepta bloques de información al navegar por los flujos de trabajo: solo un bloque de datos JSON que contiene cualquier información que desee insertar, y luego utiliza LLM para mapearla a la información en la pantalla. Por ejemplo: si está generando una cotización de seguro de automóvil en los Estados Unidos, el sistema puede mapear inteligentemente los datos a los campos del formulario correspondientes.
Skyvern admite la concatenación de múltiples tareas en un flujo de trabajo, ejecutando cada tarea secuencialmente a través de puntos finales de API para completar procesos operativos complejos.
A diferencia de la automatización con código, Skyvern puede manejar sin problemas los cambios sutiles en la estructura del sitio web, lo que resuelve el problema de que los scripts de automatización tradicionales fallen después de las actualizaciones del sitio web.
El proyecto es completamente de código abierto, el código está alojado en GitHub, lo que permite a los desarrolladores usar, modificar y contribuir libremente.
Comenzar a usar Skyvern es un proceso simple, que proporciona una guía completa para la instalación local utilizando GitHub, Docker y herramientas de línea de comandos. El proceso de instalación generalmente incluye:
# Clonar el proyecto
git clone https://github.com/Skyvern-AI/skyvern.git
# Desplegar usando Docker
docker-compose up -d
# O instalar a través de la herramienta de línea de comandos
pip install skyvern
Por ejemplo, el sistema puede navegar al carrito de compras y verificar el estado del carrito, y finalmente comprar artículos a través del proceso de pago.
Si bien este es un servicio de pago, al momento de escribir este artículo, crear una cuenta es relativamente fácil. El proyecto también ofrece una versión de código abierto y servicios comercializados.
Skyvern representa un avance significativo en el campo de la automatización de navegadores. Combina tecnología de IA avanzada, características de código abierto y confiabilidad de nivel empresarial, proporcionando una solución poderosa y flexible para las empresas que necesitan automatizar operaciones web repetitivas. Al eliminar la complejidad y la fragilidad de la escritura de scripts tradicionales, Skyvern hace que la automatización del navegador sea más inteligente, confiable y fácil de mantener.