Skyvern是一个帮助企业使用LLM(大语言模型)和计算机视觉技术自动化浏览器工作流程的平台,它提供简单的API端点来完全自动化手动工作流程,替代脆弱或不可靠的自动化解决方案。
Skyvern成立于2023年,由Suchintan Singh和Shuchang Zheng创立,总部位于美国加利福尼亚州旧金山,目前有3名员工。创始团队与数百家公司进行了交流,发现大多数公司都依赖重复性的手动工作流程,这些工作流程的广度令人惊讶——大多数公司最初都是手动完成工作,最终要么雇佣人员来扩展手动工作,要么使用类似Selenium的浏览器自动化库编写脚本。
Skyvern在导航工作流程时接受信息块——只需一个JSON数据块,包含您想要放入的任何信息,然后使用LLM将其映射到屏幕上的信息。例如:如果您在美国生成汽车保险报价,系统可以智能地将数据映射到相应的表单字段。
Skyvern支持将多个任务串联成工作流程,通过API端点依次执行每个任务来完成复杂的操作流程。
与使用代码自动化不同,Skyvern可以毫无问题地处理网站结构的细微变化,这解决了传统自动化脚本在网站更新后失效的问题。
项目完全开源,代码托管在GitHub上,允许开发者自由使用、修改和贡献。
开始使用Skyvern是一个简单的过程,提供了使用GitHub、Docker和命令行工具进行本地安装的全面指导。安装过程通常包括:
# 克隆项目
git clone https://github.com/Skyvern-AI/skyvern.git
# 使用Docker部署
docker-compose up -d
# 或通过命令行工具安装
pip install skyvern
例如,系统可以导航到购物车并验证购物车状态,最后通过结账流程购买商品。
虽然这是一个付费服务,但在撰写本文时,创建账户相对容易,项目同时提供开源版本和商业化服务。
Skyvern代表了浏览器自动化领域的重大突破。它将先进的AI技术、开源特性和企业级可靠性相结合,为需要自动化重复性网页操作的企业提供了强大而灵活的解决方案。通过消除传统脚本编写的复杂性和脆弱性,Skyvern使得浏览器自动化变得更加智能、可靠和易于维护。