Skyvern 是一個幫助企業使用 LLM(大型語言模型)和計算機視覺技術自動化瀏覽器工作流程的平台,它提供簡單的 API 端點來完全自動化手動工作流程,替代脆弱或不可靠的自動化解決方案。
Skyvern 成立於 2023 年,由 Suchintan Singh 和 Shuchang Zheng 創立,總部位於美國加利福尼亞州舊金山,目前有 3 名員工。創始團隊與數百家公司進行了交流,發現大多數公司都依賴重複性的手動工作流程,這些工作流程的廣度令人驚訝——大多數公司最初都是手動完成工作,最終要么僱傭人員來擴展手動工作,要么使用類似 Selenium 的瀏覽器自動化庫編寫腳本。
Skyvern 在導航工作流程時接受信息塊——只需一個 JSON 數據塊,包含您想要放入的任何信息,然後使用 LLM 將其映射到屏幕上的信息。例如:如果您在美國生成汽車保險報價,系統可以智能地將數據映射到相應的表單字段。
Skyvern 支持將多個任務串聯成工作流程,通過 API 端點依次執行每個任務來完成複雜的操作流程。
與使用代碼自動化不同,Skyvern 可以毫無問題地處理網站結構的細微變化,這解決了傳統自動化腳本在網站更新後失效的問題。
項目完全開源,代碼託管在 GitHub 上,允許開發者自由使用、修改和貢獻。
開始使用 Skyvern 是一個簡單的過程,提供了使用 GitHub、Docker 和命令行工具進行本地安裝的全面指導。安裝過程通常包括:
# 克隆項目
git clone https://github.com/Skyvern-AI/skyvern.git
# 使用 Docker 部署
docker-compose up -d
# 或通過命令行工具安裝
pip install skyvern
例如,系統可以導航到購物車並驗證購物車狀態,最後通過結帳流程購買商品。
雖然這是一個付費服務,但在撰寫本文時,創建帳戶相對容易,項目同時提供開源版本和商業化服務。
Skyvern 代表了瀏覽器自動化領域的重大突破。它將先進的 AI 技術、開源特性和企業級可靠性相結合,為需要自動化重複性網頁操作的企業提供了強大而靈活的解決方案。通過消除傳統腳本編寫的複雜性和脆弱性,Skyvern 使得瀏覽器自動化變得更加智能、可靠和易於維護。