Skyvernは、企業がLLM(大規模言語モデル)とコンピュータビジョン技術を使用してブラウザのワークフローを自動化するのを支援するプラットフォームです。手動ワークフローを完全に自動化するためのシンプルなAPIエンドポイントを提供し、脆弱または信頼性の低い自動化ソリューションを代替します。
Skyvernは2023年にSuchintan SinghとShuchang Zhengによって設立され、本社は米国カリフォルニア州サンフランシスコにあり、現在3名の従業員がいます。創業チームは数百社と交流し、ほとんどの企業が反復的な手動ワークフローに依存していることを発見しました。そのワークフローの広さは驚くべきもので、ほとんどの企業は最初手動で作業を行い、最終的には人員を雇用して手動作業を拡張するか、Seleniumのようなブラウザ自動化ライブラリを使用してスクリプトを作成します。
Skyvernは、ワークフローをナビゲートする際に情報ブロックを受け入れます。JSONデータブロックだけで、入力したい情報をすべて含めることができ、LLMを使用して画面上の情報にマッピングします。たとえば、米国で自動車保険の見積もりを生成する場合、システムはデータを対応するフォームフィールドにインテリジェントにマッピングできます。
Skyvernは、複数のタスクをワークフローに連結することをサポートし、APIエンドポイントを介して各タスクを順番に実行して、複雑な操作フローを完了します。
コードを使用した自動化とは異なり、SkyvernはWebサイト構造のわずかな変更を問題なく処理できます。これにより、Webサイトの更新後に従来の自動化スクリプトが無効になるという問題が解決されます。
プロジェクトは完全にオープンソースであり、コードはGitHubでホストされており、開発者は自由に使用、変更、および貢献できます。
Skyvernの使用を開始するのは簡単なプロセスであり、GitHub、Docker、およびコマンドラインツールを使用してローカルにインストールするための包括的なガイダンスが提供されています。インストールプロセスには通常、以下が含まれます。
# プロジェクトをクローン
git clone https://github.com/Skyvern-AI/skyvern.git
# Dockerを使用してデプロイ
docker-compose up -d
# または、コマンドラインツールを使用してインストール
pip install skyvern
たとえば、システムはカートに移動し、カートの状態を検証し、最後にチェックアウトプロセスを通じて商品を購入できます。
これは有料サービスですが、この記事の執筆時点では、アカウントの作成は比較的簡単であり、プロジェクトはオープンソースバージョンと商用サービスの両方を提供しています。
Skyvernは、ブラウザ自動化分野における大きなブレークスルーを表しています。高度なAI技術、オープンソース特性、およびエンタープライズレベルの信頼性を組み合わせることで、反復的なWeb操作を自動化する必要がある企業に、強力で柔軟なソリューションを提供します。従来のスクリプト作成の複雑さと脆弱性を排除することで、Skyvernはブラウザの自動化をよりインテリジェントで、信頼性が高く、保守しやすいものにします。