Skyvern ist eine Plattform, die Unternehmen dabei hilft, Browser-Workflows mithilfe von LLMs (Large Language Models) und Computer Vision zu automatisieren. Sie bietet einfache API-Endpunkte zur vollständigen Automatisierung manueller Workflows und ersetzt fragile oder unzuverlässige Automatisierungslösungen.
Skyvern wurde 2023 von Suchintan Singh und Shuchang Zheng gegründet und hat seinen Hauptsitz in San Francisco, Kalifornien, USA. Das Unternehmen beschäftigt derzeit 3 Mitarbeiter. Das Gründerteam hat sich mit Hunderten von Unternehmen ausgetauscht und festgestellt, dass die meisten von ihnen auf repetitive, manuelle Workflows angewiesen sind, deren Ausmaß überraschend ist – die meisten Unternehmen erledigen ihre Arbeit zunächst manuell und stellen schließlich entweder Mitarbeiter ein, um die manuelle Arbeit zu erweitern, oder schreiben Skripte mit browserbasierten Automatisierungsbibliotheken wie Selenium.
Skyvern akzeptiert Informationsblöcke bei der Navigation durch Workflows – einfach einen JSON-Datenblock, der alle Informationen enthält, die Sie einfügen möchten, und verwendet dann LLMs, um diese Informationen auf dem Bildschirm zuzuordnen. Beispiel: Wenn Sie in den USA ein Kfz-Versicherungsangebot erstellen, kann das System die Daten intelligent den entsprechenden Formularfeldern zuordnen.
Skyvern unterstützt die Verkettung mehrerer Aufgaben zu einem Workflow, wobei jede Aufgabe nacheinander über API-Endpunkte ausgeführt wird, um komplexe Abläufe zu erledigen.
Im Gegensatz zur Code-Automatisierung kann Skyvern problemlos mit subtilen Änderungen der Website-Struktur umgehen, was das Problem behebt, dass herkömmliche Automatisierungsskripte nach Website-Updates fehlschlagen.
Das Projekt ist vollständig Open Source, der Code wird auf GitHub gehostet und ermöglicht es Entwicklern, ihn frei zu verwenden, zu ändern und zu erweitern.
Der Einstieg in Skyvern ist ein einfacher Prozess, der eine umfassende Anleitung zur lokalen Installation mit GitHub, Docker und Befehlszeilentools bietet. Der Installationsprozess umfasst in der Regel:
# Projekt klonen
git clone https://github.com/Skyvern-AI/skyvern.git
# Mit Docker bereitstellen
docker-compose up -d
# Oder über das Befehlszeilentool installieren
pip install skyvern
Beispielsweise kann das System zum Warenkorb navigieren, den Warenkorbstatus überprüfen und schließlich den Artikel über den Checkout-Prozess kaufen.
Obwohl es sich um einen kostenpflichtigen Dienst handelt, ist die Erstellung eines Kontos zum Zeitpunkt des Verfassens dieses Artikels relativ einfach. Das Projekt bietet sowohl eine Open-Source-Version als auch kommerzielle Dienstleistungen an.
Skyvern stellt einen bedeutenden Durchbruch im Bereich der Browser-Automatisierung dar. Es kombiniert fortschrittliche KI-Technologie, Open-Source-Funktionen und Zuverlässigkeit auf Unternehmensebene und bietet Unternehmen, die repetitive Weboperationen automatisieren müssen, eine leistungsstarke und flexible Lösung. Durch die Beseitigung der Komplexität und Fragilität herkömmlicher Skripterstellung macht Skyvern die Browser-Automatisierung intelligenter, zuverlässiger und einfacher zu warten.