Home
Login

Ein Open-Source-KI-Agententool zur Automatisierung von Browser-Workflows mithilfe von LLM- und Computer-Vision-Technologien

AGPL-3.0Python 13.6kSkyvern-AIskyvern Last Updated: 2025-06-23

Skyvern - KI-gesteuerte Browser-Automatisierungsplattform

Projektübersicht

Skyvern ist eine Plattform, die Unternehmen dabei hilft, Browser-Workflows mithilfe von LLMs (Large Language Models) und Computer Vision zu automatisieren. Sie bietet einfache API-Endpunkte zur vollständigen Automatisierung manueller Workflows und ersetzt fragile oder unzuverlässige Automatisierungslösungen.

Projekthintergrund

Skyvern wurde 2023 von Suchintan Singh und Shuchang Zheng gegründet und hat seinen Hauptsitz in San Francisco, Kalifornien, USA. Das Unternehmen beschäftigt derzeit 3 Mitarbeiter. Das Gründerteam hat sich mit Hunderten von Unternehmen ausgetauscht und festgestellt, dass die meisten von ihnen auf repetitive, manuelle Workflows angewiesen sind, deren Ausmaß überraschend ist – die meisten Unternehmen erledigen ihre Arbeit zunächst manuell und stellen schließlich entweder Mitarbeiter ein, um die manuelle Arbeit zu erweitern, oder schreiben Skripte mit browserbasierten Automatisierungsbibliotheken wie Selenium.

Kernfunktionen

1. KI-gesteuerte intelligente Operationen

  • LLM-Integration: Skyvern ist ein KI-gesteuertes, browsernatives Automatisierungstool, das menschliche Interaktionen simuliert – Klicken, Eingeben, Navigieren, Hochladen – und auf jeder Weboberfläche funktioniert.
  • Computer Vision: Kombiniert Computer-Vision-Technologie zur Erkennung und Bedienung von Webseitenelementen.
  • Natural Language API: Bietet eine Natural Language API zur Automatisierung repetitiver, manueller Workflows, die im Backoffice von Unternehmen stattfinden.

2. Kontextbezogene Informationszuordnung

Skyvern akzeptiert Informationsblöcke bei der Navigation durch Workflows – einfach einen JSON-Datenblock, der alle Informationen enthält, die Sie einfügen möchten, und verwendet dann LLMs, um diese Informationen auf dem Bildschirm zuzuordnen. Beispiel: Wenn Sie in den USA ein Kfz-Versicherungsangebot erstellen, kann das System die Daten intelligent den entsprechenden Formularfeldern zuordnen.

3. Workflow-Management

Skyvern unterstützt die Verkettung mehrerer Aufgaben zu einem Workflow, wobei jede Aufgabe nacheinander über API-Endpunkte ausgeführt wird, um komplexe Abläufe zu erledigen.

4. Echtzeitüberwachung und -debugging

  • Echtzeit-Streaming: Skyvern ermöglicht es Ihnen, das Browserfenster in Echtzeit auf Ihren lokalen Rechner zu streamen, sodass Sie genau sehen können, was Skyvern im Web tut.
  • Visueller Debugger: Visuelle Tools ermöglichen es Ihnen, Interaktionen im Web zu debuggen. Die Skyvern-KI liefert detaillierte Begründungen für Operationen und sorgt so für Transparenz und Kontrolle.

Technische Vorteile

1. Kein Umschreiben von Code erforderlich

Im Gegensatz zur Code-Automatisierung kann Skyvern problemlos mit subtilen Änderungen der Website-Struktur umgehen, was das Problem behebt, dass herkömmliche Automatisierungsskripte nach Website-Updates fehlschlagen.

2. Breite Kompatibilität

  • Unterstützt eine Vielzahl von Websites und Weboberflächen.
  • Es ist nicht erforderlich, für jede Website spezifische Skripte zu schreiben.
  • Kann dynamische Inhalte und komplexe Interaktionen verarbeiten.

3. Open-Source-Funktionen

Das Projekt ist vollständig Open Source, der Code wird auf GitHub gehostet und ermöglicht es Entwicklern, ihn frei zu verwenden, zu ändern und zu erweitern.

Installation und Bereitstellung

Der Einstieg in Skyvern ist ein einfacher Prozess, der eine umfassende Anleitung zur lokalen Installation mit GitHub, Docker und Befehlszeilentools bietet. Der Installationsprozess umfasst in der Regel:

# Projekt klonen
git clone https://github.com/Skyvern-AI/skyvern.git

# Mit Docker bereitstellen
docker-compose up -d

# Oder über das Befehlszeilentool installieren
pip install skyvern

Anwendungsbereiche

1. Automatisierung des Backoffice von Unternehmen

  • Dateneingabe und Formularausfüllung
  • Berichtserstellung und Datenextraktion
  • Batch-Operationen und -Verarbeitung

2. E-Commerce- und Einkaufsprozesse

Beispielsweise kann das System zum Warenkorb navigieren, den Warenkorbstatus überprüfen und schließlich den Artikel über den Checkout-Prozess kaufen.

3. Versicherungs- und Finanzdienstleistungen

  • Automatische Erstellung von Versicherungsangeboten
  • Formularbearbeitung und Kundendatenverwaltung
  • Compliance-Prüfungen und Audits

Geschäftsmodell

Obwohl es sich um einen kostenpflichtigen Dienst handelt, ist die Erstellung eines Kontos zum Zeitpunkt des Verfassens dieses Artikels relativ einfach. Das Projekt bietet sowohl eine Open-Source-Version als auch kommerzielle Dienstleistungen an.

Zusammenfassung

Skyvern stellt einen bedeutenden Durchbruch im Bereich der Browser-Automatisierung dar. Es kombiniert fortschrittliche KI-Technologie, Open-Source-Funktionen und Zuverlässigkeit auf Unternehmensebene und bietet Unternehmen, die repetitive Weboperationen automatisieren müssen, eine leistungsstarke und flexible Lösung. Durch die Beseitigung der Komplexität und Fragilität herkömmlicher Skripterstellung macht Skyvern die Browser-Automatisierung intelligenter, zuverlässiger und einfacher zu warten.

Star History Chart