AUTOMATIC1111/stable-diffusion-webui View GitHub Homepage for Latest Official Releases

Eine Gradio-basierte Stable Diffusion Web UI-Oberfläche, die KI-Malfunktionen wie Text-zu-Bild und Bild-zu-Bild bietet.

AGPL-3.0Pythonstable-diffusion-webuiAUTOMATIC1111 159.4k Last Updated: December 18, 2025

Stable Diffusion WebUI Projektvorstellung

Projektübersicht

stable-diffusion-webui ist eine Stable Diffusion Web-Oberfläche, die auf der Gradio-Bibliothek basiert und Benutzern eine leistungsstarke und einfach zu bedienende KI-Bildgenerierungsplattform bietet. Dieses Projekt hat sich zu einem der beliebtesten Open-Source-Tools im Bereich der KI-Malerei entwickelt.

Kernfunktionen

Grundlegende Bildgenerierung

Text-zu-Bild (txt2img): Generiert Bilder basierend auf Textbeschreibungen
Bild-zu-Bild (img2img): Generiert neue Bilder basierend auf vorhandenen Bildern und Prompts
Outpainting: Erweitert die Bildgrenzen
Inpainting: Repariert oder ersetzt bestimmte Bereiche eines Bildes
Farbige Skizze: Generiert Bilder basierend auf Farbigen Skizzen

Erweiterte Funktionen

Prompt-Matrix: Batch-Test verschiedener Prompt-Kombinationen
Stable Diffusion Upscaling: Verwendet KI für Bild-Superauflösung
Aufmerksamkeitskontrolle: Steuert die Aufmerksamkeit des Modells auf bestimmte Wörter durch Klammern und Gewichtungen
Loopback: Mehrfaches Ausführen der img2img-Verarbeitung
X/Y/Z-Plotting: Generiert dreidimensionale Bildvergleichsdiagramme mit verschiedenen Parametern

Textuelle Inversion und Training

Textuelle Inversion: Trainiert benutzerdefinierte Einbettungen
Hypernetworks: Trainiert Netzwerkmodifikationen
LoRA: Low-Rank Adaptation Modellfeinabstimmung
Training-Tags: Unterstützt verschiedene Datenvorverarbeitungs- und automatische Markierungsverfahren

Bildverbesserungswerkzeuge

GFPGAN: Neuronale Netzwerk-Gesichtsreparatur
CodeFormer: Werkzeug zur Gesichtswiederherstellung
RealESRGAN: Neuronale Netzwerk-Superauflösung
ESRGAN: Unterstützt Superauflösung mit verschiedenen Drittanbietermodellen
SwinIR und Swin2SR: Fortschrittliche neuronale Netzwerk-Vergrößerer
LDSR: Latente Diffusions-Superauflösung

Benutzererlebnis-Funktionen

Live-Vorschau: Echtzeit-Bildvorschau während des Generierungsprozesses
Fortschrittsbalken: Zeigt den Generierungsfortschritt und die geschätzte Fertigstellungszeit an
Parameter speichern: Speichert die Generierungsparameter automatisch in der Bilddatei
Drag-and-Drop: Unterstützt das Importieren von Bildern und Parametern per Drag-and-Drop
Batch-Verarbeitung: Batch-Verarbeitung mehrerer Dateien
Stilverwaltung: Speichern und Anwenden von Prompt-Stilen

Technische Eigenschaften

Leistungsoptimierung

Unterstützung für niedrigen VRAM: Unterstützt Grafikkarten mit 4 GB oder sogar 2 GB VRAM
xformers-Integration: Deutliche Beschleunigung der Verarbeitung auf bestimmten Grafikkarten
Gemischte Präzision: Unterstützt die Verarbeitung von Halbpräzisions-Gleitkommazahlen
Speicheroptimierung: Verschiedene Speicheroptimierungsstrategien

Modellunterstützung

Verschiedene Sampler: Bietet eine Auswahl verschiedener Sampling-Methoden
Checkpoint-Verwaltung: Unterstützt das Online-Umschalten und Zusammenführen von Modellen
VAE-Auswahl: Auswahl verschiedener VAE-Modelle möglich
Stable Diffusion 2.0: Unterstützt die neueste Version von Stable Diffusion
safetensors-Format: Unterstützt ein sichereres Modellformat

Erweiterbarkeit

Benutzerdefinierte Skripte: Unterstützt von der Community entwickelte Erweiterungsskripte
API-Schnittstelle: Bietet eine vollständige API für den Aufruf durch andere Anwendungen
Plugin-System: Umfangreiches Plugin-Ökosystem
Mehrsprachige Unterstützung: Unterstützt verschiedene Oberflächensprachen

Installation und Bereitstellung

Systemanforderungen

Python 3.10.6 (empfohlene Version)
Git
Unterstützte Grafikkarten: NVIDIA (empfohlen), AMD, Intel

Unterstützte Plattformen

Windows: Bietet ein Ein-Klick-Installationsskript
Linux: Unterstützt verschiedene Linux-Distributionen
macOS: Unterstützt Apple Silicon
Cloud-Dienste: Unterstützt Online-Dienste wie Google Colab

Installationsmethoden

Windows: Laden Sie webui-user.bat herunter und führen Sie es aus
Linux: Führen Sie das Skript webui.sh aus
Online-Dienste: Unterstützt die Bereitstellung auf verschiedenen Cloud-Plattformen

Community und Ökosystem

Aktive Open-Source-Community

Das Projekt verfügt über eine sehr aktive Open-Source-Community, die regelmäßig aktualisiert und gewartet wird und umfangreiche Dokumentation und Tutorials bietet.

Erweiterungs-Plugins

Die Community hat eine große Anzahl von Erweiterungs-Plugins entwickelt, darunter:

Bildbrowser
Ästhetischer Gradient
Verlaufsprotokollierung
Erweiterte Trainingswerkzeuge

Technischer Support

Detaillierte Wiki-Dokumentation
Community-Foren und Diskussionsbereiche
Regelmäßige Funktionsupdates und Bugfixes

Anwendungsbereiche

Künstlerische Gestaltung

Konzeptkunstdesign
Illustration und Comic-Erstellung
Generierung digitaler Kunstwerke

Kommerzielle Anwendungen

Werbe- und Marketingmaterialien
Produktdesign-Referenzen
Visuelles Markendesign

Forschung und Entwicklung

KI-Bildgenerierungsforschung
Deep-Learning-Experimente
Computer-Vision-Anwendungen

Technische Architektur

Das Projekt basiert auf den folgenden Kerntechnologien:

Gradio: Web-Interface-Framework
PyTorch: Deep-Learning-Framework
Transformers: Verarbeitung natürlicher Sprache
Diffusers: Bibliothek für Diffusionsmodelle

Lizenz

Das Projekt verwendet eine Open-Source-Lizenz, die kommerzielle und nichtkommerzielle Nutzung unterstützt. Alle Lizenzinformationen für ausgeliehenen Code sind auf der Einstellungsseite deutlich gekennzeichnet.

Fazit

Stable Diffusion WebUI ist eine umfassende und einfach zu bedienende KI-Bildgenerierungsplattform, die komplexe KI-Technologien in eine benutzerfreundliche Web-Oberfläche verpackt. Ob Künstler, Designer oder KI-Forscher, mit diesem Tool können Sie auf einfache Weise hochwertige KI-Bilder erstellen. Die starke Community-Unterstützung und die kontinuierlichen Updates machen es zu einem der besten Open-Source-KI-Malwerkzeuge, die derzeit verfügbar sind.