AUTOMATIC1111/stable-diffusion-webui View GitHub Homepage for Latest Official Releases

Interfaz web de Stable Diffusion basada en Gradio, que ofrece funciones de pintura con IA como texto a imagen e imagen a imagen.

AGPL-3.0Pythonstable-diffusion-webuiAUTOMATIC1111 160.5k Last Updated: December 18, 2025

Introducción al Proyecto Stable Diffusion WebUI

Resumen del Proyecto

stable-diffusion-webui es una interfaz web para Stable Diffusion basada en la biblioteca Gradio, que proporciona a los usuarios una plataforma de generación de imágenes con IA potente y fácil de usar. Este proyecto se ha convertido en una de las herramientas de código abierto más populares en el campo de la pintura con IA.

Funciones Principales

Generación de Imágenes Básica

Texto a Imagen (txt2img): Genera imágenes a partir de descripciones de texto.
Imagen a Imagen (img2img): Genera nuevas imágenes basadas en imágenes existentes y prompts.
Extrapintura (Outpainting): Extiende los bordes de la imagen.
Intrapintura (Inpainting): Repara o reemplaza áreas específicas de la imagen.
Boceto a Color: Genera imágenes basadas en bocetos a color.

Funciones Avanzadas

Matriz de Prompts: Prueba por lotes diferentes combinaciones de prompts.
Ampliación de Stable Diffusion: Utiliza IA para la superresolución de imágenes.
Control de Atención: Controla la atención del modelo a palabras específicas mediante paréntesis y pesos.
Procesamiento Cíclico: Ejecuta el procesamiento img2img varias veces.
Dibujo X/Y/Z: Genera gráficos de comparación tridimensionales de diferentes parámetros.

Inversión de Texto y Entrenamiento

Inversión de Texto (Textual Inversion): Entrena incrustaciones personalizadas.
Hiperredes (Hypernetworks): Entrena modificaciones de la red.
LoRA: Ajuste fino del modelo de adaptación de bajo rango.
Etiquetas de Entrenamiento: Admite múltiples preprocesamientos de datos y etiquetado automático.

Herramientas de Mejora de Imagen

GFPGAN: Restauración facial neuronal.
CodeFormer: Herramienta de recuperación facial.
RealESRGAN: Superresolución neuronal.
ESRGAN: Admite múltiples modelos de terceros para superresolución.
SwinIR y Swin2SR: Amplificadores neuronales avanzados.
LDSR: Superresolución de difusión latente.

Funciones de Experiencia de Usuario

Vista Previa en Tiempo Real: Vista previa de la imagen en tiempo real durante el proceso de generación.
Barra de Progreso: Muestra el progreso de la generación y el tiempo estimado de finalización.
Guardado de Parámetros: Guarda automáticamente los parámetros de generación en el archivo de imagen.
Operación de Arrastrar y Soltar: Admite la importación de imágenes y parámetros mediante arrastrar y soltar.
Procesamiento por Lotes: Procesa múltiples archivos por lotes.
Gestión de Estilos: Guarda y aplica estilos de prompts.

Características Técnicas

Optimización del Rendimiento

Soporte de Baja VRAM: Admite tarjetas gráficas con 4GB o incluso 2GB de VRAM.
Integración de xformers: Mejora significativamente la velocidad de procesamiento en tarjetas gráficas específicas.
Precisión Mixta: Admite el procesamiento de números de punto flotante de media precisión.
Optimización de Memoria: Múltiples estrategias de optimización de memoria.

Soporte de Modelos

Múltiples Samplers: Proporciona múltiples opciones de métodos de muestreo.
Gestión de Checkpoints: Admite el cambio y la combinación de modelos en línea.
Selección de VAE: Permite seleccionar diferentes modelos VAE.
Stable Diffusion 2.0: Admite la última versión de Stable Diffusion.
Formato safetensors: Admite un formato de modelo más seguro.

Escalabilidad

Scripts Personalizados: Admite scripts de extensión desarrollados por la comunidad.
Interfaz API: Proporciona una API completa para que otras aplicaciones la llamen.
Sistema de Plugins: Un rico ecosistema de plugins.
Soporte Multilingüe: Admite múltiples idiomas de interfaz.

Instalación y Despliegue

Requisitos del Sistema

Python 3.10.6 (versión recomendada)
Git
Tarjetas gráficas compatibles: NVIDIA (recomendada), AMD, Intel

Plataformas Soportadas

Windows: Proporciona un script de instalación con un solo clic.
Linux: Admite múltiples distribuciones de Linux.
macOS: Admite Apple Silicon.
Servicios en la Nube: Admite servicios en línea como Google Colab.

Métodos de Instalación

Windows: Descargue y ejecute webui-user.bat
Linux: Ejecute el script webui.sh
Servicios en Línea: Admite el despliegue en múltiples plataformas en la nube.

Comunidad y Ecosistema

Comunidad de Código Abierto Activa

El proyecto cuenta con una comunidad de código abierto muy activa, que se actualiza y mantiene regularmente, proporcionando abundante documentación y tutoriales.

Plugins de Extensión

La comunidad ha desarrollado una gran cantidad de plugins de extensión, incluyendo:

Navegador de imágenes
Gradiente estético
Gestión del historial
Herramientas de entrenamiento avanzadas

Soporte Técnico

Documentación Wiki detallada
Foros y áreas de discusión de la comunidad
Actualizaciones de funciones y correcciones de errores periódicas

Escenarios de Aplicación

Creación Artística

Diseño de arte conceptual
Creación de ilustraciones y cómics
Generación de obras de arte digitales

Aplicaciones Comerciales

Materiales publicitarios y de marketing
Referencia de diseño de productos
Diseño visual de marca

Investigación y Desarrollo

Investigación de generación de imágenes con IA
Experimentos de aprendizaje profundo
Aplicaciones de visión por computadora

Arquitectura Técnica

El proyecto se basa en las siguientes tecnologías centrales:

Gradio: Framework de interfaz web
PyTorch: Framework de aprendizaje profundo
Transformers: Procesamiento del lenguaje natural
Diffusers: Biblioteca de modelos de difusión

Licencia

El proyecto utiliza una licencia de código abierto, que admite el uso comercial y no comercial. La información de la licencia de todo el código prestado se indica claramente en la página de configuración.

Conclusión

Stable Diffusion WebUI es una plataforma de generación de imágenes con IA completa y fácil de usar, que empaqueta la compleja tecnología de IA en una interfaz web amigable para el usuario. Ya sean artistas, diseñadores o investigadores de IA, pueden crear fácilmente imágenes de IA de alta calidad a través de esta herramienta. Su sólido soporte comunitario y sus continuas actualizaciones la convierten en una de las mejores herramientas de pintura con IA de código abierto disponibles en la actualidad.