AUTOMATIC1111/stable-diffusion-webui View GitHub Homepage for Latest Official Releases

Interface Web UI do Stable Diffusion baseada em Gradio, que oferece funções de pintura de IA como texto para imagem e imagem para imagem.

AGPL-3.0Pythonstable-diffusion-webuiAUTOMATIC1111 160.5k Last Updated: December 18, 2025

Apresentação do Projeto Stable Diffusion WebUI

Visão Geral do Projeto

stable-diffusion-webui é uma interface web para Stable Diffusion implementada usando a biblioteca Gradio, que oferece aos usuários uma plataforma de geração de imagens com IA poderosa e fácil de usar. Este projeto se tornou uma das ferramentas de código aberto mais populares na área de pintura com IA.

Funcionalidades Principais

Geração Básica de Imagens

Texto para Imagem (txt2img): Gera imagens com base em descrições textuais.
Imagem para Imagem (img2img): Gera novas imagens com base em imagens existentes e prompts.
Expansão da Imagem (Outpainting): Expande as bordas da imagem.
Preenchimento da Imagem (Inpainting): Repara ou substitui áreas específicas da imagem.
Esboço Colorido: Gera imagens com base em esboços coloridos.

Funcionalidades Avançadas

Matriz de Prompts: Teste em lote de diferentes combinações de prompts.
Ampliação com Stable Diffusion: Usa IA para super-resolução de imagens.
Controle de Atenção: Controla a atenção do modelo a palavras específicas através de parênteses e pesos.
Processamento em Loop: Executa o processamento img2img várias vezes.
Desenho X/Y/Z: Gera gráficos de comparação tridimensionais de diferentes parâmetros.

Inversão de Texto e Treinamento

Inversão de Texto (Textual Inversion): Treina embeddings personalizados.
Hiper-redes (Hypernetworks): Treina modificações de rede.
LoRA: Ajuste fino do modelo de adaptação de baixa patente.
Etiquetas de Treinamento: Suporta vários pré-processamentos de dados e marcação automática.

Ferramentas de Aprimoramento de Imagem

GFPGAN: Restauração facial neural.
CodeFormer: Ferramenta de recuperação facial.
RealESRGAN: Super-resolução neural.
ESRGAN: Suporta super-resolução com vários modelos de terceiros.
SwinIR e Swin2SR: Amplificadores neurais avançados.
LDSR: Super-resolução de difusão latente.

Funcionalidades de Experiência do Usuário

Visualização em Tempo Real: Visualização em tempo real da imagem durante o processo de geração.
Barra de Progresso: Exibe o progresso da geração e o tempo estimado de conclusão.
Salvar Parâmetros: Salva automaticamente os parâmetros de geração nos arquivos de imagem.
Arrastar e Soltar: Suporta a importação de imagens e parâmetros por arrastar e soltar.
Processamento em Lote: Processa vários arquivos em lote.
Gerenciamento de Estilos: Salva e aplica estilos de prompts.

Características Técnicas

Otimização de Desempenho

Suporte a Pouca VRAM: Suporta placas de vídeo com 4GB ou até 2GB de VRAM.
Integração xformers: Melhora significativamente a velocidade de processamento em placas de vídeo específicas.
Precisão Mista: Suporta processamento de ponto flutuante de meia precisão.
Otimização de Memória: Várias estratégias de otimização de memória.

Suporte a Modelos

Vários Samplers: Oferece uma variedade de métodos de amostragem para escolher.
Gerenciamento de Checkpoints: Suporta troca e combinação de modelos online.
Seleção de VAE: Permite selecionar diferentes modelos VAE.
Stable Diffusion 2.0: Suporta a versão mais recente do Stable Diffusion.
Formato safetensors: Suporta um formato de modelo mais seguro.

Extensibilidade

Scripts Personalizados: Suporta scripts de extensão desenvolvidos pela comunidade.
Interface API: Fornece uma API completa para outras aplicações chamarem.
Sistema de Plugins: Um rico ecossistema de plugins.
Suporte a Múltiplos Idiomas: Suporta vários idiomas de interface.

Instalação e Implantação

Requisitos do Sistema

Python 3.10.6 (versão recomendada)
Git
Placa de vídeo suportada: NVIDIA (recomendado), AMD, Intel

Plataformas Suportadas

Windows: Fornece um script de instalação com um clique.
Linux: Suporta várias distribuições Linux.
macOS: Suporta Apple Silicon.
Serviços de Nuvem: Suporta serviços online como o Google Colab.

Métodos de Instalação

Windows: Baixe e execute webui-user.bat
Linux: Execute o script webui.sh
Serviços Online: Suporta a implantação em várias plataformas de nuvem.

Comunidade e Ecossistema

Comunidade de Código Aberto Ativa

O projeto possui uma comunidade de código aberto muito ativa, com atualizações e manutenção regulares, fornecendo documentação e tutoriais abrangentes.

Plugins de Extensão

A comunidade desenvolveu uma grande quantidade de plugins de extensão, incluindo:

Navegador de Imagens
Gradiente Estético
Gerenciamento de Histórico
Ferramentas de Treinamento Avançadas

Suporte Técnico

Documentação Wiki detalhada
Fóruns e áreas de discussão da comunidade
Atualizações regulares de recursos e correções de bugs

Casos de Uso

Criação Artística

Design de arte conceitual
Criação de ilustrações e mangás
Geração de obras de arte digitais

Aplicações Comerciais

Materiais de publicidade e marketing
Referência de design de produto
Design visual de marca

Pesquisa e Desenvolvimento

Pesquisa de geração de imagens com IA
Experimentos de aprendizado profundo
Aplicações de visão computacional

Arquitetura Técnica

O projeto é baseado nas seguintes tecnologias principais:

Gradio: Framework de interface web
PyTorch: Framework de aprendizado profundo
Transformers: Processamento de linguagem natural
Diffusers: Biblioteca de modelos de difusão

Licença

O projeto usa uma licença de código aberto, suportando uso comercial e não comercial, e as informações de licença para todo o código emprestado são claramente marcadas na página de configurações.

Conclusão

Stable Diffusion WebUI é uma plataforma de geração de imagens com IA abrangente e fácil de usar, que empacota tecnologias complexas de IA em uma interface web amigável. Artistas, designers e pesquisadores de IA podem criar facilmente imagens de IA de alta qualidade com esta ferramenta. Seu forte suporte da comunidade e atualizações contínuas o tornam uma das melhores ferramentas de pintura com IA de código aberto atualmente disponíveis.