jianchang512/ChatTTS-ui

ChatTTS-ui: Uma interface web local simples que usa o ChatTTS para sintetizar texto em fala, ao mesmo tempo que oferece suporte a interfaces de API externas.

NOASSERTIONPython 7.1kjianchang512 Last Updated: 2025-04-21

https://github.com/jianchang512/ChatTTS-ui

Apresentação Detalhada do Projeto ChatTTS-ui

Visão Geral do Projeto

ChatTTS-ui é um projeto de interface web local simples baseado no ChatTTS, criado e mantido pelo desenvolvedor jianchang512. O projeto oferece aos usuários uma interface web amigável para usar o ChatTTS para síntese de texto para fala, além de fornecer interfaces API completas para chamadas externas.

Endereço do Projeto: https://github.com/jianchang512/ChatTTS-ui

Descrição do Projeto: Uma interface web local simples que usa o ChatTTS para sintetizar texto em fala, ao mesmo tempo que suporta o fornecimento de interfaces API para o exterior.

Funcionalidades/Características Principais

🎯 Funcionalidades Principais

Síntese de Texto para Fala: Suporta a conversão de texto misto em chinês, inglês, números, símbolos, etc., em fala natural e fluente.
Suporte a Múltiplas Tonalidades: Oferece uma variedade de opções de tonalidades predefinidas, permitindo que os usuários escolham diferentes estilos de voz de acordo com as suas necessidades.
Interface Web: Fornece uma interface de operação web local simples e intuitiva, que pode ser usada sem configurações complexas.
Interface API: Interfaces API RESTful completas, fáceis de integrar em outras aplicações.
Suporte Multiplataforma: Suporta vários sistemas operacionais, como Windows, Linux, macOS.

🚀 Características Técnicas

Aceleração por GPU: Suporta aceleração por GPU NVIDIA CUDA e AMD ROCm, melhorando a velocidade de síntese de fala.
Implantação Docker: Fornece uma solução de implantação em contêiner Docker, simplificando o processo de implantação.
Múltiplos Métodos de Instalação: Suporta múltiplos métodos de instalação, como pacotes pré-compilados, implantação de código-fonte, Docker, etc.
Personalização de Tonalidade: Suporta valores de sementes de tonalidade personalizados, gerando vozes personalizadas.
Suporte a Caracteres de Controle: Suporta caracteres de controle de voz, como risadas e pausas, melhorando o efeito expressivo.

📋 Idiomas e Formatos Suportados

Suporte a Idiomas: Chinês, inglês e misturas de chinês e inglês.
Formato de Saída: Arquivo de áudio WAV.
Processamento de Texto: Suporta conteúdo de texto complexo, como números, símbolos, caracteres de controle, etc.

Métodos de Implantação

1. Implantação de Pacote Pré-Compilado (Recomendado para Iniciantes)

Baixe o pacote compactado da página Releases.
Descompacte e execute diretamente o app.exe.
O navegador será aberto automaticamente para acessar http://127.0.0.1:9966

2. Implantação Docker

# Versão GPU
docker compose -f docker-compose.gpu.yaml up -d

# Versão CPU
docker compose -f docker-compose.cpu.yaml up -d

3. Implantação de Código-Fonte

# Clone o projeto
git clone https://github.com/jianchang512/ChatTTS-ui.git

# Crie um ambiente virtual
python3 -m venv venv
source ./venv/bin/activate

# Instale as dependências
pip3 install -r requirements.txt

# Inicie o serviço
python3 app.py

Requisitos do Sistema

Requisitos de Hardware

Memória: Recomenda-se 4GB ou mais.
Placa Gráfica: Placa gráfica NVIDIA com 4GB ou mais de memória de vídeo (opcional, para aceleração por GPU).
Armazenamento: Pelo menos 2GB de espaço disponível (para arquivos de modelo).

Ambiente de Software

Python: Versões 3.9-3.11.
Sistema Operacional: Windows 10+, Linux, macOS.
Dependências: FFmpeg (deve ser instalado).
CUDA: 11.8+ (aceleração por GPU opcional).

Cenários de Aplicação

🎭 Criação de Conteúdo

Produção de dublagem e narração de vídeos.
Geração de podcasts e conteúdo de áudio.
Síntese de voz para materiais de treinamento educacional.

🤖 Integração de Desenvolvimento

Respostas de voz para chatbots.
Transmissão de voz para atendimento ao cliente inteligente.
Dicas de voz para aplicações.

📢 Aplicações Comerciais

Dublagem para anúncios e vídeos promocionais.
Navegação por voz para sistemas telefônicos.
Voz para apresentações multimídia.

Vantagens do Projeto

Fácil de Usar: Fornece uma interface web intuitiva, sem necessidade de conhecimento técnico especializado.
Implantação Simples: Múltiplos métodos de implantação, adequados para usuários com diferentes níveis de habilidade técnica.
Desempenho Excelente: Suporta aceleração por GPU, com rápida velocidade de síntese de fala.
Código Aberto e Gratuito: Totalmente de código aberto, pode ser usado e modificado livremente.
Manutenção Ativa: Atualizações e correções de bugs contínuas, com bom suporte da comunidade.
API Completa: Fornece interfaces API completas, facilitando o desenvolvimento de integração.

Conclusão

ChatTTS-ui é uma solução de texto para fala completa e fácil de usar. Ele empacota o poderoso modelo ChatTTS em uma interface amigável, fornecendo aos usuários individuais e desenvolvedores uma ferramenta conveniente de síntese de voz. Seja para criação de conteúdo, desenvolvimento de aplicações ou aplicações comerciais, é possível encontrar cenários de uso adequados.