Home
Login
jianchang512/ChatTTS-ui

ChatTTS-ui: Uma interface web local simples que usa o ChatTTS para sintetizar texto em fala, ao mesmo tempo que oferece suporte a interfaces de API externas.

NOASSERTIONPython 7.1kjianchang512 Last Updated: 2025-04-21
https://github.com/jianchang512/ChatTTS-ui

Apresentação Detalhada do Projeto ChatTTS-ui

Visão Geral do Projeto

ChatTTS-ui é um projeto de interface web local simples baseado no ChatTTS, criado e mantido pelo desenvolvedor jianchang512. O projeto oferece aos usuários uma interface web amigável para usar o ChatTTS para síntese de texto para fala, além de fornecer interfaces API completas para chamadas externas.

Endereço do Projeto: https://github.com/jianchang512/ChatTTS-ui

Descrição do Projeto: Uma interface web local simples que usa o ChatTTS para sintetizar texto em fala, ao mesmo tempo que suporta o fornecimento de interfaces API para o exterior.

Funcionalidades/Características Principais

🎯 Funcionalidades Principais

  • Síntese de Texto para Fala: Suporta a conversão de texto misto em chinês, inglês, números, símbolos, etc., em fala natural e fluente.
  • Suporte a Múltiplas Tonalidades: Oferece uma variedade de opções de tonalidades predefinidas, permitindo que os usuários escolham diferentes estilos de voz de acordo com as suas necessidades.
  • Interface Web: Fornece uma interface de operação web local simples e intuitiva, que pode ser usada sem configurações complexas.
  • Interface API: Interfaces API RESTful completas, fáceis de integrar em outras aplicações.
  • Suporte Multiplataforma: Suporta vários sistemas operacionais, como Windows, Linux, macOS.

🚀 Características Técnicas

  • Aceleração por GPU: Suporta aceleração por GPU NVIDIA CUDA e AMD ROCm, melhorando a velocidade de síntese de fala.
  • Implantação Docker: Fornece uma solução de implantação em contêiner Docker, simplificando o processo de implantação.
  • Múltiplos Métodos de Instalação: Suporta múltiplos métodos de instalação, como pacotes pré-compilados, implantação de código-fonte, Docker, etc.
  • Personalização de Tonalidade: Suporta valores de sementes de tonalidade personalizados, gerando vozes personalizadas.
  • Suporte a Caracteres de Controle: Suporta caracteres de controle de voz, como risadas e pausas, melhorando o efeito expressivo.

📋 Idiomas e Formatos Suportados

  • Suporte a Idiomas: Chinês, inglês e misturas de chinês e inglês.
  • Formato de Saída: Arquivo de áudio WAV.
  • Processamento de Texto: Suporta conteúdo de texto complexo, como números, símbolos, caracteres de controle, etc.

Métodos de Implantação

1. Implantação de Pacote Pré-Compilado (Recomendado para Iniciantes)

  • Baixe o pacote compactado da página Releases.
  • Descompacte e execute diretamente o app.exe.
  • O navegador será aberto automaticamente para acessar http://127.0.0.1:9966

2. Implantação Docker

# Versão GPU
docker compose -f docker-compose.gpu.yaml up -d

# Versão CPU
docker compose -f docker-compose.cpu.yaml up -d

3. Implantação de Código-Fonte

# Clone o projeto
git clone https://github.com/jianchang512/ChatTTS-ui.git

# Crie um ambiente virtual
python3 -m venv venv
source ./venv/bin/activate

# Instale as dependências
pip3 install -r requirements.txt

# Inicie o serviço
python3 app.py

Requisitos do Sistema

Requisitos de Hardware

  • Memória: Recomenda-se 4GB ou mais.
  • Placa Gráfica: Placa gráfica NVIDIA com 4GB ou mais de memória de vídeo (opcional, para aceleração por GPU).
  • Armazenamento: Pelo menos 2GB de espaço disponível (para arquivos de modelo).

Ambiente de Software

  • Python: Versões 3.9-3.11.
  • Sistema Operacional: Windows 10+, Linux, macOS.
  • Dependências: FFmpeg (deve ser instalado).
  • CUDA: 11.8+ (aceleração por GPU opcional).

Cenários de Aplicação

🎭 Criação de Conteúdo

  • Produção de dublagem e narração de vídeos.
  • Geração de podcasts e conteúdo de áudio.
  • Síntese de voz para materiais de treinamento educacional.

🤖 Integração de Desenvolvimento

  • Respostas de voz para chatbots.
  • Transmissão de voz para atendimento ao cliente inteligente.
  • Dicas de voz para aplicações.

📢 Aplicações Comerciais

  • Dublagem para anúncios e vídeos promocionais.
  • Navegação por voz para sistemas telefônicos.
  • Voz para apresentações multimídia.

Vantagens do Projeto

  1. Fácil de Usar: Fornece uma interface web intuitiva, sem necessidade de conhecimento técnico especializado.
  2. Implantação Simples: Múltiplos métodos de implantação, adequados para usuários com diferentes níveis de habilidade técnica.
  3. Desempenho Excelente: Suporta aceleração por GPU, com rápida velocidade de síntese de fala.
  4. Código Aberto e Gratuito: Totalmente de código aberto, pode ser usado e modificado livremente.
  5. Manutenção Ativa: Atualizações e correções de bugs contínuas, com bom suporte da comunidade.
  6. API Completa: Fornece interfaces API completas, facilitando o desenvolvimento de integração.

Conclusão

ChatTTS-ui é uma solução de texto para fala completa e fácil de usar. Ele empacota o poderoso modelo ChatTTS em uma interface amigável, fornecendo aos usuários individuais e desenvolvedores uma ferramenta conveniente de síntese de voz. Seja para criação de conteúdo, desenvolvimento de aplicações ou aplicações comerciais, é possível encontrar cenários de uso adequados.