MockingBird é um projeto de código aberto de clonagem de voz por IA, capaz de clonar a voz de qualquer pessoa em apenas 5 segundos e gerar conteúdo de voz arbitrário em tempo real. O projeto é baseado em tecnologia de aprendizado profundo, otimizado especialmente para o mandarim chinês, e é uma solução poderosa de texto para voz (TTS).
MockingBird adota uma estrutura de aprendizado profundo em múltiplas etapas:
O projeto utilizou múltiplos conjuntos de dados de voz chineses de alta qualidade para treinamento, garantindo a capacidade do modelo de entender e gerar voz chinesa.
# Criar ambiente conda
conda create -n mockingbird python=3.9
conda activate mockingbird
# Clonar o projeto
git clone https://github.com/babysor/MockingBird.git
cd MockingBird
# Instalar dependências
pip install -r requirements.txt
pip install webrtcvad-wheels
pip install torch torchvision torchaudio
MockingBird é um projeto de código aberto poderoso de clonagem de voz por IA, especialmente adequado para cenários de aplicação de voz chinesa. Ele combina tecnologia avançada de aprendizado profundo e implementação de engenharia prática, fornecendo uma excelente solução para o campo da síntese de voz. Seja para aplicações comerciais ou pesquisa acadêmica, MockingBird pode fornecer serviços de clonagem de voz de alta qualidade.