rany2/edge-ttsPlease refer to the latest official releases for information GitHub Homepage

Módulo Python para usar o serviço de texto para voz online do Microsoft Edge gratuitamente, sem necessidade do navegador Edge, sistema Windows ou chave de API.

LGPL-3.0Python 8.4krany2 Last Updated: 2025-05-03

Apresentação Detalhada do Projeto Edge-TTS

Visão Geral do Projeto

Edge-TTS é um módulo Python poderoso que permite usar o serviço online de conversão de texto em voz do Microsoft Edge, sem a necessidade de instalar o navegador Microsoft Edge, o sistema Windows ou chaves de API. Este projeto oferece aos desenvolvedores uma interface simples e fácil de usar para acessar o serviço de síntese de voz de alta qualidade da Microsoft.

Endereço do Projeto

Repositório GitHub: https://github.com/rany2/edge-tts

Principais Características

1. Uso Sem Configuração

Não requer o navegador Microsoft Edge
Não requer o sistema operacional Windows
Não requer chaves de API ou registro de conta
Uso totalmente gratuito

2. Múltiplas Formas de Uso

Ferramenta de linha de comando: comandos edge-tts e edge-playback
Módulo Python: pode ser chamado diretamente no código Python
Processamento em lote: suporta conversão de texto em voz em lote

3. Rica Seleção de Vozes

Suporta vários idiomas e regiões
Oferece opções de vozes masculinas e femininas
Inclui diferentes personalidades e estilos de voz

Método de Instalação

Instalação Padrão

pip install edge-tts

Instalação usando pipx (recomendado para ferramentas de linha de comando)

pipx install edge-tts

Método de Uso Básico

Uso na Linha de Comando

Conversão de Texto em Voz Básica

edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

Reprodução em Tempo Real (requer o player mpv)

edge-playback --text "Hello, world!"

Listar Todas as Vozes Disponíveis

edge-tts --list-voices

Usar uma Voz Específica

edge-tts --voice ar-EG-SalmaNeural --text "مرحبا كيف حالك؟" --write-media hello_in_arabic.mp3

Ajuste de Parâmetros de Voz

Ajustar a Velocidade da Fala

edge-tts --rate=-50% --text "Hello, world!" --write-media hello_slow.mp3

Ajustar o Volume

edge-tts --volume=-50% --text "Hello, world!" --write-media hello_quiet.mp3

Ajustar o Tom

edge-tts --pitch=-50Hz --text "Hello, world!" --write-media hello_low_pitch.mp3

Idiomas e Regiões Suportados

Edge-TTS suporta vários idiomas e variantes regionais, incluindo, mas não se limitando a:

Árabe: Várias variantes regionais (Egito, Emirados Árabes Unidos, Bahrein, etc.)
Chinês: Chinês Simplificado, Chinês Tradicional, etc.
Inglês: Americano, Britânico, Australiano e outros sotaques
Francês: França, Canadá, etc.
Alemão: Alemanha, Áustria, etc.
Japonês: Japão
Coreano: Coreia do Sul
Espanhol: Espanha, México, Argentina, etc.
Outros: Incluindo africâner, amárico e outras línguas minoritárias

Interface de Programação Python

Edge-TTS pode ser usado como um módulo Python diretamente no código, adequado para integração em várias aplicações.

Características Técnicas

1. Formato de Saída

Arquivos de áudio: Suporta saída em formato MP3
Arquivos de legenda: Suporta legendas em formato SRT para fácil exibição sincronizada

2. Limitações de Suporte SSML

Devido às restrições de segurança da Microsoft, a funcionalidade SSML personalizada foi removida. O serviço só permite o uso de formatos SSML que o próprio Microsoft Edge pode gerar, o que significa que apenas uma única tag <voice> e uma única tag <prosody> dentro dela são suportadas.

3. Controle de Parâmetros

Controle de velocidade da fala: Ajuste através do parâmetro --rate
Controle de volume: Ajuste através do parâmetro --volume
Controle de tom: Ajuste através do parâmetro --pitch

Cenários de Aplicação

1. Criação de Conteúdo

Produção de podcasts
Dublagem de vídeos
Produção de audiolivros

2. Aplicações de Acessibilidade

Leitura de conteúdo de páginas web
Conversão de documentos em voz
Ferramentas de assistência para pessoas com deficiência visual

3. Educação e Treinamento

Materiais de aprendizagem de idiomas
Dublagem de cursos online
Geração de exemplos de pronúncia

4. Aplicações de Automação

Feedback de voz de assistentes inteligentes
Transmissão de voz de sistemas de notificação
Processamento em lote de conteúdo

Projetos Relacionados

Vários projetos de código aberto usam o módulo edge-tts:

hass-edge-tts: Integração TTS para Home Assistant
Podcastfy: Ferramenta de produção de podcasts
tts-samples: Projeto de coleta de amostras de voz TTS

Resumo das Vantagens

Totalmente Gratuito: Não requer o pagamento de nenhuma taxa
Voz de Alta Qualidade: Baseado na avançada tecnologia de síntese de voz da Microsoft
Simples e Fácil de Usar: A instalação e o uso são muito simples
Multiplataforma: Suporta Linux, macOS, Windows
Multilíngue: Suporta os principais idiomas do mundo
Código Aberto: Código aberto, pode ser modificado e distribuído livremente
Manutenção Ativa: O projeto é continuamente atualizado e mantido

Precauções

Dependência de Rede: Requer uma conexão com a internet para acessar os serviços online da Microsoft
Dependência de Player: O comando edge-playback requer a instalação do player mpv em sistemas não Windows
Limitações de Serviço: Sujeito aos termos de serviço da Microsoft, pode haver restrições de frequência de uso
Limitações SSML: Não suporta personalização SSML complexa, apenas ajustes básicos de parâmetros de voz podem ser usados

Conclusão

Edge-TTS é uma ferramenta de conversão de texto em voz muito prática, que utiliza inteligentemente o serviço TTS online do navegador Microsoft Edge, fornecendo aos usuários uma solução de síntese de voz gratuita e de alta qualidade. Seja para uso pessoal ou integração de projetos, é uma ferramenta recomendável. Sua instalação e uso simples, juntamente com o rico suporte a idiomas, o tornam a escolha ideal para necessidades de conversão de texto em voz.