Home
Login

免费使用微软Edge在线文本转语音服务的Python模块,无需Edge浏览器、Windows系统或API密钥

LGPL-3.0Python 8.4krany2 Last Updated: 2025-05-03

Edge-TTS 项目详细介绍

项目概述

Edge-TTS 是一个功能强大的Python模块,允许您使用微软Edge的在线文本转语音服务,无需安装Microsoft Edge浏览器、Windows系统或API密钥。这个项目为开发者提供了一个简单易用的接口来访问微软的高质量语音合成服务。

项目地址

核心特性

1. 零配置使用

  • 无需Microsoft Edge浏览器
  • 无需Windows操作系统
  • 无需API密钥或账户注册
  • 完全免费使用

2. 多种使用方式

  • 命令行工具: edge-ttsedge-playback 命令
  • Python模块: 可直接在Python代码中调用
  • 批量处理: 支持批量文本转语音

3. 丰富的语音选择

  • 支持多种语言和地区
  • 提供男声和女声选项
  • 包含不同的语音个性和风格

安装方法

标准安装

pip install edge-tts

使用pipx安装(推荐用于命令行工具)

pipx install edge-tts

基本使用方法

命令行使用

基础文本转语音

edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

实时播放(需要mpv播放器)

edge-playback --text "Hello, world!"

列出所有可用语音

edge-tts --list-voices

使用特定语音

edge-tts --voice ar-EG-SalmaNeural --text "مرحبا كيف حالك؟" --write-media hello_in_arabic.mp3

语音参数调整

调整语速

edge-tts --rate=-50% --text "Hello, world!" --write-media hello_slow.mp3

调整音量

edge-tts --volume=-50% --text "Hello, world!" --write-media hello_quiet.mp3

调整音调

edge-tts --pitch=-50Hz --text "Hello, world!" --write-media hello_low_pitch.mp3

支持的语言和地区

Edge-TTS支持众多语言和地区变体,包括但不限于:

  • 阿拉伯语: 多个地区变体(埃及、阿联酋、巴林等)
  • 中文: 简体中文、繁体中文等
  • 英语: 美式、英式、澳式等多种口音
  • 法语: 法国、加拿大等
  • 德语: 德国、奥地利等
  • 日语: 日本
  • 韩语: 韩国
  • 西班牙语: 西班牙、墨西哥、阿根廷等
  • 其他: 包括南非语、阿姆哈拉语等少数语言

Python编程接口

Edge-TTS可以作为Python模块直接在代码中使用,适合集成到各种应用程序中。

技术特点

1. 输出格式

  • 音频文件: 支持MP3格式输出
  • 字幕文件: 支持SRT格式字幕,便于同步显示

2. SSML支持限制

由于微软的安全限制,自定义SSML功能已被移除。服务只允许使用微软Edge本身能生成的SSML格式,这意味着只支持单个<voice>标签和其内的单个<prosody>标签。

3. 参数控制

  • 语速控制: 通过--rate参数调整
  • 音量控制: 通过--volume参数调整
  • 音调控制: 通过--pitch参数调整

应用场景

1. 内容创作

  • 播客制作
  • 视频配音
  • 有声读物制作

2. 无障碍应用

  • 网页内容朗读
  • 文档语音化
  • 视障人士辅助工具

3. 教育培训

  • 语言学习材料
  • 在线课程配音
  • 发音示例生成

4. 自动化应用

  • 智能助手语音反馈
  • 通知系统语音播报
  • 批量内容处理

相关项目

多个开源项目使用了edge-tts模块:

  • hass-edge-tts: Home Assistant的TTS集成
  • Podcastfy: 播客制作工具
  • tts-samples: TTS语音样本收集项目

优势总结

  1. 完全免费: 无需支付任何费用
  2. 高质量语音: 基于微软先进的语音合成技术
  3. 简单易用: 安装和使用都非常简单
  4. 跨平台: 支持Linux、macOS、Windows
  5. 多语言: 支持全球主要语言
  6. 开源: 代码开源,可自由修改和分发
  7. 活跃维护: 项目持续更新和维护

注意事项

  1. 网络依赖: 需要互联网连接来访问微软的在线服务
  2. 播放依赖: edge-playback命令在非Windows系统上需要安装mpv播放器
  3. 服务限制: 受微软服务条款约束,可能存在使用频率限制
  4. SSML限制: 不支持复杂的SSML自定义,只能使用基本的语音参数调整

总结

Edge-TTS是一个非常实用的文本转语音工具,它巧妙地利用了微软Edge浏览器的在线TTS服务,为用户提供了免费、高质量的语音合成解决方案。无论是个人使用还是项目集成,都是一个值得推荐的工具。其简单的安装和使用方式,加上丰富的语言支持,使其成为文本转语音需求的理想选择。