Home
Login
jianchang512/ChatTTS-ui

ChatTTS-ui:一个简单的本地网页界面,使用ChatTTS将文字合成为语音,同时支持对外提供API接口

NOASSERTIONPython 7.1kjianchang512 Last Updated: 2025-04-21
https://github.com/jianchang512/ChatTTS-ui

ChatTTS-ui 项目详细介绍

项目概述

ChatTTS-ui 是一个基于 ChatTTS 的简单本地网页界面项目,由开发者 jianchang512 创建和维护。该项目为用户提供了一个友好的网页界面来使用 ChatTTS 进行文字转语音合成,同时还提供了完整的 API 接口供外部调用。

项目地址: https://github.com/jianchang512/ChatTTS-ui

项目描述: 一个简单的本地网页界面,使用ChatTTS将文字合成为语音,同时支持对外提供API接口

核心功能/特性

🎯 主要功能

  • 文字转语音合成: 支持将中文、英文、数字、符号等混合文本转换为自然流畅的语音
  • 多音色支持: 提供多种预设音色选择,用户可根据需要选择不同的声音风格
  • 网页界面: 提供简洁直观的本地网页操作界面,无需复杂配置即可使用
  • API接口: 完整的RESTful API接口,方便集成到其他应用中
  • 跨平台支持: 支持Windows、Linux、macOS等多个操作系统

🚀 技术特性

  • GPU加速: 支持NVIDIA CUDA和AMD ROCm GPU加速,提升语音合成速度
  • Docker部署: 提供Docker容器化部署方案,简化部署流程
  • 多种安装方式: 支持预编译包、源码部署、Docker等多种安装方式
  • 音色自定义: 支持自定义音色种子值,生成个性化声音
  • 控制符支持: 支持笑声、停顿等语音控制符,增强表达效果

📋 支持的语言和格式

  • 语言支持: 中文、英文及中英文混合
  • 输出格式: WAV音频文件
  • 文本处理: 支持数字、符号、控制符等复杂文本内容

部署方式

1. 预编译包部署(推荐新手)

  • 从 Releases 页面下载压缩包
  • 解压后直接运行 app.exe
  • 自动打开浏览器访问 http://127.0.0.1:9966

2. Docker部署

# GPU版本
docker compose -f docker-compose.gpu.yaml up -d

# CPU版本  
docker compose -f docker-compose.cpu.yaml up -d

3. 源码部署

# 克隆项目
git clone https://github.com/jianchang512/ChatTTS-ui.git

# 创建虚拟环境
python3 -m venv venv
source ./venv/bin/activate

# 安装依赖
pip3 install -r requirements.txt

# 启动服务
python3 app.py

系统要求

硬件要求

  • 内存: 建议4GB以上
  • 显卡: 英伟达显卡4GB以上显存(可选,用于GPU加速)
  • 存储: 至少2GB可用空间(用于模型文件)

软件环境

  • Python: 3.9-3.11版本
  • 操作系统: Windows 10+、Linux、macOS
  • 依赖: FFmpeg(必须安装)
  • CUDA: 11.8+(GPU加速可选)

应用场景

🎭 内容创作

  • 视频配音和旁白制作
  • 播客和音频内容生成
  • 教育培训材料语音合成

🤖 开发集成

  • 聊天机器人语音回复
  • 智能客服语音播报
  • 应用程序语音提示

📢 商业应用

  • 广告和宣传片配音
  • 电话系统语音导航
  • 多媒体演示语音

项目优势

  1. 易于使用: 提供直观的网页界面,无需专业技术背景
  2. 部署简单: 多种部署方式,适合不同技术水平的用户
  3. 性能优异: 支持GPU加速,语音合成速度快
  4. 开源免费: 完全开源,可自由使用和修改
  5. 活跃维护: 持续更新和bug修复,社区支持良好
  6. API完整: 提供完整的API接口,便于集成开发

总结

ChatTTS-ui 是一个功能完善、易于使用的文字转语音解决方案。它将强大的 ChatTTS 模型包装在友好的界面中,为个人用户和开发者提供了便捷的语音合成工具。无论是内容创作、应用开发还是商业应用,都能找到合适的使用场景。