jianchang512/ChatTTS-ui

ChatTTS-ui: ChatTTSを使用してテキストを音声に合成するシンプルなローカルWebインターフェース。APIインターフェースも提供し、外部からのアクセスもサポート。

NOASSERTIONPython 7.1kjianchang512 Last Updated: 2025-04-21

https://github.com/jianchang512/ChatTTS-ui

ChatTTS-ui プロジェクト詳細

プロジェクト概要

ChatTTS-ui は、ChatTTS をベースにしたシンプルなローカルウェブインターフェースプロジェクトで、開発者 jianchang512 によって作成およびメンテナンスされています。このプロジェクトは、ユーザーフレンドリーなウェブインターフェースを提供し、ChatTTS を使用してテキストから音声への合成を行います。また、外部からの呼び出しのために完全な API インターフェースも提供します。

プロジェクトアドレス: https://github.com/jianchang512/ChatTTS-ui

プロジェクト説明: ChatTTS を使用してテキストを音声に合成するシンプルなローカルウェブインターフェース。外部への API インターフェースの提供もサポート。

主要機能/特性

🎯 主要機能

テキスト音声合成: 中国語、英語、数字、記号などの混合テキストを自然で流暢な音声に変換することをサポート。
多音色サポート: 複数のプリセットされた音色オプションを提供し、ユーザーは必要に応じて異なる音声スタイルを選択可能。
ウェブインターフェース: シンプルで直感的なローカルウェブ操作インターフェースを提供し、複雑な設定なしで使用可能。
APIインターフェース: 完全な RESTful API インターフェースを提供し、他のアプリケーションへの統合が容易。
クロスプラットフォームサポート: Windows、Linux、macOS などの複数のオペレーティングシステムをサポート。

🚀 技術特性

GPU加速: NVIDIA CUDA および AMD ROCm GPU 加速をサポートし、音声合成速度を向上。
Dockerデプロイ: Docker コンテナ化されたデプロイメントソリューションを提供し、デプロイメントプロセスを簡素化。
複数のインストール方法: プリコンパイルされたパッケージ、ソースコードデプロイメント、Docker などの複数のインストール方法をサポート。
音色カスタマイズ: カスタム音色シード値をサポートし、パーソナライズされた音声を生成。
制御文字サポート: 笑い声、一時停止などの音声制御文字をサポートし、表現効果を向上。

📋 サポートされる言語と形式

言語サポート: 中国語、英語、および中国語と英語の混合。
出力形式: WAV オーディオファイル。
テキスト処理: 数字、記号、制御文字などの複雑なテキストコンテンツをサポート。

デプロイ方法

1. プリコンパイルされたパッケージのデプロイ（初心者向け）

Releases ページから圧縮パッケージをダウンロード。
解凍後、app.exe を直接実行。
ブラウザが自動的に開き、http://127.0.0.1:9966 にアクセス。

2. Dockerデプロイ

# GPUバージョン
docker compose -f docker-compose.gpu.yaml up -d

# CPUバージョン  
docker compose -f docker-compose.cpu.yaml up -d

3. ソースコードデプロイ

# プロジェクトをクローン
git clone https://github.com/jianchang512/ChatTTS-ui.git

# 仮想環境を作成
python3 -m venv venv
source ./venv/bin/activate

# 依存関係をインストール
pip3 install -r requirements.txt

# サービスを開始
python3 app.py

システム要件

ハードウェア要件

メモリ: 4GB 以上を推奨。
グラフィックカード: NVIDIA グラフィックカード 4GB 以上のビデオメモリ（オプション、GPU 加速用）。
ストレージ: 少なくとも 2GB の空き容量（モデルファイル用）。

ソフトウェア環境

Python: 3.9-3.11 バージョン。
オペレーティングシステム: Windows 10+、Linux、macOS。
依存関係: FFmpeg（必須インストール）。
CUDA: 11.8+（GPU 加速はオプション）。

アプリケーションシナリオ

🎭 コンテンツ作成

ビデオの吹き替えとナレーションの制作。
ポッドキャストとオーディオコンテンツの生成。
教育トレーニング教材の音声合成。

🤖 開発統合

チャットボットの音声応答。
インテリジェントなカスタマーサービスの音声ブロードキャスト。
アプリケーションの音声プロンプト。

📢 ビジネスアプリケーション

広告とプロモーションビデオの吹き替え。
電話システムの音声ナビゲーション。
マルチメディアプレゼンテーションの音声。

プロジェクトの利点

使いやすさ: 直感的なウェブインターフェースを提供し、専門的な技術的背景は不要。
簡単なデプロイ: さまざまなデプロイ方法があり、さまざまな技術レベルのユーザーに適しています。
優れたパフォーマンス: GPU 加速をサポートし、音声合成速度が速い。
オープンソースで無料: 完全にオープンソースであり、自由に使用および変更可能。
活発なメンテナンス: 継続的な更新とバグ修正、良好なコミュニティサポート。
完全なAPI: 完全な API インターフェースを提供し、統合開発が容易。

まとめ

ChatTTS-ui は、機能が充実し、使いやすいテキスト音声変換ソリューションです。強力な ChatTTS モデルをフレンドリーなインターフェースでラップし、個人ユーザーと開発者に便利な音声合成ツールを提供します。コンテンツ作成、アプリケーション開発、またはビジネスアプリケーションのいずれであっても、適切な使用シナリオが見つかります。