Home
Login
jianchang512/ChatTTS-ui

ChatTTS-ui: واجهة ويب محلية بسيطة تستخدم ChatTTS لتحويل النص إلى كلام، مع دعم توفير واجهة برمجة تطبيقات API خارجيًا

NOASSERTIONPython 7.1kjianchang512 Last Updated: 2025-04-21
https://github.com/jianchang512/ChatTTS-ui

مشروع ChatTTS-ui: شرح تفصيلي

نظرة عامة على المشروع

ChatTTS-ui هو مشروع واجهة ويب محلية بسيطة تعتمد على ChatTTS، تم إنشاؤه وصيانته بواسطة المطور jianchang512. يوفر المشروع للمستخدمين واجهة ويب سهلة الاستخدام لاستخدام ChatTTS في تركيب الكلام من النص، كما يوفر واجهات برمجة تطبيقات (APIs) كاملة للاستدعاء الخارجي.

عنوان المشروع: https://github.com/jianchang512/ChatTTS-ui

وصف المشروع: واجهة ويب محلية بسيطة، تستخدم ChatTTS لتركيب الكلام من النص، مع دعم توفير واجهات برمجة تطبيقات خارجية.

الوظائف/الميزات الأساسية

🎯 الوظائف الرئيسية

  • تركيب الكلام من النص: يدعم تحويل النصوص المختلطة باللغات الصينية والإنجليزية والأرقام والرموز إلى كلام طبيعي وسلس.
  • دعم نغمات صوتية متعددة: يوفر مجموعة متنوعة من النغمات الصوتية المحددة مسبقًا، ويمكن للمستخدمين اختيار أنماط صوتية مختلفة حسب الحاجة.
  • واجهة ويب: يوفر واجهة تشغيل ويب محلية بسيطة وبديهية، يمكن استخدامها دون تكوين معقد.
  • واجهات برمجة تطبيقات (APIs): واجهات برمجة تطبيقات RESTful كاملة، مما يسهل التكامل مع التطبيقات الأخرى.
  • دعم عبر الأنظمة الأساسية: يدعم أنظمة تشغيل متعددة مثل Windows و Linux و macOS.

🚀 الخصائص التقنية

  • تسريع GPU: يدعم تسريع NVIDIA CUDA و AMD ROCm GPU، مما يحسن سرعة تركيب الكلام.
  • نشر Docker: يوفر حل نشر حاويات Docker، مما يبسط عملية النشر.
  • طرق تثبيت متعددة: يدعم طرق تثبيت متعددة مثل الحزم المترجمة مسبقًا، ونشر التعليمات البرمجية المصدر، و Docker.
  • تخصيص النغمات الصوتية: يدعم قيم البذور المخصصة للنغمات الصوتية، مما يولد أصواتًا مخصصة.
  • دعم الأحرف التحكمية: يدعم الأحرف التحكمية في الكلام مثل الضحك والتوقف المؤقت، مما يعزز تأثير التعبير.

📋 اللغات والتنسيقات المدعومة

  • دعم اللغة: الصينية والإنجليزية والمزيج بينهما.
  • تنسيق الإخراج: ملف صوتي WAV.
  • معالجة النصوص: يدعم المحتوى النصي المعقد مثل الأرقام والرموز والأحرف التحكمية.

طرق النشر

1. نشر الحزمة المترجمة مسبقًا (موصى به للمبتدئين)

  • قم بتنزيل الحزمة المضغوطة من صفحة الإصدارات (Releases).
  • قم بفك ضغطها وتشغيل app.exe مباشرة.
  • سيتم فتح المتصفح تلقائيًا لزيارة http://127.0.0.1:9966

2. نشر Docker

# إصدار GPU
docker compose -f docker-compose.gpu.yaml up -d

# إصدار CPU
docker compose -f docker-compose.cpu.yaml up -d

3. نشر التعليمات البرمجية المصدر

# استنساخ المشروع
git clone https://github.com/jianchang512/ChatTTS-ui.git

# إنشاء بيئة افتراضية
python3 -m venv venv
source ./venv/bin/activate

# تثبيت التبعيات
pip3 install -r requirements.txt

# بدء تشغيل الخدمة
python3 app.py

متطلبات النظام

متطلبات الأجهزة

  • الذاكرة: يوصى بـ 4 جيجابايت أو أكثر.
  • بطاقة الرسومات: بطاقة رسومات NVIDIA بذاكرة 4 جيجابايت أو أكثر (اختياري، لتسريع GPU).
  • التخزين: مساحة متاحة لا تقل عن 2 جيجابايت (لملفات النموذج).

بيئة البرمجيات

  • Python: الإصدارات 3.9-3.11.
  • نظام التشغيل: Windows 10+، Linux، macOS.
  • التبعيات: FFmpeg (يجب تثبيته).
  • CUDA: 11.8+ (اختياري لتسريع GPU).

سيناريوهات التطبيق

🎭 إنشاء المحتوى

  • إنتاج الدبلجة والتعليق الصوتي للفيديو.
  • إنشاء البودكاست والمحتوى الصوتي.
  • تركيب الكلام للمواد التعليمية والتدريبية.

🤖 تطوير التكامل

  • الردود الصوتية لروبوتات الدردشة.
  • البث الصوتي لخدمة العملاء الذكية.
  • مطالبات صوتية لتطبيقات الهاتف المحمول.

📢 التطبيقات التجارية

  • الدبلجة للإعلانات والأفلام الترويجية.
  • التنقل الصوتي لأنظمة الهاتف.
  • العروض التقديمية متعددة الوسائط.

مزايا المشروع

  1. سهولة الاستخدام: يوفر واجهة ويب بديهية، لا تتطلب خلفية تقنية متخصصة.
  2. نشر بسيط: طرق نشر متعددة، مناسبة للمستخدمين ذوي المستويات التقنية المختلفة.
  3. أداء ممتاز: يدعم تسريع GPU، سرعة تركيب الكلام سريعة.
  4. مفتوح المصدر ومجاني: مفتوح المصدر بالكامل، يمكن استخدامه وتعديله بحرية.
  5. صيانة نشطة: تحديثات مستمرة وإصلاح الأخطاء، دعم مجتمعي جيد.
  6. واجهات برمجة تطبيقات كاملة: يوفر واجهات برمجة تطبيقات كاملة، مما يسهل تطوير التكامل.

ملخص

ChatTTS-ui هو حل كامل الميزات وسهل الاستخدام لتحويل النص إلى كلام. إنه يغلف نموذج ChatTTS القوي في واجهة سهلة الاستخدام، مما يوفر أدوات تركيب كلام مريحة للمستخدمين الأفراد والمطورين. سواء كان إنشاء محتوى أو تطوير تطبيقات أو تطبيقات تجارية، يمكنك العثور على سيناريو استخدام مناسب.