MockingBird هو مشروع مفتوح المصدر لاستنساخ الصوت بالذكاء الاصطناعي، قادر على استنساخ صوت أي شخص في غضون 5 ثوانٍ فقط، وإنشاء محتوى صوتي عشوائي في الوقت الفعلي. يعتمد هذا المشروع على تقنية التعلم العميق، وهو مُحسَّن خصيصًا للغة الماندرين الصينية، وهو حل قوي لتحويل النص إلى كلام (TTS).
يعتمد MockingBird على إطار تعلم عميق متعدد المراحل:
استخدم المشروع العديد من مجموعات البيانات الصوتية الصينية عالية الجودة للتدريب، مما يضمن قدرة النموذج على فهم وإنشاء الكلام الصيني.
# إنشاء بيئة conda
conda create -n mockingbird python=3.9
conda activate mockingbird
# استنساخ المشروع
git clone https://github.com/babysor/MockingBird.git
cd MockingBird
# تثبيت التبعيات
pip install -r requirements.txt
pip install webrtcvad-wheels
pip install torch torchvision torchaudio
MockingBird هو مشروع مفتوح المصدر قوي لاستنساخ الصوت بالذكاء الاصطناعي، وهو مناسب بشكل خاص لسيناريوهات تطبيقات الصوت الصينية. فهو يجمع بين تقنية التعلم العميق المتقدمة والتنفيذ الهندسي العملي، مما يوفر حلاً ممتازًا لمجال تركيب الكلام. سواء كان تطبيقًا تجاريًا أو بحثًا أكاديميًا، يمكن لـ MockingBird توفير خدمات استنساخ صوت عالية الجودة.