OpenVoice هو مشروع مفتوح المصدر لتقنية استنساخ الصوت الفوري، تم تطويره بالاشتراك بين معهد ماساتشوستس للتكنولوجيا (MIT) و MyShell. يعتمد المشروع على نموذج أساسي للصوت، مما يتيح استنساخًا وتوليفًا عالي الجودة للصوت متعدد اللغات. منذ مايو 2023، يوفر OpenVoice قدرات استنساخ الصوت الفوري لمنصة MyShell.ai، وبحلول نوفمبر 2023، تم استخدامه عشرات الملايين من المرات من قبل المستخدمين في جميع أنحاء العالم.
تم بناء OpenVoice على المشاريع مفتوحة المصدر الممتازة التالية:
بالإضافة إلى اللغات المدعومة أصلاً، يمكن لـ OpenVoice معالجة مهام استنساخ الصوت بلغات أخرى من خلال قدرة التعلم بدون عينات.
# إنشاء بيئة افتراضية
conda create -n openvoice python=3.9
conda activate openvoice
# استنساخ المشروع
git clone https://github.com/myshell-ai/OpenVoice.git
cd OpenVoice
# تثبيت التبعيات
pip install -e .
يوفر المشروع عروض Jupyter Notebook كاملة:
demo_part1.ipynb
: يعرض التحكم المرن في نمط الصوت.demo_part2.ipynb
: يوضح وظيفة استنساخ الصوت عبر اللغات.تم نشر نتائج البحث في المشروع في ورقة أكاديمية بعنوان "OpenVoice: Versatile Instant Voice Cloning"، والتي تشرح بالتفصيل المبادئ التقنية والنتائج التجريبية.
يمثل OpenVoice أحدث ما توصلت إليه تقنية استنساخ الصوت، ومن خلال التطوير المشترك بين MIT و MyShell، فإنه يوفر للمطورين والباحثين في جميع أنحاء العالم حلاً قويًا ومرنًا ومجانيًا لاستنساخ الصوت.