xAI تقدم نموذج إنشاء الفيديو Imagine v0.9: إكمال الإنشاء في 15 ثانية، ومتاح مجانًا لجميع المستخدمين
ملخص
أطلقت xAI رسميًا نموذجها للذكاء الاصطناعي لتوليد الفيديو Imagine v0.9 في 7 أكتوبر 2025 (بتوقيت شرق الولايات المتحدة)، وأتاحته مجانًا لجميع المستخدمين. يمثل هذا أول ترقية رئيسية منذ إطلاق Imagine v0.1 في يوليو من هذا العام. حقق الإصدار الجديد تحسينات ملحوظة في جودة الصورة، والحركة الديناميكية، وتوليد الصوت، وأصبح قادرًا على إنتاج مؤثرات صوتية متزامنة مع حركة الفيديو.
إنجازات تقنية وميزات أساسية
شهد Imagine v0.9 ترقيات واسعة النطاق في جودة الصورة، وتأثيرات الحركة، وتوليد الصوت. من أبرز ميزات هذا النموذج قدرته الأصلية على توليد الصوت والفيديو بشكل متكامل، مما يسمح بإنشاء مقاطع فيديو بجودة سينمائية تتضمن مؤثرات صوتية متزامنة مباشرة، دون الحاجة إلى التحرير اللاحق.
في الفيديو التجريبي الرسمي، تصدر التنانين التي تم إنشاؤها زئيرًا واقعيًا عند فتح وإغلاق أفواهها، ويمكن للروبوتات التحدث بالتزامن مع حركة شفاه البشر، بل ويمكنها توليد محتوى غنائي معبر.
التحكم في الحركة والتأثيرات البصرية
حقق الإصدار v0.9 تقدمًا كبيرًا في التحكم بالحركة، حيث أصبح قادرًا على إعادة إنتاج الحركات الديناميكية المعقدة بسلاسة، مثل قفزات التزلج، من الإقلاع إلى الهبوط دون تشوه. بالإضافة إلى ذلك، يدعم النموذج إضافة تأثيرات الكاميرا الديناميكية مثل تحويل التركيز الذكي، والذي يمكنه طمس مشاهد الشارع بناءً على تغيرات موضع الكاميرا لإبراز الشخصية الرئيسية.
ميزة سرعة التوليد
صرح إيلون ماسك على منصة التواصل الاجتماعي X بأن Imagine v0.9 يمكنه إكمال توليد الفيديو في غضون 15 ثانية. تمثل هذه السرعة ميزة واضحة مقارنة بمنافسه Sora 2 من OpenAI. وبحسب التقارير، قد يستغرق Sora 2 من دقيقة إلى دقيقتين لتوليد فيديو واحد.
إمكانية الوصول ودمج المنتج
تم دمج Imagine v0.9 في ميزة توليد الفيديو الخاصة بـ Grok، وهو متاح مجانًا لجميع المستخدمين، بمن فيهم المستخدمون المجانيون. يمكن للمستخدمين الوصول إلى هذه الميزة بزيارة grok.com/imagine.
كما شجع ماسك المستخدمين على تجربة واجهة Grok التي تعتمد على الصوت أولاً. من خلال تمكين ميزة "فتح التطبيق بوضع الصوت" في الإعدادات، يمكن للمستخدمين إنشاء مقاطع فيديو وصور ونصوص مباشرة باستخدام أصواتهم، دون الحاجة إلى إدخال نص.
الميزات المثيرة للجدل لا تزال قائمة
تجدر الإشارة إلى أن ميزة توليد الفيديو في Grok تتضمن وضع "Spicy" (المثير للجدل)، والذي يسمح بإنشاء محتوى قد يتم حظره بواسطة نماذج الذكاء الاصطناعي لتوليد الفيديو من Google أو OpenAI. تم الاحتفاظ بهذه الميزة في الإصدار v0.9، مما أثار نقاشات حول مخاطر التزييف العميق وتنظيم المحتوى.
إحدى الترقيات المهمة في v0.9 هي السماح للمستخدمين بإضافة أصوات مخصصة إلى مقاطع الفيديو. بعد نضوج هذه التقنية، قد يقوم المستخدمون بتحميل صور لشخصيات عامة وإنشاء مقاطع فيديو واقعية لهم وهم يقولون محتوى معينًا، مما يشكل خطر التزييف العميق.
خلفية المنافسة في السوق
يأتي إطلاق Imagine v0.9 في وقت تتصاعد فيه المنافسة في مجال توليد الفيديو بالذكاء الاصطناعي. فقد أطلقت OpenAI نموذجها الرائد لتوليد الفيديو والصوت Sora 2 في 30 سبتمبر. وتُعتبر ترقية xAI هذه ردًا مباشرًا على Sora 2.
على عكس نظام الدعوات الذي يتبعه Sora 2، فإن Imagine v0.9 متاح مجانًا لجميع المستخدمين، مما يجذب قدرًا كبيرًا من الزيارات من خلال توفير وصول مجاني.
القيود الحالية
كشفت الاختبارات عن بعض المشكلات في Imagine v0.9 عند الاستخدام الفعلي، بما في ذلك سوء فهم المطالبات، وعدم اتساق الفيديو والصوت، وعدم وجود تحذيرات بشأن مخاطر التزييف العميق، وعدم القدرة على معالجة اللغة الصينية، وغيرها. بالإضافة إلى ذلك، أفاد بعض المستخدمين بأن نسخة الويب لا تعمل بشكل صحيح مؤقتًا.
على الرغم من هذه القيود، لا يزال Imagine v0.9 يمثل تقدمًا مهمًا في تقنية توليد الفيديو بالذكاء الاصطناعي، حيث يوفر لمنشئي المحتوى أداة سريعة ومجانية لإنتاج الفيديو. ومع التكرار المستمر للتكنولوجيا، من المتوقع أن يعزز هذا النموذج قدراته وجودته بشكل أكبر في الأشهر القادمة.