آخر الأخبار

Stability AI تكشف عن نموذج جديد لتوليد الفيديو من زوايا متعددة بالذكاء الإصنطاعي


 أعلنت شركة Stability AI عن إطلاق نموذجها الجديد Stable Video 4D، الذي يضع تقنيات توليد الفيديو على مستوى جديد. هذا النموذج الرائد قادر على تحويل مقطع فيديو واحد إلى ثمانية مقاطع من زوايا مختلفة، مما يفتح أبوابًا جديدة في عالم السينما والألعاب والواقع المعزز والافتراضي.

صرح فارون جامباني، قائد فريق أبحاث الأبعاد الثلاثية في Stability AI، بأن Stable Video 4D يجمع بين مزايا النموذجين السابقين، Stable Video Diffusion وStable Video 3D، مع تحسينات ملحوظة باستخدام مجموعة بيانات متقدمة للأجسام ثلاثية الأبعاد المتحركة.

النموذج يعمل على أربعة أبعاد تشمل العرض والارتفاع والعمق والزمن، مما يسمح بعرض الأجسام المتحركة من زوايا متعددة وفي لحظات زمنية مختلفة. ويتميز بتفوقه على النماذج السابقة بفضل تقنيات الانتباه المتطورة، حيث يولد كل إطار من الفيديو مع مراعاة الإطارات المجاورة من زوايا وأوقات مختلفة، مما يعزز التماسك الثلاثي الأبعاد والانسيابية الزمنية في المقاطع المولدة.

النموذج الجديد يختلف عن تقنيات الملء التوليدي التقليدية، إذ يقوم بإنشاء المقاطع الثمانية من الصفر باستخدام الفيديو الأصلي كمرجع دون نقل مباشر لبيانات الصورة. ويعالج حاليًا مقاطع فيديو لأجسام منفردة لثوانٍ معدودة بخلفيات بسيطة، مع خطط لتطويره ليشمل مقاطع أطول ومشاهد أكثر تعقيدًا في المستقبل.

Stable Video 4D متاح حاليًا للتقييم البحثي عبر منصة Hugging Face، بينما لم تكشف Stability AI بعد عن أي خطط تجارية مستقبلية تتعلق بالنموذج.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.