آخر الأخبار

نموذج CM3Leon الجديد من "ميتا" لتوليد صور متسقة بأقل تكلفة


 أعلنت شركة ميتا عن نموذج جديد للذكاء الاصطناعي يحمل اسم "CM3Leon"، وزعمت أنه يعتبر الأفضل في فئته في توليد الصور بناءً على الأوامر النصية. يتميز هذا النموذج، وفقًا للشركة، بأدائه الفني المتقدم في توليد صور متسقة أكثر مع الأوامر النصية، حيث يكون أكثر كفاءة ويتطلب حوسبة أقل بخمس مرات ومجموعة بيانات أصغر للتدريب مقارنةً بالنماذج الأخرى.

وتعتمد معظم مولدات الصور التي تعمل بالذكاء الاصطناعي على تقنية تُعرف باسم "الانتشار Diffusion"، والتي تتطلب حوسبة أكبر وتكلفة أعلى في التشغيل، في حين يعتمد نموذج "CM3Leon" على تقنية "الاهتمام Attention" المختلفة والتي تجعل النموذج أسرع في التدرب وخلق النتائج وأقل كلفة في التشغيل.

ويتفرد نموذج "CM3Leon" بقدرته على توليد وصف للصور، مما يمهد الطريق لنماذج فهم الصور ذات القدرات الأكبر في المستقبل، وفقًا لميتا.

وقالت الشركة عبر مدونتها الرسمية: "بفضل قدرات CM3Leon يمكن لأدوات توليد الصور إنتاج صور أكثر اتساقًا وفقًا للإرشادات النصية المدخلة، ونحن نعتقد أن الأداء القوي للنموذج - عبر مجموعة متنوعة من المهام - يمثل خطوة نحو تحسين جودة توليد الصور وفهمها".

استخدمت شركة ميتا ملايين الصور المرخصة من شركة Shutterstock في تدريب "CM3Leon"، وتحتوي أقوى نسخة من النموذج على 7 مليارات معامل، أي أكثر من ضعف ما يحتويه نموذج DALL-E 2 التابع لشركة OpenAI. يعد المعامل Parameter وحدة قياس لمهارة النموذج وقدراته.

كما استخدمت ميتا تقنية "الضبط الدقيق تحت الإشراف" لتدريب "CM3Leon"، حيث حسنت هذه التقنية أداء النموذج في توليد الصور وكتابة الوصف والتعليقات على الصور، مما يتيح الإجابة على الأسئلة حول الصور وتعديلها باستخدام الأوامر النصية.

يمكن استخدام "CM3Leon" في مجموعة واسعة من التطبيقات مثل الواقع الافتراضي والواقع المعزز والروبوتات والإعلان والتسويق.

ولم تحدد ميتا بعد موعد إصدار نموذج "CM3Leon"، ولم تكشف ما إذا كانت تنوي إطلاقه كاملاً للجمهور. ومن المتوقع أن تكشف ميتا المزيد من التفاصيل حول النموذج في وقتٍ لاحق.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.