كشفت مجموعة "علي بابا" الصينية عن أحدث ابتكاراتها في مجال الذكاء الاصطناعي، وهو نموذج Qwen2.5-Omni-7B، الذي يمتاز بقدرات متعددة الوسائط تتيح له معالجة النصوص والصور والمقاطع الصوتية والفيديوهات، بالإضافة إلى توليد استجابات نصية وصوتية في الوقت الفعلي. يتميز هذا النموذج بقدرته على العمل بكفاءة عالية على الأجهزة المحمولة، مما يجعله مثالياً لتطوير تطبيقات الذكاء الاصطناعي الصوتية الذكية التي تتطلب تقنيات منخفضة التكلفة.
ويأتي إطلاق هذا النموذج في إطار استراتيجية علي بابا لتعزيز وجودها في مجال الذكاء الاصطناعي، حيث يتضمن تصميم Qwen2.5-Omni-7B معمارية مبتكرة تعرف باسم Thinker-Talker، التي تسمح له بالتفاعل مع وسائط متعددة مثل النصوص والصور والصوت والفيديو، مما يضمن استجابة فورية وصوتية في الوقت نفسه. ويتميز هذا النظام بدمج تقنية TMRoPE التي تساعد على مزامنة المحتوى المرئي مع الإشارات الصوتية، مما يعزز من الواقعية في التفاعل.
النموذج الجديد يوفر إمكانيات تفاعلية متقدمة، حيث يتيح للمستخدمين طرح الأسئلة والحصول على إجابات دقيقة وسريعة بناءً على البيانات المستخلصة من محيطهم باستخدام كاميرا الهاتف. هذا يفتح المجال لاستخدامات مبتكرة مثل مساعدة الأشخاص المكفوفين عبر تقديم أوصاف صوتية لما تراه كاميرا هواتفهم الذكية، مما يسهل تنقلهم في بيئتهم.
من جانب آخر، أظهر النموذج الجديد أداء متميزاً خلال الاختبارات، حيث تفوق في قدراته الصوتية على نموذج Qwen2-Audio المماثل له بالحجم، وحقق نتائج قريبة من نموذج Qwen2.5-VL-7B المتخصص في الوسائط المتعددة. كما أثبت نجاحه في تنفيذ التعليمات المنطوقة بنفس الكفاءة التي يحققها في التعامل مع التعليمات النصية، وفقاً لمؤشرات تقييم عالمية مثل MMLU وGSM8K.
إطلاق Qwen2.5-Omni-7B هو جزء من خطة استراتيجية أكبر لشركة "علي بابا" في مجال الذكاء الاصطناعي، حيث أعلنت الشركة في فبراير الماضي عن استثمار ضخم بقيمة 53 مليار دولار، سيتم ضخها في السنوات الثلاث المقبلة لتطوير بنية الحوسبة السحابية وتقنيات الذكاء الاصطناعي. وفي خطوة كبيرة، أعلنت "علي بابا" عن شراكة مع شركة "أبل" لدمج تقنيات الذكاء الاصطناعي في هواتف iPhone المخصصة للسوق الصينية، كما توسع تعاونها مع شركة BMW لتسريع دمج تقنيات الذكاء الاصطناعي في السيارات الذكية.
ويأتي هذا التوسع في ظل منافسة شديدة في سوق الذكاء الاصطناعي بالصين، حيث تعمل الشركات الكبرى مثل "علي بابا" على طرح منتجات مبتكرة بمعدلات غير مسبوقة، تجمع بين الكفاءة العالية والتكلفة المنخفضة. ويمثل إطلاق هذا النموذج في منصة "علي بابا كلاود" مع توفيره كمصدر مفتوح عبر منصتي GitHub وHugging Face خطوة كبيرة نحو تعزيز التوجه نحو البرمجيات المفتوحة في الصين.
من الجدير بالذكر أن "علي بابا" قد دخلت الآن في منافسة قوية مع الشركات الكبرى مثل OpenAI، التي قدمت للمستخدمين عبر منصتها ChatGPT إمكانيات تفاعلية مماثلة في ديسمبر الماضي، بالإضافة إلى "جوجل" التي تستعد لدخول هذا المجال مع ميزة "Pixel Sense" المنتظرة.
إرسال تعليق