ميتا تكشف عن نموذج الذكاء الاصطناعي الجديد Spirit LM لتحسين التجارب الصوتية

أعلنت شركة ميتا عن إطلاق نموذج الذكاء الاصطناعي الجديد "Spirit LM" المفتوح المصدر، والذي يهدف إلى تطوير معالجة الصوت بشكل أكثر تقدمًا وطبيعية. يركز هذا النموذج على التغلب على التحديات المتعلقة بالنماذج المتعددة الوسائط، مع التركيز على تحسين جودة الأصوات وتقديم تجربة صوتية أكثر تعبيرًا وواقعية.

نموذج "Spirit LM" يعتمد على نموذج لغوي مدرب مسبقًا يحتوي على 7 مليارات معلمة، ويأتي بتقنية جديدة تختلف عن النماذج التقليدية التي تعتمد على تقنيات التعرف التلقائي على الكلام (ASR). ميتا أشارت إلى أن تلك التقنيات التقليدية تفتقر إلى القدرة على نقل التعبيرات الطبيعية في الصوت بشكل دقيق، مما يقلل من واقعية التفاعل الصوتي.

لتجاوز هذه التحديات، يعتمد "Spirit LM" على رموز الفونيم والنغمات ودرجات الصوت، ما يمنحه القدرة على توليد أصوات طبيعية. كما يُمكّن النموذج من التعلم المستمر لأداء مجموعة متنوعة من المهام مثل التعرف على الكلام، وتحويل النص إلى صوت، وتصنيف الكلام بطريقة متقدمة.

وقد كشفت ميتا عن هذا النموذج من خلال ورقة بحثية مفصلة تضمنت عينات صوتية توضح قدرات "Spirit LM" وتطبيقاته المحتملة. يتوقع أن يُستخدم هذا النموذج في المستقبل داخل التطبيقات المملوكة لميتا مثل واتساب وانستقرام وفيسبوك، مما يتيح للمستخدمين تجربة تفاعل صوتي أكثر تعقيدًا وطبيعية.

"Spirit LM" متاح الآن كمشروع مفتوح المصدر، مما يسمح للمطورين والباحثين بالاستفادة من إمكانياته وتطويره، وهو يعد خطوة مهمة نحو تحسين تجارب الذكاء الاصطناعي الصوتية، التي أصبحت ضرورية في التواصل الحديث.

ميتا تكشف عن نموذج الذكاء الاصطناعي الجديد Spirit LM لتحسين التجارب الصوتية

التعليقات

إرسال تعليق

اشترك في النشرة البريدية

عملة Pi Network: كل ما تحتاج معرفته عن مشروع العملة الرقمية

نموذج الاتصال