آخر الأخبار

تقارير تكشف استخدام OpenAI وشركات أخرى لمحتوى YouTube في تدريب نماذج الذكاء الاصطناعي


 ظهرت مؤخرًا تقارير تزعم أن OpenAI استخدمت محتوى YouTube لتدريب نموذج تحويل النص إلى فيديو. يبدو أن شركات أخرى مثل أبل و Nvidia و Anthropic تستخدم أيضًا البيانات المتاحة للجمهور لتدريب نماذج الذكاء الاصطناعي الخاصة بها.

تفيد التقارير بأن أبل استعانت بآلاف الفيديوهات على YouTube مع ترجمات لتدريب ذكائها الاصطناعي، مما يتعارض مع سياسة محتوى المنصة. التحقيقات أظهرت أن أبل والشركات الأخرى استخدمت مجموعة بيانات تسمى YouTube Subtitles، تضمنت نصوصًا لأكثر من 173,000 فيديو من 48,000 قناة متنوعة، تشمل قنوات تعليمية مثل Khan Academy و MIT، بالإضافة إلى مواقع إخبارية مثل The Wall Street Journal وبعض أشهر المبدعين مثل MrBeast و Marques Brownlee.

ماركيز براونلي أشار إلى أن أبل تتجنب "الخطأ" تقنيًا لأنها تحصل على الذكاء الاصطناعي من شركات تستخدم النصوص من فيديوهات YouTube بدلاً من استخدام البيانات مباشرة. ومع ذلك، تظل هذه النصوص جزءًا من نماذج الذكاء الاصطناعي التي استثمر فيها المبدعون وقتهم وأموالهم، مما يجعل الأمر مشكلة متطورة ستستمر لفترة طويلة.

أداة جديدة أطلقتها Proof News تمكن المبدعين من البحث عن محتواهم في مجموعة البيانات، والتي لا تتضمن صورًا من الفيديوهات ولكن تحتوي على ترجمات بعدة لغات. أنشأ مجموعة البيانات معمل أبحاث غير ربحي يُدعى Eleuther AI يركز على تعزيز معايير العلوم المفتوحة.

حتى الآن، لم تعلق أي من الشركات المعنية بشكل رسمي على هذا الموضوع. الرئيس التنفيذي لـ YouTube، نيل موهان، أوضح سابقًا أن استخدام الشركات لمقاطع فيديو YouTube لتدريب نماذج الذكاء الاصطناعي يُعد "انتهاكًا واضحًا" لسياسات المنصة.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.