أثار تقرير حديث من شركة Copyleaks المتخصصة في تحليل النصوص باستخدام الذكاء الاصطناعي جدلًا واسعًا، بعدما كشف أن نموذج الذكاء الاصطناعي DeepSeek-R1 قد يكون قد دُرِّب على مخرجات ChatGPT من OpenAI، حيث تتطابق بصمته الأسلوبية مع أسلوب OpenAI بنسبة تصل إلى 74.2٪.
وأوضحت Copyleaks أن دراستها الأخيرة كشفت أن DeepSeek-R1 يعتمد بشكل كبير على أسلوب OpenAI في الصياغة والهيكلة اللغوية واختيار المفردات، مما يثير تساؤلات حول مصادر بياناته التدريبية. وقد استند البحث إلى تحليل نصوص من أربعة نماذج رئيسية، وهي Claude وGemini وLlama وOpenAI، باستخدام ثلاثة مصنفات ذكاء اصطناعي متطورة.
تعتمد تقنية المصنفات الذكية على تحليل الأنماط اللغوية لتصنيف النصوص، وقد أظهرت نتائج البحث أن أسلوب DeepSeek-R1 يتطابق مع OpenAI بدرجة كبيرة. ويعزز هذا الاكتشاف احتمال أن يكون النموذج قد استخدم مخرجات ChatGPT خلال عملية تدريبه، خاصة مع إعلان DeepSeek سابقًا أنها اعتمدت تقنية "التقطير" لخفض تكاليف التدريب، وهي طريقة تعتمد على استخدام مخرجات نموذج متقدم لتدريب نموذج آخر بدلاً من بدء التدريب من الصفر.
ويأتي هذا الكشف في وقت أحدثت فيه نماذج DeepSeek اضطرابًا في سوق الذكاء الاصطناعي، مما أدى إلى خسائر ضخمة في سوق الأسهم الأمريكية، تجاوزت تريليون دولار، إذ بدأ المستثمرون في إعادة تقييم تكاليف تطوير الذكاء الاصطناعي. وقد أثّر ذلك بشكل مباشر على شركات مثل إنفيديا التي تعتمد على بيع العتاد المستخدم في تطوير النماذج الذكية، حيث كانت من أكثر الشركات تضررًا.
من جانبها، لم تقدم شركة DeepSeek الصينية تفاصيل واضحة حول بيانات تدريب نموذجها، مما يثير تساؤلات حول شرعيته ومدى موثوقية إجاباته. ويرى الخبراء أن هذا قد يمنحها ميزة غير عادلة مقارنة بالمنافسين، خاصة في ظل عدم وضوح مصادر البيانات.
يذكر أن OpenAI كانت قد وجهت اتهامات سابقة لـ DeepSeek باستخدام مخرجات ChatGPT في تدريب نماذجها، دون تقديم أدلة قاطعة، لكن بعض المحللين يرون أن DeepSeek قد تواجه مستقبلاً قرارات حظر محتملة في الولايات المتحدة بسبب هذه القضية.
إرسال تعليق