أظهرت دراسة حديثة أجراها باحثون في شركة OpenAI أن النماذج المتقدمة من الذكاء الاصطناعي لا تزال غير قادرة على التفوق على المبرمجين البشر، رغم التقدم السريع في هذا المجال. يأتي ذلك في ظل تصريحات سابقة للرئيس التنفيذي سام ألتمان، الذي أشار إلى إمكانية تفوق الذكاء الاصطناعي على مهندسي البرمجيات المبتدئين قبل نهاية العام الحالي.
اعتمدت الدراسة على معيار جديد يُدعى SWE-Lancer، طُوّر باستخدام أكثر من 1400 مهمة برمجية مستمدة من منصة Upwork للعمل الحر. وخضع للاختبار ثلاثة نماذج ذكاء اصطناعي متطورة، شملت نموذج o1 من OpenAI، بالإضافة إلى GPT-4o الرائد من الشركة نفسها، إلى جانب نموذج Claude 3.5 Sonnet الذي طورته شركة Anthropic.
ركز الاختبار على نوعين رئيسيين من المهام البرمجية، الأول يتعلق باتخاذ قرارات إدارية عالية المستوى لإدارة المشاريع، بينما يتناول الثاني عمليات التصحيح البرمجي. ولضمان نزاهة التقييم، لم يُسمح لهذه النماذج بالوصول إلى الإنترنت، ما حرمها من البحث عن حلول جاهزة أو الاعتماد على أمثلة منشورة مسبقًا.
النتائج أظهرت أن هذه النماذج واجهت صعوبات كبيرة في تنفيذ المهام المطلوبة، إذ لم تتمكن إلا من إصلاح الأخطاء البرمجية البسيطة، بينما عجزت عن تحديد أسباب الأخطاء الجذرية في المشاريع المعقدة. وعلى الرغم من أن الذكاء الاصطناعي يتمتع بسرعة أكبر مقارنة بالبشر في تنفيذ بعض العمليات، إلا أن افتقاره إلى الفهم العميق للأخطاء أدى إلى حلول غير دقيقة وغير شاملة.
بحسب الدراسة، قدّم نموذج Claude 3.5 Sonnet أداءً أفضل من نماذج OpenAI، إلا أن معظم إجاباته لم تكن صحيحة بالكامل، ما يشير إلى أن هذه النماذج لا تزال بحاجة إلى تحسينات كبيرة قبل أن تصبح بديلاً موثوقًا للمبرمجين البشر.
تؤكد هذه النتائج أن الذكاء الاصطناعي قادر على تنفيذ المهام البرمجية البسيطة بسرعة، لكنه لم يصل بعد إلى مستوى الكفاءة البشرية في التعامل مع المشاريع المعقدة. ورغم ذلك، تتجه بعض الشركات إلى تقليص أعداد المبرمجين لصالح الذكاء الاصطناعي، حتى مع عدم تفوقه الكامل في هذا المجال حتى الآن.
إرسال تعليق