آخر الأخبار

أوبن أي آي تحدث ChatGPT بقدرات متقدمة لإنشاء الصور


 أعلنت شركة OpenAI عن تحديث جديد لروبوت الذكاء الاصطناعي ChatGPT، يمنح المستخدمين القدرة على إنشاء صور أكثر تعقيدًا ودقة بناءً على أوصاف مفصلة، مما يشكل قفزة نوعية في إمكانيات الذكاء الاصطناعي التوليدي.  

ويعتمد التحديث الجديد على نموذج GPT-4o، الذي يمكّن ChatGPT من تحليل النصوص والصور معًا ضمن نظام متكامل، ما يتيح للمستخدمين إدخال تفاصيل دقيقة لإنشاء صور فريدة وفقًا لمتطلباتهم الخاصة.  

وأوضحت OpenAI أن المستخدمين بات بإمكانهم وصف صور مركبة، مثل مشاهد كرتونية تتكون من عدة لوحات، مع تحديد الشخصيات والتفاصيل داخل كل لوحة، ليقوم ChatGPT بإنتاج الصورة بدقة عالية وفقًا للمواصفات المطلوبة.  

وعلى الرغم من أن الإصدارات السابقة من ChatGPT كانت تمتلك ميزة توليد الصور، إلا أنها لم تكن قادرة على دمج مفاهيم معقدة ومتعددة في صورة واحدة بدقة كبيرة. كما كانت تعاني من مشاكل في إدراج النصوص داخل الصور، حيث كانت النتائج غالبًا غير واضحة، لكن التحديث الجديد يحل هذه المشكلة عبر تمكين الذكاء الاصطناعي من إنشاء نصوص مقروءة داخل الصور بسهولة.  

وتتيح تقنية GPT-4o للمستخدمين التفاعل مع الصور وتعديلها بمرونة، حيث يمكنهم تحميل صورة وطلب تغييرات عليها مثل تعديل الألوان أو إضافة عناصر جديدة دون الحاجة إلى إعادة إدخال وصف كامل للصورة.  

وفي هذا السياق، صرّح غابرييل غو، الباحث في OpenAI، بأن "هذا التطوير يشكّل نقلة نوعية في الذكاء الاصطناعي"، مشيرًا إلى أن النماذج الجديدة لم تعد تفصل بين إنشاء النصوص والصور، بل توحّد العمليتين للحصول على نتائج أكثر دقة وسلاسة.  

كما أضاف غو أن الأنظمة السابقة كانت تواجه تحديات في إنتاج صور لعناصر غير تقليدية، مثل دراجة ذات عجلات مثلثة، لكن مع التحديث الجديد، أصبح ChatGPT قادرًا على التعامل مع هذه الطلبات بكفاءة أعلى.  

وأكدت OpenAI أن هذه الميزة ستكون متاحة لجميع المستخدمين، سواء عبر الإصدار المجاني أو من خلال الاشتراكات المدفوعة، إلا أن مستخدمي النسخة المجانية سيواجهون قيودًا على عدد الصور التي يمكنهم إنشاؤها.  

وقد أصدرت الشركة عدة مقاطع فيديو تستعرض إمكانيات GPT-4o في تعديل وإنشاء الصور، حيث يمكن للمستخدمين متابعة العملية خطوة بخطوة والتفاعل مع ChatGPT لتحسين النتائج وفقًا لاحتياجاتهم.  

جدير بالذكر أن ChatGPT تم إطلاقه لأول مرة في أواخر عام 2022، حيث كان يقتصر على معالجة النصوص والإجابة على الاستفسارات، لكنه لم يكن يملك القدرة على إنشاء الصور حينها. وبعد ذلك أطلقت OpenAI نموذج DALL-E لتوليد الصور بشكل منفصل، لكن مع التحديث الجديد، تم دمج النظامين معًا في منصة واحدة، مما يمنح المستخدمين تجربة متكاملة تجمع بين قوة النصوص والصور في آن واحد.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.