كشفت شركة الذكاء الاصطناعي الناشئة xAI عن نموذجها الأحدث في مجال الذكاء الاصطناعي، وهو نموذج Grok-1.5 Vision المتعدد الوسائط.
يأتي هذا النموذج الجديد مع القدرة على فهم النصوص ومعالجة الأشياء الموجودة في المستندات والرسوم البيانية والمخططات وصور الشاشة والصور الفوتوغرافية.
وتخطط الشركة لتوفير هذا النموذج الجديد قريبًا للمختبرين الأوائل ومستخدمي منصة Grok الحاليين.
تعليقًا على هذا الإعلان، صرحت الشركة: "يمكن لنموذج Grok-1.5 Vision منافسة النماذج الحالية في عدة مجالات، بدءًا من التفكير المتعدد التخصصات إلى فهم المستندات والرسوم البيانية والصور".
وتأتي هذه الخطوة بعد أسابيع من كشف الشركة عن نموذج روبوت الدردشة الذكاء الاصطناعي المحدث Grok-1.5.
وتشير xAI إلى تفوق Grok-1.5 Vision على منافسيه في معيار RealWorldQA، وهو معيار جديد تم إنشاؤه لتقييم الفهم المكاني في العالم الحقيقي.
وقد تم تدريب هذا المعيار باستخدام أكثر من 700 صورة وأسئلة وأجوبة لتنوع الفهم والتعرف.
تواصل xAI سعيها للتطور، وتتابع تقدمها في مجال الذكاء الاصطناعي مع الشركات الرائدة الأخرى.
وتأتي هذه الخطوة بعد فتح مصدر Grok قبل أقل من شهر، مع تفوق Grok-1.5 Vision في مجالات عدة.
إرسال تعليق