أعلنت OpenAI يوم الثلاثاء عن ChatGPT Images 2، نموذجها الجديد للذكاء الاصطناعي الخاص بالصور. يركز التحديث على إنشاء مرئيات احترافية غنية بالنصوص مثل الرسوم البيانية وأدلة الدراسة. وسيطرح النموذج لجميع مستخدمي ChatGPT مع فرض قيود على التوليد بناءً على خطط الاشتراك.
أصدرت OpenAI نموذج ChatGPT Images 2 في 21 أبريل، وذلك بعد إغلاق تطبيق الفيديو Sora التابع لها قبل شهر. وصفت الشركة النموذج بأنه خطوة نحو بناء تطبيق فائق يضم أدوات إبداعية للمساعدين الشخصيين. وقالت أديل لي، مسؤولة المنتجات في ChatGPT Images: 'إن نطاق وحالات استخدام الذكاء البصري يتوسع بشكل كبير، ونحن نؤمن بأن هذا أمر بالغ الأهمية لرؤية ChatGPT في تطوير مساعدك الشخصي، لأن مساعدك الإبداعي جزء كبير من هويتك كفرد'. جاء ذلك خلال مؤتمر صحفي نقلته CNET. يتفوق النموذج في إنتاج صور احترافية مع تحسينات في الخطوط والأيقونات والتكوين. كما يمكنه توليد نصوص مقروءة بلغات متعددة ويدعم إنتاج ما يصل إلى ثماني صور متسقة من مطالبة واحدة، مثل تقرير متعدد الصفحات. يمكن للمطورين الوصول إلى دقة 2K و 4K عبر واجهة برمجة التطبيقات (API)، على الرغم من أن الخيارات الأعلى لا تزال في مرحلة تجريبية. ويحصل المشتركون في الخطط المدفوعة على وصول إلى نماذج الاستنتاج التي تبحث في الويب وتتحقق من التصاميم. يستهدف ChatGPT Images 2 المحترفين العاملين، بمن فيهم المعلمون لخطط الدروس والمسوقون لأصول وسائل التواصل الاجتماعي. ورغم أنه يتعامل مع الصور والنصوص التفصيلية بشكل أفضل من سابقاته، إلا أن الاختبارات تشير إلى أنه لا يزال يواجه صعوبات مع اللغات غير الإنجليزية مثل الصينية والهندية، وفقاً لما ذكرته WIRED. تتطلب عملية التعديل إعادة توليد الصور، مما قد يستهلك الأرصدة بشكل أسرع. وتتضمن تدابير السلامة بيانات C2PA الوصفية لتحديد المصدر، وحظراً للمحتوى المسيء أو غير القانوني، وهي إجراءات لم تتغير عن النماذج السابقة.