بناءً على ترقية صور ChatGPT أمس، تفصّل OpenAI نموذج GPT Image 1.5 متعدد الوسائط الذي يمكّن من تحرير صور حواري دقيق. يرد على المنافسين مثل Nano Banana من Google مع إدخال ضمانات ضد الاستخدام السيء.
تحديث الصور من OpenAI، الذي تم طرحه في 16 ديسمبر وتفصيله أكثر في 17 ديسمبر، يقدم GPT Image 1.5 — نظام متعدد الوسائط أصلي يعامل مطالبات النص وبكسلات الصورة كرموز موحدة. هذا يمكّن من تحرير حواري سلس، مثل تغيير الوضعيات، إزالة الكائنات، تعديل الملابس، أو تهيئة التفاصيل مع الحفاظ على الوجوه، بناءً على الجيل الأسرع واتباع التعليمات الذي تم التأكيد عليه سابقاً.
أربع مرات أسرع و20% أرخص عبر API من سابقه، يتكامل النموذج في مساحة جانبية جديدة لـChatGPT مع إعدادات مسبقة ومطالبات. قالت Fidji Simo، الرئيس التنفيذي للتطبيقات في OpenAI: «إنشاء وتحرير الصور مهمة مختلفة وتستحق مساحة مبنية للصور البصرية».
الإصدار يواجه Nano Banana من Google (يُدعى أيضاً Nano Banana Pro)، الذي حظي بالثناء على تحريره الواقعي وعرض النصوص منذ أغسطس. يتحسن GPT Image 1.5 في هذه المجالات لكنه يتخلف في بعض أنماط الرسم والدقة العلمية.
المخاطر الأخلاقية تكبر مع التحرير المتقدم، بما في ذلك الديبفيك والمحتوى غير التوافقي. تنشر OpenAI فلاتر للمواد الجنسية/العنيفة، وبيانات تعريفية C2PA (قابلة للإزالة)، وتحسينات مستمرة. قضايا أوسع تشمل رد فعل المبدعين السلبي تجاه الشبهات وحقوق النشر، مقابل صفقات مثل صفقة OpenAI مع Disney لاستخدام الشخصيات في 2026 وسط دعاوى قضائية من Ziff Davis.
يؤكد OpenAI: «نعتقد أننا لا نزال في بداية ما يمكن لتوليد الصور تمكينه»، مشيراً إلى مزيد من التقدم متعدد الوسائط.