昨日のChatGPT画像アップグレードを基に、OpenAIはGPT Image 1.5を詳述。多モードモデルで精密な会話型写真編集を可能にし、GoogleのNano Bananaなどのライバルに対応しつつ、悪用防止のセーフガードを導入。
OpenAIの画像アップデートは12月16日に展開され、17日にさらに詳述され、GPT Image 1.5を導入—テキストプロンプトと画像ピクセルを統一トークンとして扱うネイティブ多モードシステム。これにより、ポーズ変更、物体除去、服装調整、詳細洗練などのシームレスな会話型編集が可能で、顔を保持しつつ、以前強調された高速生成と指示追従を基盤とする。
前モデル比4倍速くAPIで20%安価、新ChatGPTサイドバースペースにプリセットとプロンプトを統合。OpenAIアプリケーションCEOのFidji Simo氏は、「画像作成と編集は異なるタスクで、ビジュアル向けの専用スペースに値する」と指摘。
8月以降の現実的な編集とテキストレンダリングで称賛されたGoogleのNano Banana(Nano Banana Proとも)を対抗。GPT Image 1.5はこれらの領域で向上するが、一部描画スタイルと科学的精度で遅れを取る。
高度編集で倫理リスクが増大、ディープフェイクや非合意コンテンツを含む。OpenAIは性的/暴力的素材フィルタ、C2PAメタデータ(除去可能)、継続的改良を展開。より広範な問題として、クリエイターの肖像・著作権反発があり、Ziff Davisの訴訟中でもDisneyとの2026年キャラクター使用契約など対照的。
OpenAIは「画像生成が可能にするものの始まりに過ぎないと信じている」とし、多モード進化を示唆。