OpenAIは火曜日、新しいAI画像モデル「ChatGPT Images 2」を発表した。今回のアップデートでは、インフォグラフィックや学習ガイドなど、文字情報が多いプロフェッショナルなビジュアルの作成に重点を置いている。全ChatGPTユーザーを対象に順次展開され、生成制限は各サブスクリプションプランに基づいている。
OpenAIは、動画生成アプリ「Sora」の提供終了から1か月を経て、4月21日に「ChatGPT Images 2」をリリースした。同社は本モデルを、パーソナルアシスタント向けのクリエイティブツールを備えた「スーパーアプリ」構築に向けた一歩と位置付けている。ChatGPT Imagesのプロダクトリードを務めるアデル・リー氏は、CNETの報道による記者会見の中で次のように述べている。「視覚的インテリジェンスの範囲や用途は急速に拡大しており、私たちはこれがChatGPTの目指す『独自のパーソナルアシスタント』のビジョンにおいて極めて重要だと考えています。なぜなら、クリエイティブなアシスタントは、個人のアイデンティティの大きな一部だからです」。本モデルは、タイポグラフィ、図像、構成が改善されたプロフェッショナルな画像の生成において優れた能力を発揮する。複数の言語で読み取り可能なテキストを生成でき、一つのプロンプトから複数ページのレポートのような最大8枚の一貫性のある画像を生成可能だ。開発者はAPIを通じて2Kおよび4Kの解像度にアクセスできるが、より高画質なオプションは現在ベータ版となっている。有料サブスクリプションユーザーは、ウェブ検索を行いデザインを検証できる推論モデルを利用可能となる。「ChatGPT Images 2」は、授業計画を作成する教師やソーシャルメディア用の素材を必要とするマーケターなど、働くプロフェッショナルを対象としている。WIREDの報道によれば、前モデルよりも詳細な画像やテキストの処理能力は向上したものの、中国語やヒンディー語といった英語以外の言語では依然として課題が残るという。画像の編集には再生成が必要であり、クレジットが通常より早く消費される可能性がある。安全性対策としては、由来を証明するためのC2PAメタデータの付与や、悪意的・違法なコンテンツの禁止などが、従来モデルと同様に継続されている。