Membangun dari peningkatan gambar ChatGPT kemarin, OpenAI merinci GPT Image 1.5, model multimodal yang memungkinkan pengeditan foto percakapan yang presisi. Ini menanggapi rival seperti Nano Banana milik Google sambil memperkenalkan pengamanan terhadap penyalahgunaan.
Pembaruan gambar OpenAI, dirilis pada 16 Desember dan dirinci lebih lanjut pada 17 Desember, memperkenalkan GPT Image 1.5—sistem multimodal asli yang memperlakukan perintah teks dan piksel gambar sebagai token terpadu. Ini memungkinkan pengeditan percakapan yang mulus, seperti mengubah pose, menghapus objek, menyesuaikan pakaian, atau menyempurnakan detail sambil mempertahankan wajah, membangun dari generasi lebih cepat dan ketaatan instruksi yang disorot sebelumnya.
Empat kali lebih cepat dan 20% lebih murah melalui API daripada pendahulunya, model ini terintegrasi ke ruang sidebar ChatGPT baru dengan preset dan perintah. Fidji Simo, CEO aplikasi OpenAI, mencatat: "Membuat dan mengedit gambar adalah tugas jenis berbeda dan pantas mendapatkan ruang yang dibangun untuk visual."
Peluncuran ini menandingi Nano Banana milik Google (juga disebut Nano Banana Pro), yang dipuji karena pengeditan realistis dan rendering teks sejak Agustus. GPT Image 1.5 meningkat di bidang ini tetapi tertinggal di beberapa gaya menggambar dan akurasi ilmiah.
Risiko etis semakin besar dengan pengeditan canggih, termasuk deepfake dan konten tanpa persetujuan. OpenAI menerapkan filter untuk materi seksual/kekerasan, metadata C2PA (dapat dihapus), dan penyempurnaan berkelanjutan. Isu yang lebih luas mencakup reaksi balik pencipta atas kemiripan dan hak cipta, kontras dengan kesepakatan seperti OpenAI dengan Disney untuk penggunaan karakter pada 2026 di tengah gugatan dari Ziff Davis.
OpenAI menyatakan: "Kami percaya kami masih di awal apa yang dapat diaktifkan oleh generasi gambar," menandakan kemajuan multimodal lebih lanjut.