GPT Image 1.5 OpenAI maju dalam pengeditan foto percakapan di tengah kekhawatiran etis

Membangun dari peningkatan gambar ChatGPT kemarin, OpenAI merinci GPT Image 1.5, model multimodal yang memungkinkan pengeditan foto percakapan yang presisi. Ini menanggapi rival seperti Nano Banana milik Google sambil memperkenalkan pengamanan terhadap penyalahgunaan.

Pembaruan gambar OpenAI, dirilis pada 16 Desember dan dirinci lebih lanjut pada 17 Desember, memperkenalkan GPT Image 1.5—sistem multimodal asli yang memperlakukan perintah teks dan piksel gambar sebagai token terpadu. Ini memungkinkan pengeditan percakapan yang mulus, seperti mengubah pose, menghapus objek, menyesuaikan pakaian, atau menyempurnakan detail sambil mempertahankan wajah, membangun dari generasi lebih cepat dan ketaatan instruksi yang disorot sebelumnya.

Empat kali lebih cepat dan 20% lebih murah melalui API daripada pendahulunya, model ini terintegrasi ke ruang sidebar ChatGPT baru dengan preset dan perintah. Fidji Simo, CEO aplikasi OpenAI, mencatat: "Membuat dan mengedit gambar adalah tugas jenis berbeda dan pantas mendapatkan ruang yang dibangun untuk visual."

Peluncuran ini menandingi Nano Banana milik Google (juga disebut Nano Banana Pro), yang dipuji karena pengeditan realistis dan rendering teks sejak Agustus. GPT Image 1.5 meningkat di bidang ini tetapi tertinggal di beberapa gaya menggambar dan akurasi ilmiah.

Risiko etis semakin besar dengan pengeditan canggih, termasuk deepfake dan konten tanpa persetujuan. OpenAI menerapkan filter untuk materi seksual/kekerasan, metadata C2PA (dapat dihapus), dan penyempurnaan berkelanjutan. Isu yang lebih luas mencakup reaksi balik pencipta atas kemiripan dan hak cipta, kontras dengan kesepakatan seperti OpenAI dengan Disney untuk penggunaan karakter pada 2026 di tengah gugatan dari Ziff Davis.

OpenAI menyatakan: "Kami percaya kami masih di awal apa yang dapat diaktifkan oleh generasi gambar," menandakan kemajuan multimodal lebih lanjut.

Artikel Terkait

Photorealistic illustration depicting OpenAI's ChatGPT Images 2 launch, with AI generating text-rich infographics on a laptop screen.
Gambar dihasilkan oleh AI

OpenAI launches ChatGPT Images 2 image generation model

Dilaporkan oleh AI Gambar dihasilkan oleh AI

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

OpenAI has launched GPT-5.5, its latest AI model integrated into ChatGPT, seven weeks after GPT-5.4. The update focuses on coding, computer use, and research, with enhanced agentic capabilities for independent task completion. Paying ChatGPT and Codex users can access it now, with API rollout planned soon.

Dilaporkan oleh AI

Google has launched Nano Banana 2, an updated AI image generation model that combines the precision of its Pro version with faster processing speeds. Powered by Gemini 3.1 Flash Image, the tool becomes the new default across Google's platforms, including the Gemini app and search features. It aims to deliver more accurate and realistic images while expanding creative capabilities.

OpenAI has introduced ChatGPT Library, allowing paid users to store, search and retrieve files uploaded or created within the AI chatbot. The feature automatically saves documents from chats and provides a central searchable hub. Access requires a Plus, Pro or Business subscription costing at least $20 per month.

Dilaporkan oleh AI

OpenAI has released ChatGPT 5.4, which includes new features focused on spreadsheets. The update brings specialized tools for Microsoft Excel and Google Sheets. This development highlights an emphasis on productivity applications.

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami untuk informasi lebih lanjut.
Tolak