GPT Image 1.5 OpenAI maju dalam pengeditan foto percakapan di tengah kekhawatiran etis

Membangun dari peningkatan gambar ChatGPT kemarin, OpenAI merinci GPT Image 1.5, model multimodal yang memungkinkan pengeditan foto percakapan yang presisi. Ini menanggapi rival seperti Nano Banana milik Google sambil memperkenalkan pengamanan terhadap penyalahgunaan.

Pembaruan gambar OpenAI, dirilis pada 16 Desember dan dirinci lebih lanjut pada 17 Desember, memperkenalkan GPT Image 1.5—sistem multimodal asli yang memperlakukan perintah teks dan piksel gambar sebagai token terpadu. Ini memungkinkan pengeditan percakapan yang mulus, seperti mengubah pose, menghapus objek, menyesuaikan pakaian, atau menyempurnakan detail sambil mempertahankan wajah, membangun dari generasi lebih cepat dan ketaatan instruksi yang disorot sebelumnya.

Empat kali lebih cepat dan 20% lebih murah melalui API daripada pendahulunya, model ini terintegrasi ke ruang sidebar ChatGPT baru dengan preset dan perintah. Fidji Simo, CEO aplikasi OpenAI, mencatat: "Membuat dan mengedit gambar adalah tugas jenis berbeda dan pantas mendapatkan ruang yang dibangun untuk visual."

Peluncuran ini menandingi Nano Banana milik Google (juga disebut Nano Banana Pro), yang dipuji karena pengeditan realistis dan rendering teks sejak Agustus. GPT Image 1.5 meningkat di bidang ini tetapi tertinggal di beberapa gaya menggambar dan akurasi ilmiah.

Risiko etis semakin besar dengan pengeditan canggih, termasuk deepfake dan konten tanpa persetujuan. OpenAI menerapkan filter untuk materi seksual/kekerasan, metadata C2PA (dapat dihapus), dan penyempurnaan berkelanjutan. Isu yang lebih luas mencakup reaksi balik pencipta atas kemiripan dan hak cipta, kontras dengan kesepakatan seperti OpenAI dengan Disney untuk penggunaan karakter pada 2026 di tengah gugatan dari Ziff Davis.

OpenAI menyatakan: "Kami percaya kami masih di awal apa yang dapat diaktifkan oleh generasi gambar," menandakan kemajuan multimodal lebih lanjut.

Artikel Terkait

Illustration of Google's Nano Banana Pro AI image model launch, featuring a smartphone with AI-generated banana images in the Gemini app, surrounded by users and global elements.
Gambar dihasilkan oleh AI

Google meluncurkan model AI Nano Banana Pro untuk pembuatan gambar

Dilaporkan oleh AI Gambar dihasilkan oleh AI

Google telah memperkenalkan Nano Banana Pro, model pembuatan gambar AI yang ditingkatkan yang didukung oleh Gemini 3 Pro, menawarkan akurasi dan kemampuan pengeditan yang lebih baik. Alat ini sekarang tersedia secara global di aplikasi Gemini, meskipun dengan batas penggunaan untuk pengguna gratis. Ini juga mencakup fitur yang ditingkatkan untuk mendeteksi konten yang dihasilkan AI.

OpenAI telah meluncurkan model pembuatan gambar terbaru untuk ChatGPT, menjadikannya empat kali lebih cepat dan lebih baik mengikuti instruksi pengguna. Pembaruan mencakup kemampuan edit yang ditingkatkan dan rendering teks yang lebih baik. Ini datang tak lama setelah rilis GPT-5.2 dan di tengah persaingan dari Gemini Google.

Dilaporkan oleh AI

OpenAI telah meluncurkan ChatGPT-5.2, keluarga model AI baru yang dirancang untuk meningkatkan penalaran dan produktivitas, khususnya untuk tugas profesional. Peluncuran ini menyusul peringatan internal dari CEO Sam Altman tentang persaingan dari Gemini 3 milik Google. Pembaruan ini mencakup tiga varian yang ditargetkan untuk kebutuhan pengguna berbeda, dimulai dengan pelanggan berbayar.

Google mengumumkan bahwa prototipe AI eksperimentalnya, Genie 3, kini tersedia bagi pelanggan paket AI tingkat tertinggi. Alat ini memungkinkan pengguna menghasilkan dan menjelajahi dunia 3D interaktif menggunakan perintah teks sederhana. Sebelumnya terbatas pada penguji tepercaya, perluasan ini menandai langkah menuju akses lebih luas bagi audiens berusia 18 tahun ke atas.

Dilaporkan oleh AI

Google telah meluncurkan Project Genie, alat berbasis model AI Genie 3-nya yang memungkinkan pengguna menghasilkan dan menjelajahi lingkungan virtual interaktif dari perintah teks atau gambar. Hanya tersedia untuk pelanggan paket premium AI Ultra, sistem ini menandai akses publik pertama ke model dunia canggih ini di luar pengujian internal. Ia menawarkan mode seperti sketsa dunia dan remix, meskipun terbatas pada sesi pendek 60 detik.

As AI platforms shift toward ad-based monetization, researchers warn that the technology could shape users' behavior, beliefs, and choices in unseen ways. This marks a turnabout for OpenAI, whose CEO Sam Altman once deemed the mix of ads and AI 'unsettling' but now assures that ads in AI apps can maintain trust.

Dilaporkan oleh AI

Apple sedang menyiapkan peningkatan besar untuk Siri, mengubah asisten suara menjadi chatbot AI percakapan mirip ChatGPT, menurut laporan Mark Gurman dari Bloomberg. Perubahan yang diharapkan di iOS 27, iPadOS 27, dan macOS 27 akhir tahun depan akan memanfaatkan model Gemini Google untuk kemampuan yang ditingkatkan. Pembaruan awal untuk Siri saat ini direncanakan di iOS 26.4.

 

 

 

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami untuk informasi lebih lanjut.
Tolak