OpenAIs GPT Image 1.5 avancerar konversationell fotoeditering mitt i etiska bekymmer

Bygger på gårdagens ChatGPT-bilduppgradering har OpenAI detaljerat GPT Image 1.5, en multimodal modell som möjliggör precisa konversationella fotoediteringar. Den svarar på konkurrenter som Googles Nano Banana samtidigt som den inför skyddsåtgärder mot missbruk.

OpenAIs bilduppdatering, utrullad 16 december och detaljerad vidare 17 december, introducerar GPT Image 1.5 – ett inhemskt multimodalt system som behandlar textprompts och bildpixlar som enhetliga tokens. Detta möjliggör sömlösa konversationella editeringar, såsom att ändra poser, ta bort objekt, justera kläder eller förfina detaljer samtidigt som ansikten bevaras, byggt på den snabbare genereringen och instruktionsföljningen som framhölls tidigare.

Fyra gånger snabbare och 20 % billigare via API än föregångaren integreras modellen i en ny ChatGPT-sidopanel med förinställningar och prompts. Fidji Simo, OpenAIs VD för applikationer, noterade: «Att skapa och redigera bilder är en annan typ av uppgift och förtjänar en plats byggd för visuellt.»

Utgåvan motverkar Googles Nano Banana (även kallad Nano Banana Pro), hyllad för realistiska editeringar och textåtergivning sedan augusti. GPT Image 1.5 förbättras i dessa områden men halkar efter i vissa teckningstilar och vetenskaplig noggrannhet.

Etiska risker växer med avancerad redigering, inklusive deepfakes och icke-samtyckesmaterial. OpenAI deployar filter för sexuellt/våldsamt material, C2PA-metadata (borttagbar) och pågående förfiningar. Bredare frågor inkluderar skapares motreaktioner mot likheter och upphovsrätt, kontrasterat av avtal som OpenAIs med Disney för karaktärsanvändning 2026 mitt i stämningar från Ziff Davis.

OpenAI hävdar: «Vi tror att vi fortfarande är i början av vad bildgenerering kan möjliggöra», signalerande fler multimodala framsteg.

Relaterade artiklar

Photorealistic illustration depicting OpenAI's ChatGPT Images 2 launch, with AI generating text-rich infographics on a laptop screen.
Bild genererad av AI

OpenAI launches ChatGPT Images 2 image generation model

Rapporterad av AI Bild genererad av AI

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

OpenAI has launched GPT-5.5, its latest AI model integrated into ChatGPT, seven weeks after GPT-5.4. The update focuses on coding, computer use, and research, with enhanced agentic capabilities for independent task completion. Paying ChatGPT and Codex users can access it now, with API rollout planned soon.

Rapporterad av AI

Google has launched Nano Banana 2, an updated AI image generation model that combines the precision of its Pro version with faster processing speeds. Powered by Gemini 3.1 Flash Image, the tool becomes the new default across Google's platforms, including the Gemini app and search features. It aims to deliver more accurate and realistic images while expanding creative capabilities.

OpenAI has introduced ChatGPT Library, allowing paid users to store, search and retrieve files uploaded or created within the AI chatbot. The feature automatically saves documents from chats and provides a central searchable hub. Access requires a Plus, Pro or Business subscription costing at least $20 per month.

Rapporterad av AI

OpenAI has released ChatGPT 5.4, which includes new features focused on spreadsheets. The update brings specialized tools for Microsoft Excel and Google Sheets. This development highlights an emphasis on productivity applications.

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj