OpenAIs GPT Image 1.5 avancerar konversationell fotoeditering mitt i etiska bekymmer

Bygger på gårdagens ChatGPT-bilduppgradering har OpenAI detaljerat GPT Image 1.5, en multimodal modell som möjliggör precisa konversationella fotoediteringar. Den svarar på konkurrenter som Googles Nano Banana samtidigt som den inför skyddsåtgärder mot missbruk.

OpenAIs bilduppdatering, utrullad 16 december och detaljerad vidare 17 december, introducerar GPT Image 1.5 – ett inhemskt multimodalt system som behandlar textprompts och bildpixlar som enhetliga tokens. Detta möjliggör sömlösa konversationella editeringar, såsom att ändra poser, ta bort objekt, justera kläder eller förfina detaljer samtidigt som ansikten bevaras, byggt på den snabbare genereringen och instruktionsföljningen som framhölls tidigare.

Fyra gånger snabbare och 20 % billigare via API än föregångaren integreras modellen i en ny ChatGPT-sidopanel med förinställningar och prompts. Fidji Simo, OpenAIs VD för applikationer, noterade: «Att skapa och redigera bilder är en annan typ av uppgift och förtjänar en plats byggd för visuellt.»

Utgåvan motverkar Googles Nano Banana (även kallad Nano Banana Pro), hyllad för realistiska editeringar och textåtergivning sedan augusti. GPT Image 1.5 förbättras i dessa områden men halkar efter i vissa teckningstilar och vetenskaplig noggrannhet.

Etiska risker växer med avancerad redigering, inklusive deepfakes och icke-samtyckesmaterial. OpenAI deployar filter för sexuellt/våldsamt material, C2PA-metadata (borttagbar) och pågående förfiningar. Bredare frågor inkluderar skapares motreaktioner mot likheter och upphovsrätt, kontrasterat av avtal som OpenAIs med Disney för karaktärsanvändning 2026 mitt i stämningar från Ziff Davis.

OpenAI hävdar: «Vi tror att vi fortfarande är i början av vad bildgenerering kan möjliggöra», signalerande fler multimodala framsteg.

Relaterade artiklar

Illustration of Google's Nano Banana Pro AI image model launch, featuring a smartphone with AI-generated banana images in the Gemini app, surrounded by users and global elements.
Bild genererad av AI

Google lanserar Nano Banana Pro AI-bildmodell

Rapporterad av AI Bild genererad av AI

Google har introducerat Nano Banana Pro, en uppgraderad AI-modell för bildgenerering driven av Gemini 3 Pro, som erbjuder förbättrad noggrannhet och redigeringsfunktioner. Verktyget är nu tillgängligt globalt i Gemini-appen, men med användningsbegränsningar för gratis användare. Det inkluderar också förbättrade funktioner för att upptäcka AI-genererat innehåll.

OpenAI har rullat ut en uppdaterad bildgenereringsmodell för ChatGPT, som gör den fyra gånger snabbare och bättre på att följa användarinstruktioner. Uppgraderingen inkluderar förbättrade redigeringsmöjligheter och förbättrad textåtergivning. Detta kommer strax efter lanseringen av GPT-5.2 och mitt i konkurrensen från Googles Gemini.

Rapporterad av AI

Google har lanserat Nano Banana 2, en uppdaterad AI-bildgenereringsmodell som kombinerar precisionen i sin Pro-version med snabbare bearbetningshastigheter. Drivet av Gemini 3.1 Flash Image blir verktyget den nya standarden över Googles plattformar, inklusive Gemini-appen och sökfunktioner. Det syftar till att leverera mer exakta och realistiska bilder samtidigt som det utökar kreativa möjligheter.

Efter en skandal där xAI:s Grok genererade miljontals kränkande bilder har konkurrenterna OpenAI och Google infört nya åtgärder för att förhindra liknande missbruk. Händelsen belyste sårbarheter i AI-bildverktyg och utlöste snabba reaktioner från branschen. Dessa steg syftar till att skydda användare mot icke-samtyckande intima bilder.

Rapporterad av AI

xAI har introducerat Grok Imagine 1.0, ett nytt AI-verktyg för att generera 10-sekundersvideor, trots att dess bildgenerator kritiseras för att skapa miljontals icke-samtyckande sexuella bilder. Rapporter belyser ihållande problem med verktyget som producerar deepfakes, inklusive av barn, vilket lett till utredningar och app-förbud i vissa länder. Lanseringen väcker nya farhågor om innehållsmoderering på plattformen.

Google har meddelat att dess experimentella AI-prototyp, Genie 3, nu är tillgänglig för prenumeranter på företagets högsta AI-plan. Verktyget låter användare skapa och navigera interaktiva 3D-världar med enkla textkommandon. Tidigare begränsat till betrodda testare markerar denna utökning ett steg mot bredare tillgång för personer från 18 år och uppåt.

Rapporterad av AI

OpenAI har släppt ChatGPT 5.4, som inkluderar nya funktioner inriktade på kalkylblad. Uppdateringen medför specialiserade verktyg för Microsoft Excel och Google Sheets. Denna utveckling understryker ett fokus på produktivitetsapplikationer.

 

 

 

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj