OpenAIs GPT Image 1.5 avancerar konversationell fotoeditering mitt i etiska bekymmer

Bygger på gårdagens ChatGPT-bilduppgradering har OpenAI detaljerat GPT Image 1.5, en multimodal modell som möjliggör precisa konversationella fotoediteringar. Den svarar på konkurrenter som Googles Nano Banana samtidigt som den inför skyddsåtgärder mot missbruk.

OpenAIs bilduppdatering, utrullad 16 december och detaljerad vidare 17 december, introducerar GPT Image 1.5 – ett inhemskt multimodalt system som behandlar textprompts och bildpixlar som enhetliga tokens. Detta möjliggör sömlösa konversationella editeringar, såsom att ändra poser, ta bort objekt, justera kläder eller förfina detaljer samtidigt som ansikten bevaras, byggt på den snabbare genereringen och instruktionsföljningen som framhölls tidigare.

Fyra gånger snabbare och 20 % billigare via API än föregångaren integreras modellen i en ny ChatGPT-sidopanel med förinställningar och prompts. Fidji Simo, OpenAIs VD för applikationer, noterade: «Att skapa och redigera bilder är en annan typ av uppgift och förtjänar en plats byggd för visuellt.»

Utgåvan motverkar Googles Nano Banana (även kallad Nano Banana Pro), hyllad för realistiska editeringar och textåtergivning sedan augusti. GPT Image 1.5 förbättras i dessa områden men halkar efter i vissa teckningstilar och vetenskaplig noggrannhet.

Etiska risker växer med avancerad redigering, inklusive deepfakes och icke-samtyckesmaterial. OpenAI deployar filter för sexuellt/våldsamt material, C2PA-metadata (borttagbar) och pågående förfiningar. Bredare frågor inkluderar skapares motreaktioner mot likheter och upphovsrätt, kontrasterat av avtal som OpenAIs med Disney för karaktärsanvändning 2026 mitt i stämningar från Ziff Davis.

OpenAI hävdar: «Vi tror att vi fortfarande är i början av vad bildgenerering kan möjliggöra», signalerande fler multimodala framsteg.

Relaterade artiklar

Illustration of Google's Nano Banana Pro AI image model launch, featuring a smartphone with AI-generated banana images in the Gemini app, surrounded by users and global elements.
Bild genererad av AI

Google lanserar Nano Banana Pro AI-bildmodell

Rapporterad av AI Bild genererad av AI

Google har introducerat Nano Banana Pro, en uppgraderad AI-modell för bildgenerering driven av Gemini 3 Pro, som erbjuder förbättrad noggrannhet och redigeringsfunktioner. Verktyget är nu tillgängligt globalt i Gemini-appen, men med användningsbegränsningar för gratis användare. Det inkluderar också förbättrade funktioner för att upptäcka AI-genererat innehåll.

OpenAI har rullat ut en uppdaterad bildgenereringsmodell för ChatGPT, som gör den fyra gånger snabbare och bättre på att följa användarinstruktioner. Uppgraderingen inkluderar förbättrade redigeringsmöjligheter och förbättrad textåtergivning. Detta kommer strax efter lanseringen av GPT-5.2 och mitt i konkurrensen från Googles Gemini.

Rapporterad av AI

OpenAI har lanserat ChatGPT-5.2, en ny familj av AI-modeller utformade för att förbättra resonemang och produktivitet, särskilt för professionella uppgifter. Lanseringen följer ett internt varning från VD Sam Altman om konkurrens från Googles Gemini 3. Uppdateringen inkluderar tre varianter anpassade för olika användarbehov, med start för betalande prenumeranter.

Google har meddelat att dess experimentella AI-prototyp, Genie 3, nu är tillgänglig för prenumeranter på företagets högsta AI-plan. Verktyget låter användare skapa och navigera interaktiva 3D-världar med enkla textkommandon. Tidigare begränsat till betrodda testare markerar denna utökning ett steg mot bredare tillgång för personer från 18 år och uppåt.

Rapporterad av AI

Google har lanserat Project Genie, ett verktyg baserat på dess Genie 3 AI-modell som låter användare generera och utforska interaktiva virtuella miljöer från textprompts eller bilder. Endast tillgängligt för prenumeranter på dess premiumplan AI Ultra, markerar systemet den första offentliga åtkomsten till denna avancerade världsmodell utanför interna tester. Det erbjuder lägen som världsskissning och remix, men begränsat till korta 60-sekunderssessioner.

As AI platforms shift toward ad-based monetization, researchers warn that the technology could shape users' behavior, beliefs, and choices in unseen ways. This marks a turnabout for OpenAI, whose CEO Sam Altman once deemed the mix of ads and AI 'unsettling' but now assures that ads in AI apps can maintain trust.

Rapporterad av AI

Apple förbereder en betydande uppgradering av Siri och förvandlar röstassistenten till en konversationell AI-chatbot liknande ChatGPT, enligt rapporter från Bloombergs Mark Gurman. Förändringarna, som väntas i iOS 27, iPadOS 27 och macOS 27 sent nästa år, kommer att utnyttja Googles Gemini-modeller för förbättrade förmågor. Inledande uppdateringar till nuvarande Siri är planerade för iOS 26.4.

 

 

 

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj