OpenAI tillkännagav sin nya AI-bildmodell ChatGPT Images 2 på tisdagen. Uppgraderingen fokuserar på att skapa texttunga, professionella visuella material som infografik och studiematerial. Den rullas ut till alla ChatGPT-användare med genereringsgränser baserade på prenumerationsplaner.
OpenAI släppte ChatGPT Images 2 den 21 april, en månad efter nedläggningen av deras videoapp Sora. Företaget har positionerat modellen som ett steg mot att bygga en superapp med kreativa verktyg för personliga assistenter. Adele Li, produktchef för ChatGPT Images, sa: 'Användningsområdena för visuell intelligens expanderar så brett, och vi tror att detta är avgörande för ChatGPT:s vision om att utveckla din egen personliga assistent, eftersom din kreativa assistent är en stor del av vem du är som individ.' Detta uttalade hon under en pressbriefing som rapporterades av CNET. Modellen är särskilt skicklig på att producera professionella bilder med förbättrad typografi, ikonografi och komposition. Den genererar läsbar text på flera språk och stöder upp till åtta konsekventa bilder från en enskild prompt, till exempel för en rapport på flera sidor. Utvecklare kan använda 2K- och 4K-upplösningar via API, även om högre alternativ fortfarande är i betastadiet. Betalande prenumeranter får tillgång till resonemangsmodeller som söker på webben och verifierar designer. ChatGPT Images 2 riktar sig till yrkesverksamma, inklusive lärare för lektionsplaneringar och marknadsförare för material till sociala medier. Även om den hanterar detaljerade bilder och text bättre än sina föregångare, visar tester enligt WIRED att den fortfarande har svårigheter med språk som inte är engelska, såsom kinesiska och hindi. Redigering kräver att bilder återskapas, vilket kan förbruka krediter snabbare. Säkerhetsåtgärder inkluderar C2PA-metadata för ursprungsmärkning samt förbud mot stötande eller olagligt innehåll, vilket är oförändrat från tidigare modeller.