Google har lanserat Project Genie, ett verktyg baserat på dess Genie 3 AI-modell som låter användare generera och utforska interaktiva virtuella miljöer från textprompts eller bilder. Endast tillgängligt för prenumeranter på dess premiumplan AI Ultra, markerar systemet den första offentliga åtkomsten till denna avancerade världsmodell utanför interna tester. Det erbjuder lägen som världsskissning och remix, men begränsat till korta 60-sekunderssessioner.
I fjol introducerade Google Genie 3, en AI-världsmodell kapabel att skapa dynamiska miljöer från enkla textprompts, med förbättrad långtidsminne som gör att den kan behålla detaljer i upp till ett par minuter. Ursprungligen begränsad till en liten grupp betrodda testare, positionerade Google DeepMind modellen som ett verktyg för att träna AI-agenter. Nu, i en bredare release kallad Project Genie, integreras den med uppdaterade modeller som Nano Banana Pro och Gemini 3, vilket gör det möjligt för användare att bygga anpassade världar. För att använda Project Genie måste prenumeranter ha AI Ultra-planen för 250 dollar per månad, vara 18 år eller äldre och bo i USA. Verktyget körs via en dedikerad webbapp, separat från Gemini-appen eller webbplats. Användare kan börja med förbyggda världar eller skapa nya via 'world sketching', där Nano Banana Pro först genererar en referensbild baserat på en prompt som beskriver miljön, karaktären, kameraperspektivet —som förstaperson, tredjeperson eller isometrisk— och utforskningsstil. Justeringar kan göras på skissen innan Genie 3 genererar den interaktiva videon. Den resulterande simuleringen renderas i 720p-upplösning och 24 bildrutor per sekund, vilket tillåter navigering med WASD-tangenter i nära realtid. Utforskningar är begränsade till 60 sekunder, varefter användare kan köra om prompts för varierade resultat eller remixa befintliga världar med nya karaktärer och stilar. Videor från sessioner kan laddas ner. Google betonar att Project Genie förblir en forskningsprototyp, med begränsningar inklusive inmatningsfördröjning, tillfälliga fel i fysikmodellering och utvecklande innehållsbegränsningar —till exempel, prompts som efterliknade Nintendo-spel som Super Mario tilläts initialt men blockerades senare för att respektera tredjepartsintressen. Även om det inte är en fullständig spelmotor simulerar systemet fysiska interaktioner utan traditionella mekaniker. Google planerar att utöka åtkomsten bortom premiumnivån över tid.