Google a lancé Project Genie, un outil basé sur son modèle d'IA Genie 3 qui permet aux utilisateurs de générer et d'explorer des environnements virtuels interactifs à partir de prompts textuels ou d'images. Disponible uniquement pour les abonnés de son plan premium AI Ultra, le système marque le premier accès public à ce modèle de monde avancé en dehors des tests internes. Il propose des modes comme l'esquisse de mondes et le remix, bien que limité à des sessions courtes de 60 secondes.
L'année dernière, Google a introduit Genie 3, un modèle de monde IA capable de créer des environnements dynamiques à partir de prompts textuels simples, avec une mémoire à long terme améliorée lui permettant de retenir les détails jusqu'à quelques minutes. Initialement restreint à un petit groupe de testeurs de confiance, le modèle a été présenté par Google DeepMind comme un outil pour former des agents IA. Désormais, dans une sortie plus large appelée Project Genie, il s'intègre à des modèles mis à jour comme Nano Banana Pro et Gemini 3, permettant aux utilisateurs de construire des mondes personnalisés. Pour utiliser Project Genie, les abonnés doivent avoir le plan AI Ultra à 250 dollars par mois, et avoir 18 ans ou plus et résider aux États-Unis. L'outil fonctionne via une application web dédiée, séparée de l'application ou du site Gemini. Les utilisateurs peuvent commencer avec des mondes pré-construits ou en créer de nouveaux via 'world sketching', où Nano Banana Pro génère d'abord une image de référence basée sur un prompt décrivant l'environnement, le personnage, la perspective de la caméra —comme à la première personne, troisième personne ou isométrique— et le style d'exploration. Des ajustements peuvent être apportés à l'esquisse avant que Genie 3 ne génère la vidéo interactive. La simulation résultante est rendue en 720p et 24 images par seconde, permettant la navigation avec les touches WASD en temps quasi réel. Les explorations sont limitées à 60 secondes, après quoi les utilisateurs peuvent relancer les prompts pour des résultats variés ou remixer des mondes existants avec de nouveaux personnages et styles. Les vidéos des sessions sont téléchargeables. Google souligne que Project Genie reste un prototype de recherche, avec des limitations incluant un décalage d'entrée, des inexactitudes occasionnelles dans la modélisation physique et des restrictions de contenu en évolution —par exemple, des prompts imitant des jeux Nintendo comme Super Mario ont été initialement autorisés mais ensuite bloqués pour respecter les intérêts tiers. Bien qu'il ne s'agisse pas d'un moteur de jeu complet, le système simule des interactions physiques sans mécaniques traditionnelles. Google prévoit d'élargir l'accès au-delà du niveau premium avec le temps.