GPT Image 1.5 d'OpenAI progresse dans l'édition photo conversationnelle au milieu de préoccupations éthiques

S'appuyant sur la mise à jour d'images ChatGPT d'hier, OpenAI a détaillé GPT Image 1.5, un modèle multimodal permettant des éditions photo conversationnelles précises. Il répond à des rivaux comme Nano Banana de Google tout en introduisant des garde-fous contre les abus.

La mise à jour d'images d'OpenAI, déployée le 16 décembre et détaillée davantage le 17 décembre, introduit GPT Image 1.5 — un système multimodal natif qui traite les invites textuelles et les pixels d'image comme des jetons unifiés. Cela permet des éditions conversationnelles fluides, comme modifier les poses, supprimer des objets, ajuster les vêtements ou affiner les détails tout en préservant les visages, s'appuyant sur la génération plus rapide et le suivi d'instructions mis en avant précédemment.

Quatre fois plus rapide et 20 % moins cher via l'API que son prédécesseur, le modèle s'intègre dans un nouvel espace latéral ChatGPT avec des préréglages et des invites. Fidji Simo, PDG des applications d'OpenAI, a noté : « Créer et éditer des images est une tâche d'un genre différent et mérite un espace conçu pour le visuel. »

La sortie contrebalance Nano Banana de Google (également appelé Nano Banana Pro), loué pour ses éditions réalistes et son rendu de texte depuis août. GPT Image 1.5 s'améliore dans ces domaines mais accuse un retard dans certains styles de dessin et en précision scientifique.

Les risques éthiques s'amplifient avec l'édition avancée, incluant les deepfakes et contenus non consensuels. OpenAI déploie des filtres pour matériel sexuel/violent, métadonnées C2PA (supprimables) et affinements continus. Des problèmes plus larges incluent les réactions des créateurs sur les ressemblances et droits d'auteur, contrastés par des accords comme celui d'OpenAI avec Disney pour l'usage de personnages en 2026 au milieu de poursuites de Ziff Davis.

OpenAI affirme : « Nous pensons être encore au début de ce que la génération d'images peut permettre », signalant plus d'avancées multimodales.

Articles connexes

Illustration of Google's Nano Banana Pro AI image model launch, featuring a smartphone with AI-generated banana images in the Gemini app, surrounded by users and global elements.
Image générée par IA

Google lance Nano Banana Pro, modèle d'IA pour la génération d'images

Rapporté par l'IA Image générée par IA

Google a introduit Nano Banana Pro, un modèle amélioré de génération d'images par IA alimenté par Gemini 3 Pro, offrant une meilleure précision et des capacités d'édition. L'outil est désormais disponible dans le monde entier via l'application Gemini, bien que avec des limites d'utilisation pour les utilisateurs gratuits. Il inclut également des fonctionnalités améliorées pour détecter le contenu généré par IA.

OpenAI a déployé un modèle de génération d'images mis à jour pour ChatGPT, le rendant quatre fois plus rapide et meilleur pour suivre les instructions des utilisateurs. La mise à jour inclut des capacités d'édition améliorées et un rendu de texte optimisé. Cela intervient peu après la sortie de GPT-5.2 et au cœur de la concurrence avec Gemini de Google.

Rapporté par l'IA

OpenAI a lancé ChatGPT-5.2, une nouvelle famille de modèles d’IA conçus pour renforcer le raisonnement et la productivité, en particulier pour les tâches professionnelles. Ce lancement fait suite à une alerte interne du PDG Sam Altman concernant la concurrence de Gemini 3 de Google. La mise à jour comprend trois variantes adaptées à différents besoins des utilisateurs, à partir des abonnés payants.

Google a annoncé que son prototype expérimental d'IA, Genie 3, est désormais disponible pour les abonnés de son plan d'IA de niveau supérieur. L'outil permet aux utilisateurs de générer et de naviguer dans des mondes 3D interactifs à l'aide de prompts textuels simples. Précédemment limité aux testeurs de confiance, cette extension marque une étape vers un accès plus large pour le public à partir de 18 ans.

Rapporté par l'IA

Google a lancé Project Genie, un outil basé sur son modèle d'IA Genie 3 qui permet aux utilisateurs de générer et d'explorer des environnements virtuels interactifs à partir de prompts textuels ou d'images. Disponible uniquement pour les abonnés de son plan premium AI Ultra, le système marque le premier accès public à ce modèle de monde avancé en dehors des tests internes. Il propose des modes comme l'esquisse de mondes et le remix, bien que limité à des sessions courtes de 60 secondes.

OpenAI a annoncé des plans pour commencer à tester des publicités dans son application ChatGPT pour les utilisateurs gratuits et le nouveau niveau d'abonnement Go à 8 dollars par mois aux États-Unis. L'entreprise vise à diversifier ses revenus face à des pressions financières importantes, tout en veillant à ce que les publicités n'influencent pas les réponses de l'IA. Les niveaux payants supérieurs resteront sans publicité.

Rapporté par l'IA

Alors que les plateformes d'IA passent à une monétisation basée sur la publicité, des chercheurs mettent en garde contre le fait que cette technologie pourrait façonner le comportement, les croyances et les choix des utilisateurs de manière invisible. Cela marque un revirement pour OpenAI, dont le PDG Sam Altman a jugé un jour le mélange de publicités et d'IA « troublant », mais qui assure désormais que les publicités dans les apps IA peuvent préserver la confiance.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser