GPT Image 1.5 d'OpenAI progresse dans l'édition photo conversationnelle au milieu de préoccupations éthiques

S'appuyant sur la mise à jour d'images ChatGPT d'hier, OpenAI a détaillé GPT Image 1.5, un modèle multimodal permettant des éditions photo conversationnelles précises. Il répond à des rivaux comme Nano Banana de Google tout en introduisant des garde-fous contre les abus.

La mise à jour d'images d'OpenAI, déployée le 16 décembre et détaillée davantage le 17 décembre, introduit GPT Image 1.5 — un système multimodal natif qui traite les invites textuelles et les pixels d'image comme des jetons unifiés. Cela permet des éditions conversationnelles fluides, comme modifier les poses, supprimer des objets, ajuster les vêtements ou affiner les détails tout en préservant les visages, s'appuyant sur la génération plus rapide et le suivi d'instructions mis en avant précédemment.

Quatre fois plus rapide et 20 % moins cher via l'API que son prédécesseur, le modèle s'intègre dans un nouvel espace latéral ChatGPT avec des préréglages et des invites. Fidji Simo, PDG des applications d'OpenAI, a noté : « Créer et éditer des images est une tâche d'un genre différent et mérite un espace conçu pour le visuel. »

La sortie contrebalance Nano Banana de Google (également appelé Nano Banana Pro), loué pour ses éditions réalistes et son rendu de texte depuis août. GPT Image 1.5 s'améliore dans ces domaines mais accuse un retard dans certains styles de dessin et en précision scientifique.

Les risques éthiques s'amplifient avec l'édition avancée, incluant les deepfakes et contenus non consensuels. OpenAI déploie des filtres pour matériel sexuel/violent, métadonnées C2PA (supprimables) et affinements continus. Des problèmes plus larges incluent les réactions des créateurs sur les ressemblances et droits d'auteur, contrastés par des accords comme celui d'OpenAI avec Disney pour l'usage de personnages en 2026 au milieu de poursuites de Ziff Davis.

OpenAI affirme : « Nous pensons être encore au début de ce que la génération d'images peut permettre », signalant plus d'avancées multimodales.

Articles connexes

Illustration of Google's Nano Banana Pro AI image model launch, featuring a smartphone with AI-generated banana images in the Gemini app, surrounded by users and global elements.
Image générée par IA

Google lance Nano Banana Pro, modèle d'IA pour la génération d'images

Rapporté par l'IA Image générée par IA

Google a introduit Nano Banana Pro, un modèle amélioré de génération d'images par IA alimenté par Gemini 3 Pro, offrant une meilleure précision et des capacités d'édition. L'outil est désormais disponible dans le monde entier via l'application Gemini, bien que avec des limites d'utilisation pour les utilisateurs gratuits. Il inclut également des fonctionnalités améliorées pour détecter le contenu généré par IA.

OpenAI a déployé un modèle de génération d'images mis à jour pour ChatGPT, le rendant quatre fois plus rapide et meilleur pour suivre les instructions des utilisateurs. La mise à jour inclut des capacités d'édition améliorées et un rendu de texte optimisé. Cela intervient peu après la sortie de GPT-5.2 et au cœur de la concurrence avec Gemini de Google.

Rapporté par l'IA

Google a lancé Nano Banana 2, un modèle mis à jour de génération d’images par IA qui combine la précision de sa version Pro avec des vitesses de traitement plus rapides. Alimenté par Gemini 3.1 Flash Image, l’outil devient la nouvelle option par défaut sur les plateformes de Google, y compris l’application Gemini et les fonctionnalités de recherche. Il vise à fournir des images plus précises et réalistes tout en élargissant les capacités créatives.

Suite à un scandale impliquant Grok de xAI générant des millions d’images abusives, les concurrents OpenAI et Google ont mis en place de nouvelles mesures pour prévenir des abus similaires. L’incident a mis en lumière les vulnérabilités des outils d’images IA, provoquant des réponses rapides de l’industrie. Ces étapes visent à protéger les utilisateurs des images intimes non consenties.

Rapporté par l'IA

xAI a lancé Grok Imagine 1.0, un nouvel outil d’IA pour générer des vidéos de 10 secondes, alors même que son générateur d’images fait face à des critiques pour avoir créé des millions d’images sexuelles sans consentement. Les rapports soulignent des problèmes persistants avec l’outil produisant des deepfakes, y compris d’enfants, entraînant des enquêtes et des interdictions d’applications dans certains pays. Ce lancement soulève de nouvelles préoccupations sur la modération de contenu sur la plateforme.

Google a annoncé que son prototype expérimental d'IA, Genie 3, est désormais disponible pour les abonnés de son plan d'IA de niveau supérieur. L'outil permet aux utilisateurs de générer et de naviguer dans des mondes 3D interactifs à l'aide de prompts textuels simples. Précédemment limité aux testeurs de confiance, cette extension marque une étape vers un accès plus large pour le public à partir de 18 ans.

Rapporté par l'IA

OpenAI a publié ChatGPT 5.4, qui inclut de nouvelles fonctionnalités axées sur les tableurs. La mise à jour apporte des outils spécialisés pour Microsoft Excel et Google Sheets. Ce développement met en évidence un accent sur les applications de productivité.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser