GPT Image 1.5 de OpenAI avanza en edición conversacional de fotos en medio de preocupaciones éticas

Basándose en la actualización de imágenes de ChatGPT de ayer, OpenAI ha detallado GPT Image 1.5, un modelo multimodal que permite ediciones precisas de fotos mediante conversación. Responde a rivales como Nano Banana de Google mientras introduce salvaguardas contra el mal uso.

La actualización de imágenes de OpenAI, implementada el 16 de diciembre y detallada más a fondo el 17 de diciembre, introduce GPT Image 1.5, un sistema multimodal nativo que trata los prompts de texto y los píxeles de imagen como tokens unificados. Esto permite ediciones conversacionales fluidas, como cambiar poses, eliminar objetos, ajustar ropa o refinar detalles mientras se preservan los rostros, basándose en la generación más rápida y el seguimiento de instrucciones destacados previamente.

Cuatro veces más rápido y un 20% más barato a través de la API que su predecesor, el modelo se integra en un nuevo espacio lateral de ChatGPT con preajustes y prompts. Fidji Simo, CEO de aplicaciones de OpenAI, señaló: «Crear y editar imágenes es una tarea diferente y merece un espacio diseñado para lo visual».

El lanzamiento contrarresta a Nano Banana de Google (también llamado Nano Banana Pro), alabado por sus ediciones realistas y renderizado de texto desde agosto. GPT Image 1.5 mejora en estas áreas, pero se queda atrás en algunos estilos de dibujo y precisión científica.

Los riesgos éticos son mayores con la edición avanzada, incluyendo deepfakes y contenido no consensuado. OpenAI implementa filtros para material sexual/violento, metadatos C2PA (eliminables) y refinamientos continuos. Problemas más amplios incluyen el rechazo de los creadores por semejanzas y derechos de autor, contrastado por acuerdos como el de OpenAI con Disney para uso de personajes en 2026 en medio de demandas de Ziff Davis.

OpenAI mantiene: «Creemos que aún estamos al principio de lo que la generación de imágenes puede habilitar», señalando más avances multimodales.

Artículos relacionados

Photorealistic illustration depicting OpenAI's ChatGPT Images 2 launch, with AI generating text-rich infographics on a laptop screen.
Imagen generada por IA

OpenAI launches ChatGPT Images 2 image generation model

Reportado por IA Imagen generada por IA

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

OpenAI has launched GPT-5.5, its latest AI model integrated into ChatGPT, seven weeks after GPT-5.4. The update focuses on coding, computer use, and research, with enhanced agentic capabilities for independent task completion. Paying ChatGPT and Codex users can access it now, with API rollout planned soon.

Reportado por IA

Google has launched Nano Banana 2, an updated AI image generation model that combines the precision of its Pro version with faster processing speeds. Powered by Gemini 3.1 Flash Image, the tool becomes the new default across Google's platforms, including the Gemini app and search features. It aims to deliver more accurate and realistic images while expanding creative capabilities.

OpenAI has introduced ChatGPT Library, allowing paid users to store, search and retrieve files uploaded or created within the AI chatbot. The feature automatically saves documents from chats and provides a central searchable hub. Access requires a Plus, Pro or Business subscription costing at least $20 per month.

Reportado por IA

OpenAI has released ChatGPT 5.4, which includes new features focused on spreadsheets. The update brings specialized tools for Microsoft Excel and Google Sheets. This development highlights an emphasis on productivity applications.

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar