GPT Image 1.5 de OpenAI avanza en edición conversacional de fotos en medio de preocupaciones éticas

Basándose en la actualización de imágenes de ChatGPT de ayer, OpenAI ha detallado GPT Image 1.5, un modelo multimodal que permite ediciones precisas de fotos mediante conversación. Responde a rivales como Nano Banana de Google mientras introduce salvaguardas contra el mal uso.

La actualización de imágenes de OpenAI, implementada el 16 de diciembre y detallada más a fondo el 17 de diciembre, introduce GPT Image 1.5, un sistema multimodal nativo que trata los prompts de texto y los píxeles de imagen como tokens unificados. Esto permite ediciones conversacionales fluidas, como cambiar poses, eliminar objetos, ajustar ropa o refinar detalles mientras se preservan los rostros, basándose en la generación más rápida y el seguimiento de instrucciones destacados previamente.

Cuatro veces más rápido y un 20% más barato a través de la API que su predecesor, el modelo se integra en un nuevo espacio lateral de ChatGPT con preajustes y prompts. Fidji Simo, CEO de aplicaciones de OpenAI, señaló: «Crear y editar imágenes es una tarea diferente y merece un espacio diseñado para lo visual».

El lanzamiento contrarresta a Nano Banana de Google (también llamado Nano Banana Pro), alabado por sus ediciones realistas y renderizado de texto desde agosto. GPT Image 1.5 mejora en estas áreas, pero se queda atrás en algunos estilos de dibujo y precisión científica.

Los riesgos éticos son mayores con la edición avanzada, incluyendo deepfakes y contenido no consensuado. OpenAI implementa filtros para material sexual/violento, metadatos C2PA (eliminables) y refinamientos continuos. Problemas más amplios incluyen el rechazo de los creadores por semejanzas y derechos de autor, contrastado por acuerdos como el de OpenAI con Disney para uso de personajes en 2026 en medio de demandas de Ziff Davis.

OpenAI mantiene: «Creemos que aún estamos al principio de lo que la generación de imágenes puede habilitar», señalando más avances multimodales.

Artículos relacionados

Illustration of Google's Nano Banana Pro AI image model launch, featuring a smartphone with AI-generated banana images in the Gemini app, surrounded by users and global elements.
Imagen generada por IA

Google lanza Nano Banana Pro, modelo de IA para generación de imágenes

Reportado por IA Imagen generada por IA

Google ha presentado Nano Banana Pro, un modelo mejorado de generación de imágenes con IA impulsado por Gemini 3 Pro, que ofrece mayor precisión y capacidades de edición. La herramienta está disponible ahora a nivel global en la aplicación Gemini, aunque con límites de uso para usuarios gratuitos. También incluye funciones mejoradas para detectar contenido generado por IA.

OpenAI ha lanzado un modelo actualizado de generación de imágenes para ChatGPT, que lo hace cuatro veces más rápido y mejor en seguir las instrucciones de los usuarios. La mejora incluye capacidades de edición mejoradas y un renderizado de texto optimizado. Esto llega poco después del lanzamiento de GPT-5.2 y en medio de la competencia con Gemini de Google.

Reportado por IA

Google ha lanzado Nano Banana 2, un modelo actualizado de generación de imágenes con IA que combina la precisión de su versión Pro con velocidades de procesamiento más rápidas. Alimentado por Gemini 3.1 Flash Image, la herramienta se convierte en la nueva opción predeterminada en las plataformas de Google, incluidas la app Gemini y las funciones de búsqueda. Pretende ofrecer imágenes más precisas y realistas mientras amplía las capacidades creativas.

Tras un escándalo en el que Grok de xAI generó millones de imágenes abusivas, competidores como OpenAI y Google han implementado nuevas medidas para prevenir mal usos similares. El incidente destacó vulnerabilidades en herramientas de imágenes con IA, provocando respuestas rápidas de la industria. Estos pasos buscan proteger a los usuarios de imágenes íntimas no consentidas.

Reportado por IA

xAI ha introducido Grok Imagine 1.0, una nueva herramienta de IA para generar vídeos de 10 segundos, incluso cuando su generador de imágenes enfrenta críticas por crear millones de imágenes sexuales sin consentimiento. Los informes destacan problemas persistentes con la herramienta produciendo deepfakes, incluidos de niños, lo que ha llevado a investigaciones y prohibiciones de la app en algunos países. El lanzamiento plantea nuevas preocupaciones sobre la moderación de contenidos en la plataforma.

Google ha anunciado que su prototipo experimental de IA, Genie 3, está ahora disponible para los suscriptores de su plan de IA de mayor nivel. La herramienta permite a los usuarios generar y navegar mundos 3D interactivos usando simples indicaciones de texto. Anteriormente limitada a probadores de confianza, esta expansión marca un paso hacia un acceso más amplio para mayores de 18 años.

Reportado por IA

OpenAI ha lanzado ChatGPT 5.4, que incluye nuevas funciones centradas en hojas de cálculo. La actualización trae herramientas especializadas para Microsoft Excel y Google Sheets. Este desarrollo resalta un énfasis en aplicaciones de productividad.

 

 

 

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar