GPT Image 1.5 de OpenAI avanza en edición conversacional de fotos en medio de preocupaciones éticas

Basándose en la actualización de imágenes de ChatGPT de ayer, OpenAI ha detallado GPT Image 1.5, un modelo multimodal que permite ediciones precisas de fotos mediante conversación. Responde a rivales como Nano Banana de Google mientras introduce salvaguardas contra el mal uso.

La actualización de imágenes de OpenAI, implementada el 16 de diciembre y detallada más a fondo el 17 de diciembre, introduce GPT Image 1.5, un sistema multimodal nativo que trata los prompts de texto y los píxeles de imagen como tokens unificados. Esto permite ediciones conversacionales fluidas, como cambiar poses, eliminar objetos, ajustar ropa o refinar detalles mientras se preservan los rostros, basándose en la generación más rápida y el seguimiento de instrucciones destacados previamente.

Cuatro veces más rápido y un 20% más barato a través de la API que su predecesor, el modelo se integra en un nuevo espacio lateral de ChatGPT con preajustes y prompts. Fidji Simo, CEO de aplicaciones de OpenAI, señaló: «Crear y editar imágenes es una tarea diferente y merece un espacio diseñado para lo visual».

El lanzamiento contrarresta a Nano Banana de Google (también llamado Nano Banana Pro), alabado por sus ediciones realistas y renderizado de texto desde agosto. GPT Image 1.5 mejora en estas áreas, pero se queda atrás en algunos estilos de dibujo y precisión científica.

Los riesgos éticos son mayores con la edición avanzada, incluyendo deepfakes y contenido no consensuado. OpenAI implementa filtros para material sexual/violento, metadatos C2PA (eliminables) y refinamientos continuos. Problemas más amplios incluyen el rechazo de los creadores por semejanzas y derechos de autor, contrastado por acuerdos como el de OpenAI con Disney para uso de personajes en 2026 en medio de demandas de Ziff Davis.

OpenAI mantiene: «Creemos que aún estamos al principio de lo que la generación de imágenes puede habilitar», señalando más avances multimodales.

Artículos relacionados

Illustration of Google's Nano Banana Pro AI image model launch, featuring a smartphone with AI-generated banana images in the Gemini app, surrounded by users and global elements.
Imagen generada por IA

Google lanza Nano Banana Pro, modelo de IA para generación de imágenes

Reportado por IA Imagen generada por IA

Google ha presentado Nano Banana Pro, un modelo mejorado de generación de imágenes con IA impulsado por Gemini 3 Pro, que ofrece mayor precisión y capacidades de edición. La herramienta está disponible ahora a nivel global en la aplicación Gemini, aunque con límites de uso para usuarios gratuitos. También incluye funciones mejoradas para detectar contenido generado por IA.

OpenAI ha lanzado un modelo actualizado de generación de imágenes para ChatGPT, que lo hace cuatro veces más rápido y mejor en seguir las instrucciones de los usuarios. La mejora incluye capacidades de edición mejoradas y un renderizado de texto optimizado. Esto llega poco después del lanzamiento de GPT-5.2 y en medio de la competencia con Gemini de Google.

Reportado por IA

OpenAI ha lanzado ChatGPT-5.2, una nueva familia de modelos de IA diseñados para mejorar el razonamiento y la productividad, especialmente para tareas profesionales. El lanzamiento sigue a una alerta interna del CEO Sam Altman sobre la competencia de Gemini 3 de Google. La actualización incluye tres variantes dirigidas a diferentes necesidades de usuarios, empezando con los suscriptores de pago.

Google ha anunciado que su prototipo experimental de IA, Genie 3, está ahora disponible para los suscriptores de su plan de IA de mayor nivel. La herramienta permite a los usuarios generar y navegar mundos 3D interactivos usando simples indicaciones de texto. Anteriormente limitada a probadores de confianza, esta expansión marca un paso hacia un acceso más amplio para mayores de 18 años.

Reportado por IA

Google ha lanzado Project Genie, una herramienta basada en su modelo de IA Genie 3 que permite a los usuarios generar y explorar entornos virtuales interactivos a partir de indicaciones de texto o imágenes. Disponible solo para suscriptores de su plan premium AI Ultra, el sistema marca el primer acceso público a este modelo de mundo avanzado fuera de las pruebas internas. Ofrece modos como boceto de mundos y remix, aunque limitado a sesiones cortas de 60 segundos.

OpenAI ha anunciado planes para comenzar a probar anuncios en su aplicación ChatGPT para usuarios gratuitos y el nuevo nivel de suscripción Go de 8 dólares al mes en Estados Unidos. La compañía busca diversificar ingresos ante presiones financieras significativas, asegurando que los anuncios no influyan en las respuestas de la IA. Los niveles de pago superior seguirán sin anuncios.

Reportado por IA

A medida que las plataformas de IA viran hacia la monetización basada en anuncios, investigadores advierten de que la tecnología podría moldear el comportamiento, creencias y elecciones de los usuarios de formas invisibles. Esto supone un cambio de rumbo para OpenAI, cuyo CEO Sam Altman consideró en su día la mezcla de anuncios e IA 'inquietante', pero ahora asegura que los anuncios en apps de IA pueden mantener la confianza.

 

 

 

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar