GPT Image 1.5 da OpenAI avança na edição conversacional de fotos em meio a preocupações éticas

Baseando-se na atualização de imagens do ChatGPT de ontem, a OpenAI detalhou o GPT Image 1.5, um modelo multimodal que permite edições precisas de fotos conversacionais. Responde a rivais como o Nano Banana do Google enquanto introduz salvaguardas contra uso indevido.

A atualização de imagens da OpenAI, lançada em 16 de dezembro e detalhada mais em 17 de dezembro, introduz o GPT Image 1.5 — um sistema multimodal nativo que trata prompts de texto e pixels de imagem como tokens unificados. Isso permite edições conversacionais perfeitas, como alterar poses, remover objetos, ajustar roupas ou refinar detalhes enquanto preserva rostos, construindo sobre a geração mais rápida e o seguimento de instruções destacados anteriormente.

Quatro vezes mais rápido e 20% mais barato via API que seu antecessor, o modelo se integra a um novo espaço lateral do ChatGPT com predefinições e prompts. Fidji Simo, CEO de aplicações da OpenAI, observou: «Criar e editar imagens é um tipo diferente de tarefa e merece um espaço construído para visuais.»

O lançamento contrapõe o Nano Banana do Google (também chamado Nano Banana Pro), elogiado por edições realistas e renderização de texto desde agosto. O GPT Image 1.5 melhora nessas áreas, mas fica atrás em alguns estilos de desenho e precisão científica.

Riscos éticos crescem com a edição avançada, incluindo deepfakes e conteúdo não consensual. A OpenAI implanta filtros para material sexual/violento, metadados C2PA (removíveis) e refinamentos contínuos. Questões mais amplas incluem reação negativa de criadores sobre semelhanças e direitos autorais, contrastadas por acordos como o da OpenAI com a Disney para uso de personagens em 2026 em meio a processos da Ziff Davis.

A OpenAI afirma: «Acreditamos que ainda estamos no início do que a geração de imagens pode habilitar», sinalizando mais avanços multimodais.

Artigos relacionados

Illustration of Google's Nano Banana Pro AI image model launch, featuring a smartphone with AI-generated banana images in the Gemini app, surrounded by users and global elements.
Imagem gerada por IA

Google lança Nano Banana Pro, modelo de IA para geração de imagens

Reportado por IA Imagem gerada por IA

O Google introduziu o Nano Banana Pro, um modelo aprimorado de geração de imagens por IA alimentado pelo Gemini 3 Pro, oferecendo maior precisão e capacidades de edição. A ferramenta está agora disponível globalmente no aplicativo Gemini, embora com limites de uso para usuários gratuitos. Ela também inclui recursos aprimorados para detectar conteúdo gerado por IA.

A OpenAI lançou um modelo atualizado de geração de imagens para o ChatGPT, tornando-o quatro vezes mais rápido e melhor em seguir instruções dos usuários. A atualização inclui capacidades de edição melhoradas e renderização de texto aprimorada. Isso surge logo após o lançamento do GPT-5.2 e em meio à concorrência do Gemini do Google.

Reportado por IA

Google lançou o Nano Banana 2, um modelo atualizado de geração de imagens por IA que combina a precisão de sua versão Pro com velocidades de processamento mais rápidas. Alimentado pelo Gemini 3.1 Flash Image, a ferramenta se torna o novo padrão em todas as plataformas do Google, incluindo o app Gemini e recursos de pesquisa. Ele visa fornecer imagens mais precisas e realistas, ao mesmo tempo em que expande as capacidades criativas.

Após um escândalo envolvendo o Grok da xAI gerando milhões de imagens abusivas, concorrentes OpenAI e Google implementaram novas medidas para prevenir mau uso similar. O incidente destacou vulnerabilidades em ferramentas de imagens de IA, provocando respostas rápidas da indústria. Essas etapas visam proteger usuários de imagens íntimas não consensuais.

Reportado por IA

A xAI lançou o Grok Imagine 1.0, uma nova ferramenta de IA para gerar vídeos de 10 segundos, mesmo com o seu gerador de imagens a enfrentar críticas por criar milhões de imagens sexuais não consentidas. Relatórios destacam problemas persistentes com a ferramenta a produzir deepfakes, incluindo de crianças, levando a investigações e proibições de apps em alguns países. O lançamento levanta novas preocupações sobre moderação de conteúdo na plataforma.

Google anunciou que seu protótipo experimental de IA, Genie 3, agora está disponível para assinantes de seu plano de IA de nível mais alto. A ferramenta permite que os usuários gerem e naveguem por mundos 3D interativos usando prompts de texto simples. Anteriormente limitada a testadores confiáveis, essa expansão marca um passo em direção a um acesso mais amplo para o público a partir de 18 anos.

Reportado por IA

A OpenAI lançou o ChatGPT 5.4, que inclui novas funcionalidades focadas em planilhas. A atualização traz ferramentas especializadas para o Microsoft Excel e Google Sheets. Esse desenvolvimento destaca uma ênfase em aplicativos de produtividade.

 

 

 

Este site usa cookies

Usamos cookies para análise para melhorar nosso site. Leia nossa política de privacidade para mais informações.
Recusar