A OpenAI apresentou recentemente o ChatGPT Images 2.0, uma atualização significativa que vem um ano após a introdução da geração de imagens no chatbot. A empresa classifica essa nova versão como uma verdadeira 'mudança de patamar' no que diz respeito aos modelos de criação de imagens, destacando melhorias na capacidade de seguir instruções complexas, renderizar textos densos e posicionar objetos de maneira precisa em composições visuais.
Inovações em Raciocínio e Confiabilidade
Uma das características mais notáveis do ChatGPT Images 2.0 é sua capacidade de raciocínio, um avanço inédito na geração de imagens. O novo modelo permite que o sistema busque informações na web e verifique a precisão de suas saídas, o que resulta em uma ferramenta mais confiável, especialmente quando se exige precisão e coesão visual em projetos criativos.
Aprimoramento em Linguagens Não Latinas
A OpenAI também concentrou esforços significativos para melhorar o entendimento e a renderização de textos em idiomas não latinos. Com ganhos expressivos em línguas como japonês, coreano, chinês, hindi e bengali, o Images 2.0 se torna uma ferramenta mais versátil para diversas aplicações, desde a prototipagem de jogos até a elaboração de storyboards. Esse foco na diversidade linguística amplia as possibilidades de utilização do modelo em contextos globais.
Flexibilidade e Alta Resolução
Outra inovação do ChatGPT Images 2.0 é a flexibilidade em proporções de imagem, permitindo a criação de imagens com uma largura de até 3:1 e altura de até 1:3. Além disso, o modelo consegue produzir designs em resoluções que chegam a 2K, com a capacidade de gerar até oito imagens simultaneamente. Em testes, como a criação de um gato tartaruga no estilo pixel art de Pokémon, o modelo conseguiu capturar com sucesso a estética icônica, refletindo sua eficácia.
Limitações e Desafios Futuras
Apesar das melhorias, a OpenAI ressalta que o ChatGPT Images 2.0 não é infalível. O sistema pode apresentar dificuldades em tarefas que exigem uma compreensão física do mundo, como a resolução de quebra-cabeças complexos ou a criação de instruções de origami. Além disso, elementos visuais densos, como texturas muito finas, podem desafiar suas capacidades. Tais limitações são áreas identificadas pela OpenAI para melhorias em versões futuras.
Disponibilidade e Acesso
O ChatGPT Images 2.0 já está acessível para todos os usuários do ChatGPT, incluindo aqueles nos planos Free e Go, enquanto assinantes Plus e Pro têm acesso a funcionalidades mais avançadas. A OpenAI também disponibilizou o novo modelo através de sua API e no aplicativo Codex, que recebeu uma atualização recente para integrar a geração de imagens. Este lançamento acontece em um momento em que outras empresas, como a Anthropic, estão entrando no mercado de design visual com suas próprias soluções.
Com essas inovações, o ChatGPT Images 2.0 promete transformar a forma como as imagens são geradas e utilizadas, oferecendo ferramentas mais eficazes para criadores e profissionais de diversas áreas.




