ChatGPT Images 2.0: A Nova Era na Criação de Imagens com IA

img fezwl1nhglgymtzi4qxlehzl

A OpenAI lançou recentemente o ChatGPT Images 2.0, uma atualização significativa no seu modelo de geração de imagens por inteligência artificial. Com a crescente popularidade do Nano Banana, a ferramenta de criação de imagens do Gemini Google, a nova versão busca se destacar ao oferecer funcionalidades mais avançadas e uma experiência mais intuitiva. O TechTudo teve acesso exclusivo aos detalhes durante uma coletiva de imprensa promovida pela OpenAI.

Inovações no ChatGPT Images 2.0

A principal inovação do ChatGPT Images 2.0 reside na capacidade de produzir imagens que se assemelham a criações feitas por designers profissionais. O novo modelo demonstra uma habilidade superior em seguir instruções complexas, garantindo maior precisão no posicionamento de objetos e na renderização de textos, um desafio comum em geradores de IA anteriores. Com resolução de até 2K, o modelo adapta-se a diversas proporções de tela, desde banners horizontais até posts verticais, tornando-se uma ferramenta versátil para criadores de conteúdo.

Aprimoramento Multilíngue

Um dos destaques do ChatGPT Images 2.0 é o suporte robusto a idiomas não latinos. Enquanto versões anteriores enfrentavam dificuldades ao integrar textos em imagens, esta nova versão fez avanços significativos, especialmente em idiomas como japonês, coreano, chinês, hindi e bengali. O resultado é que as palavras nesses idiomas são incorporadas de maneira esteticamente agradável e coerente nas imagens geradas.

Raciocínio Avançado para Criação Colaborativa

O ChatGPT Images 2.0 não se limita à geração de imagens simples. Por meio do modo de raciocínio avançado, o modelo atua como um parceiro criativo, realizando pesquisas na web e analisando o contexto da tarefa antes de produzir imagens. Essa abordagem permite a criação simultânea de até oito imagens distintas, todas coesas, o que é ideal para projetos complexos, como páginas de mangá ou séries de artes para redes sociais, mantendo a continuidade entre personagens e objetos.

Integração para Desenvolvedores e Empresas

Além de atender aos usuários finais, a OpenAI disponibilizou o modelo através da API chamada gpt-image-2. Isso permite que empresas e desenvolvedores integrem a geração de imagens de alta qualidade em seus produtos. As aplicações são vastas, abrangendo desde publicidade até a criação de sites e infográficos. Contudo, as saídas com resolução superior a 2K ainda estão em fase beta, podendo apresentar algumas instabilidades.

Disponibilidade e Acessibilidade

O ChatGPT Images 2.0 já está acessível a todos os usuários que utilizam o ChatGPT e o Codex. No entanto, as funcionalidades mais avançadas, que incluem a geração de múltiplas imagens por solicitação, são exclusivas para assinantes dos planos Plus, Pro, Business e Enterprise. O custo para acesso via API varia conforme a qualidade e a resolução escolhida.

Com o lançamento do ChatGPT Images 2.0, a OpenAI não apenas eleva o padrão na geração de imagens por IA, mas também amplia as possibilidades criativas para usuários e desenvolvedores. A combinação de recursos avançados e suporte a diversos idiomas promete transformar a forma como as imagens são criadas e utilizadas em diferentes contextos.

Compartilhar:

Mais Posts