O OpenAI fortalece sua ferramenta de inteligência artificial geradora de imagens com o DALL-E 3

OpenAI strengthens its AI image generator tool with DALL-E 3

OpenAI revelou a próxima geração de sua ferramenta de criação de imagens. Conhecida como DALL-E 3, a nova versão foi projetada para entender melhor as descrições de texto e criar imagens mais precisas e fiéis. Em sua nova página do DALL-E 3, a OpenAI não revelou muito sobre a ferramenta, mas deu pistas sobre como pretende superar seu antecessor DALL-E 2.

O DALL-E 3 foi projetado para compreender melhor as nuances e detalhes de suas descrições, criando assim imagens mais precisas. Geradores de imagens baseados em IA atuais às vezes ignoram palavras em suas descrições, resultando em imagens que não correspondem ao que você deseja. Com base nas imagens exibidas na página do DALL-E 3, a nova versão parece capaz de criar imagens mais precisas, detalhadas e imaginativas.

Também: Os melhores geradores de imagens de IA de 2023

Com o buzz em torno da IA, os geradores de imagens se tornaram populares entre indivíduos e empresas. Ferramentas como DALL-E 2, Bing Image Creator da Microsoft, Midjourney, Stable Diffusion, DreamStudio e Craiyon funcionam mais ou menos da mesma forma. Usando um prompt, você descreve a imagem que deseja gerar, escolhe um estilo e outros atributos. Em resposta, a ferramenta cria uma ou mais imagens que esperamos corresponder ao seu pedido.

Mas, assim como muitos dos bots de IA de hoje em dia, esses geradores de imagens podem ser desafiadores de usar. Normalmente, você precisa formular seu prompt da maneira correta. E mesmo assim, nem sempre interpretam corretamente suas solicitações. Reconhecendo que os sistemas modernos de texto para imagem o forçam a aprender como criar prompts, a OpenAI afirmou que o DALL-E 3 seria um salto adiante na geração de imagens que se aderem melhor às suas descrições.

Construído sobre o ChatGPT, o DALL-E 3 será acessível por meio da plataforma ChatGPT. A vantagem aqui é que você poderá usar o ChatGPT para desenvolver suas ideias e prompts de imagem. Em seguida, você pode fazer uma solicitação para criar uma imagem usando uma frase simples ou um parágrafo mais detalhado.

Também: Meus dois plugins favoritos do ChatGPT Plus e as coisas notáveis que posso fazer com eles

Nos exemplos apresentados na página do DALL-E 3, a OpenAI mostrou como a nova versão funcionaria.

Uma imagem foi gerada com base na descrição: “Pequenos reis de batata usando coroas majestosas, sentados em tronos, supervisionando seu vasto reino de batatas cheio de súditos de batatas e castelos de batatas.”

Uma segunda imagem foi criada a partir da descrição: “Uma ilustração de um abacate sentado em uma cadeira de terapeuta, dizendo ‘Eu me sinto tão vazio por dentro’, com um buraco do tamanho de uma semente no centro. O terapeuta, uma colher, anota observações.”

E duas imagens foram geradas com base em uma descrição que dizia: “Uma pintura a óleo expressiva de um jogador de basquete enterrando, retratado como uma explosão de uma nebulosa.” Uma imagem usou o DALL-E 2, enquanto a outra usou o DALL-E 3.

A OpenAI também enfatizou que limitou a capacidade do DALL-E 3 de criar conteúdo violento, adulto ou odioso, como fez com versões anteriores. Foram feitas melhorias em áreas como a criação de figuras públicas e certos vieses prejudiciais. Por exemplo, a ferramenta recusará prompts que peçam por uma figura pública pelo nome.

Também: Quem é dono do código, imagens e narrativas gerados por IA?

Imagens geradas por IA também podem ser um problema quando usadas para retratar uma pessoa ou evento real, enganando as pessoas ao pensarem que a imagem é real. Para combater esse problema, a OpenAI disse que está testando uma nova ferramenta interna que pode dizer se uma imagem foi criada pelo DALL-E 3 ou não.

Atualmente em testes fechados, o DALL-E 3 está programado para ser lançado para clientes do ChatGPT Plus e Enterprise no início de outubro.