Como criar imagens com a nova integração do Dall-E 3 do ChatGPT

Como usar a nova integração do Dall-E 3 no ChatGPT para criar imagens

A OpenAI acaba de integrar seu mais novo gerador de imagens, Dall-E 3, no ChatGPT. A ferramenta está atualmente em versão beta para assinantes do ChatGPT Plus, o serviço mensal de US$ 20 da OpenAI. Com o Dall-E 3 ativado, você pode dar um comando em linguagem casual para o chatbot criar um conjunto de quatro imagens distintas.

À medida que geradores de imagens mais poderosos se tornam disponíveis para o público, questões legais e éticas estão ganhando destaque. Vários artistas tentaram processar a OpenAI por possíveis violações de direitos autorais, por exemplo. Além das preocupações legais, especialistas em segurança expressaram temores sobre o potencial dos geradores de imagens de IA para permitir a propagação ampliada de desinformação.

Se você deseja experimentar o Dall-E 3 gratuitamente, uma versão está disponível através do Bing Image Creator da Microsoft. Durante os primeiros dias dessa integração, os usuários criaram imagens extremas usando o Bing, como o Bob Esponja voando um avião em direção às Torres Gêmeas. Desde então, a Microsoft adicionou mais precauções em torno do gerador de imagens de IA.

Para aqueles curiosos sobre como usar o ChatGPT com o Dall-E 3 para criar imagens, aqui está como começar e alguns conselhos com base na minha experiência testando as novas ferramentas do chatbot.

Se você é assinante do ChatGPT Plus, é muito simples ativar os recursos do Dall-E 3 do chatbot. Primeiro, faça login no site da OpenAI ou no aplicativo móvel do ChatGPT (Apple, Android). Após abrir o ChatGPT, clique na aba GPT-4 no topo da tela. No menu suspenso que aparece, selecione Dall-E 3 (Beta).

Além do Dall-E 3, os assinantes do ChatGPT Plus podem usar o “Browse with Bing” para acessar a Internet.

OpenAI via Reece Rogers

Há um limite de uso para interagir com a versão GPT-4 do ChatGPT. (Esses comandos exigem uma quantidade considerável de potência computacional para processar!) O limite oficial é de 50 comandos a cada três horas. Se você atingir esse limite, o chatbot exibirá uma mensagem de erro informando quanto tempo você terá que esperar antes de recuperar o acesso.

Além do limite de uso, esteja preparado para esperar cerca de 30 segundos para receber as imagens. Se alguma das criações entrar em conflito com as diretrizes da OpenAI, você poderá receber apenas imagens compatíveis ou até mesmo uma mensagem negando o pedido.

Se você já experimentou um gerador de imagens de IA antes, como o Dall-E 2 ou o Midjourney, uma das maiores diferenças é que agora você pode ver como o ChatGPT age como intermediário, criando múltiplos comandos para o Dall-E 3 completar.

Esses prompts criados pelo ChatGPT variam de longas frases a parágrafos completos, e cada um inclui detalhes diferentes para o Dall-E 3. Se houver pessoas na imagem, o chatbot frequentemente mencionará explicitamente gênero e raça dos sujeitos. Por exemplo, aqui está um dos prompts do Dall-E 3 que o ChatGPT usou quando solicitei uma imagem de dois repórteres da ENBLE entrevistando um CEO:

“Foto de um grupo diversificado de três pessoas em um ambiente corporativo: uma repórter da ENBLE do Oriente Médio segurando uma câmera, uma repórter da ENBLE africana com um microfone e um CEO caucasiano masculino respondendo às perguntas delas. O pano de fundo é uma área de lounge de escritório elegante.”

Se você não gostar dos primeiros resultados que o chatbot fornecer, peça para ajustar alguns aspectos, como o esquema de cores ou a atmosfera geral. Digamos que você goste muito da terceira imagem que o Dall-E 3 produz a partir do seu prompt. Depois de clicar no botão de download no canto superior esquerdo, você pode solicitar mais imagens que se pareçam com a terceira opção.

Alguma coisa foi feita para proteger os artistas nessa nova atualização? Na verdade, não. Embora o chatbot não crie imagens se você pedir para imitar um artista contemporâneo, existem várias maneiras de contornar isso.

Pedi para o ChatGPT projetar uma caneca de café com a arte no estilo de Keith Haring. A ferramenta de IA recusou o prompt inicial, mas ofereceu uma alternativa: “Posso criar um design inspirado nas características gerais de sua arte, como linhas ousadas, cores vibrantes e figuras simplistas. Você gostaria que eu seguisse com isso?” Os resultados finais do ChatGPT, nesse caso, ficaram confusos e medíocres.

Com o Dall-E 3, a arte de alguns dos prompts poderia passar por feita por humanos até que você olhe de perto o fundo e os detalhes mais sutis. Apesar das melhorias na qualidade, muitos dos problemas subjacentes aos geradores de imagens permanecem.

Prepare-se para ver distorções estranhas e rostos perturbadores nas imagens criadas pelo Dall-E 3. Os problemas podem ser engraçados, como um chatbot lutando para rotular ingredientes para assar, mas outros erros são mais graves. Quando solicitado a criar um mapa destacando Israel e a Faixa de Gaza, o ChatGPT rotulou repetidamente Gaza como parte do Mar Mediterrâneo.

Outro problema dos geradores de imagens é que as ferramentas comumente recaem em estereótipos racistas ao retratar seres humanos. O Dall-E 3 não é exceção. Das 20 imagens que pedi para o ChatGPT criar representando “repórteres da ENBLE”, o chatbot solicitou uma representação específica e diversificada para as imagens, com apenas algumas exceções. Quando o ChatGPT não adicionou raça ou gênero ao prompt, os resultados foram todos brancos e principalmente masculinos.