O Dall-E 3 da OpenAI é um gerador de arte alimentado pelo ChatGPT

O Dall-E 3 da OpenAI é um gerador de arte alimentado pelo ChatGPT' means 'Dall-E 3 by OpenAI is an art generator powered by ChatGPT.

A OpenAI anunciou o Dall-E 3, sua mais recente ferramenta de arte de inteligência artificial. Ela utiliza o chatbot de grande sucesso da OpenAI, o ChatGPT, para ajudar a criar obras de arte mais complexas e cuidadosamente compostas, expandindo automaticamente uma solicitação de forma a fornecer ao gerador instruções mais detalhadas e coerentes.

O que há de novo com o Dall-E 3 é como ele simplifica parte da complexidade necessária para refinar o texto alimentado ao programa, o que é conhecido como “engenharia de prompt”, e como permite que os usuários façam refinamentos por meio da interface de conversação do ChatGPT. A nova ferramenta pode ajudar a reduzir a barreira para gerar obras de arte sofisticadas com IA e pode ajudar a OpenAI a se manter à frente da concorrência graças às habilidades superiores do seu chatbot.

Arte de IA cortesia da OpenAI

Por exemplo, pegue essa imagem do rei da batata.

Esse tipo de arte gerada por IA, peculiar e divertida, se tornou comum nas redes sociais graças a várias ferramentas que transformam uma solicitação de texto em uma composição visual. Mas essa aqui foi criada com uma quantidade significativa de assistência artística do ChatGPT, que transformou uma solicitação curta em uma mais detalhada, incluindo instruções sobre como compô-la corretamente.

Isso é um grande avanço não apenas para o Dall-E, mas para a arte generativa de IA como um todo. O Dall-E, um jogo de palavras entre o personagem da Pixar Wall-E e o artista Salvador Dalí, foi anunciado em 2021 e lançado em 2022, e consiste em um algoritmo que recebe grandes quantidades de imagens rotuladas coletadas da web e de outras fontes. Ele utiliza o que é conhecido como um modelo de difusão para prever como renderizar uma imagem para uma determinada solicitação. Com quantidades suficientemente grandes de dados, isso pode produzir imagens complexas, coerentes e esteticamente agradáveis. O que é diferente com o Dall-E 3 é a forma como humanos e máquinas interagem.

Arte de IA cortesia da OpenAI

Essa imagem, renderizada pelo Dall-E 3, mostra como usar o ChatGPT para preencher uma solicitação produz uma imagem mais coerente e sofisticada. Normalmente, isso exigiria uma quantidade enorme de “engenharia de prompt”, em que um usuário tenta solicitações cada vez mais complexas para criar algo sofisticado. Mas com o Dall-E 3, o ChatGPT assume o trabalho de criar esse prompt mais sofisticado.

Arte de IA cortesia da OpenAI

O Dall-E 3 produziu essa imagem em resposta à seguinte solicitação: “Uma ilustração de um coração humano feito de vidro translúcido, em pé em um pedestal em meio a um mar tempestuoso. Raios de sol atravessam as nuvens, iluminando o coração e revelando um pequeno universo em seu interior. A frase ‘Encontre o universo dentro de você’ está gravada em letras em destaque no horizonte.”

O Dall-E 3 também permite que os usuários refinem uma criação por meio do ChatGPT, como se estivessem pedindo a um verdadeiro artista para fazer alterações. “Você não precisará se preocupar em lidar com solicitações muito longas”, diz Aditya Ramesh, pesquisador líder e chefe da equipe Dall-E. “Em vez disso, você pode simplesmente interagir com o ChatGPT como se estivesse conversando com um colega de trabalho.”

Gabriel Goh, pesquisador líder na equipe Dall-E, demonstrou o truque para a ENBLE, pedindo ao Dall-E 3 que criasse vários cartazes promocionais para um restaurante de macarrão imaginário. Depois de apresentar algumas opções, Goh pediu ao Dall-E 3, por meio do ChatGPT, que pegasse uma delas e a transformasse em uma ilustração de uma placa pendurada do lado de fora de um restaurante.

O Dall-E 3 já está disponível por meio do ChatGPT Plus, uma versão paga do chatbot.

Em 2022, o surgimento de numerosos geradores de arte de IA marcou o início de um boom mais amplo de IA generativa. Muitos dos primeiros geradores eram rudimentares e incapazes de refinar ou modificar imagens. Além da OpenAI, startups como Midjourney, Stable Diffusion e Ideogram atraíram investimentos significativos e interesse público. No entanto, o uso desses sistemas de arte de IA também gerou preocupações de que artistas humanos profissionais possam ser substituídos e sobre como as empresas de IA usam material protegido por direitos autorais para treinar seus algoritmos.

Em resposta a essa controvérsia, a OpenAI também anunciou hoje que lançará uma forma para artistas removerem suas obras de futuras rodadas de treinamento. O Dall-E 3 também impedirá que os usuários tentem gerar uma obra de arte no estilo de um artista conhecido, detectando quando isso está incluído como um estímulo.

A OpenAI também possui salvaguardas para bloquear usuários de gerar arte pornográfica ou violenta graficamente, ou imagens com figuras públicas. Sandhini Agarwal, pesquisadora de políticas da OpenAI, diz que a nova versão do Dall-E passou por ainda mais “avaliação de equipe adversária”, o que envolve pesquisadores tentando quebrar suas barreiras de segurança. “Um pedido muito explícito por conteúdo picante, isso é algo que terá que passar por um classificador e será rejeitado”, diz Agarwal. Alguns programadores, é claro, criaram geradores de imagens de código aberto sem restrições.

Um dos resultados mais notáveis do boom na arte gerada por IA é a imagem surreal que inundou as redes sociais. A seguinte imagem foi gerada usando o Dall-E 3 com a ajuda do ChatGPT, usando este estímulo: “Uma vasta paisagem feita inteiramente de várias carnes se espalha diante do espectador. Montanhas tenras e suculentas de rosbife, árvores de coxa de frango, rios de bacon e blocos de presunto criam uma cena surreal, mas apetitosa. O céu é adornado com um sol de pepperoni e nuvens de salame”.

Arte de IA, cortesia da OpenAI