Faça espaço Bing Image Creator! Google anuncia nova ferramenta de geração de imagens com IA

Dê lugar ao Bing Image Creator! Google anuncia nova ferramenta com inteligência artificial para criar imagens

A partir de hoje, o experimento de busca da Google, alimentado por inteligência artificial, chamado SGE, é multimodal. Seguindo os lançamentos do DALL-E 3, da OpenAI, e do Bing Image Creator, da Microsoft, o SGE da Google agora possui sua própria ferramenta de geração de imagens por IA.

Alimentado pelos modelos de difusão de texto para imagem da Google, usuários com acesso ao SGE podem descrever uma imagem que desejam e, em questão de segundos, o SGE apresentará quatro variedades para escolher. A partir daí, os usuários podem editar ainda mais a descrição para ajustar a imagem que desejam ver. No exemplo da Google, a solicitação original é para uma imagem pitoresca de uma capivara usando um chapéu de chef e cozinhando bacon. Os usuários podem editar a descrição para fazer a capivara cozinhar batatas em cubos.

Na corrida armamentista da IA, ou Thunderdome – ou como você quiser chamar a competição dos gigantes da tecnologia pela dominação do mercado de IA – a multimodalidade é um território estratégico cobiçado. Multimodalidade refere-se à capacidade de um modelo de IA entender e processar diferentes tipos de mídia, incluindo imagem e áudio.

Um chatbot de IA conversando com usuários é uma coisa, mas “ver” e “ouvir” e produzir resultados criativos é um nível completamente novo de sofisticação em IA. A OpenAI lançou recentemente a última versão de sua ferramenta de geração de imagens, o DALL-E 3. A Microsoft, que é investidora da OpenAI, agora usa o DALL-E 3 para o Bing Image Creator. E agora, a Google está trazendo sua própria versão para o SGE.

Acesso generalizado a ferramentas de geração de imagens por IA não está livre de grandes preocupações, incluindo a propagação de desinformação/misinformação e violações de direitos autorais. O SGE foi treinado para bloquear conteúdo prejudicial ou enganoso que viole a política de IA generativa da Google e não gerará imagens contendo rostos humanos fotorrealistas. Além disso, figuras públicas notáveis (ou seja, celebridades) serão bloqueadas nos resultados de geração de imagens, evitando deepfakes potenciais. Como precaução adicional, a ferramenta é para usuários maiores de 18 anos.

As imagens criadas pelo SGE terão metadados e marcas d’água embutidas indicando que são geradas por IA. Além disso, os modelos de imagem da Google foram treinados em conteúdo publicamente disponível. O ENBLE perguntou à Google se os dados do usuário provenientes de prompts de texto e imagens geradas são usados para treinar o modelo. Também perguntamos se há uma opção de exclusão. Atualizaremos esta história quando obtivermos uma resposta.

Também presente no SGE agora é a capacidade de rascunhar conteúdo escrito. Essa é a mesma funcionalidade disponível no Bard, o chatbot de IA da Google, mas agora pode ser acessada diretamente dentro da função de busca do SGE, poupando o tempo de alternar entre janelas.

Recurso SGE da Google mostrando a capacidade de rascunhar uma mensagem usando IA generativa

A geração de imagens e o rascunho de mensagens dentro do SGE estão sendo introduzidos hoje em inglês para usuários nos EUA.