Novo recurso de IA visa democratizar a geração de imagens de alta resolução

Nova ferramenta de IA busca democratizar a criação de imagens em alta resolução

No mundo da geração de imagens de IA, ferramentas como DALL-E e Midjourney estão segurando a coroa – e não apenas por causa de seu desempenho de alta resolução. O treinamento desses modelos requer um investimento e recursos substanciais, o que inevitavelmente leva a serviços centralizados e acesso pago por uso.

Uma nova ferramenta de IA desenvolvida pela Universidade de Surrey visa reverter essa tendência e democratizar a tecnologia, abrindo a geração de imagens de alta resolução para um público mais amplo.

Denominado DemoFusion, o modelo permite que os usuários gerem imagens de alta qualidade sem a necessidade de assinar um serviço ou possuir um computador muito poderoso. Na verdade, o sistema apenas requer uma GPU RTX 3090 de nível de consumo que pode ser encontrada em qualquer PC para jogos de médio alcance ou um Mac M1.

A IA é essencialmente uma extensão plug-and-play do modelo de código aberto Stable Diffusion XL (SDXL), que gera imagens em uma resolução de 1024×1024. O DemoFusion permite um aumento de 4x, 16x ou até mesmo maior em resolução – com algumas poucas linhas de código simples e sem nenhum treinamento adicional. A única compensação, segundo a equipe, é “um pouco mais de paciência”. Nós testamos aqui na TNW e demorou cerca de seis minutos.

SDXL vs DemoFusion Gerador de Imagem de IA
Crédito: Universidade de Surrey
No lado esquerdo: o resultado do SDXL. No lado direito, o resultado do DemoFusion. Crédito: Universidade de Surrey

Para alcançar esses resultados de alta resolução, os cientistas primeiro geraram imagens de baixa resolução e em seguida as aprimoraram usando um processo chamado aumento progressivo. Isso melhora os detalhes e a resolução do SDXL trabalhando em patches das imagens.

“Pela primeira vez, nossa técnica exclusiva permite que os usuários aprimorem suas imagens geradas por IA sem a necessidade de grande poder de computação ou qualquer retrabalho do modelo”, disse o professor Yi-Zhe Song.

“A arte e a imagem digital são um meio poderoso ao qual todos devem ter acesso – não apenas um punhado de grandes corporações. É por isso que tornamos o DemoFusion disponível publicamente. Acreditamos que ele pode enriquecer nossas vidas e todos devem poder usá-lo.”

A nova técnica está disponível online no artigo “DemoFusion: Democratizando a Geração de Imagens de Alta Resolução sem Gastar $$$”.

Se o DemoFusion ganhará tração suficiente para competir com gigantes como o DALL-E da OpenAI ainda está por ser visto, mas sua criação é um passo importante para abrir o potencial de geração de imagens de IA para o público e a comunidade de tecnologia em geral.