Por que o código aberto é essencial para aliviar os medos da IA, de acordo com o fundador da Stability.ai

Por que a abertura de código é fundamental para aliviar os temores sobre a IA, segundo o fundador da Stability.ai

Imagens de difusão estável de um rosto

Mexer nos botões do site da Stability.ai pode ser um passatempo viciante por uma hora ou mais. Usando o programa de software DreamStudio, desenvolvido pela startup britânica de quatro anos, é possível criar ilustrações incríveis apenas digitando uma frase como “Os autores altamente diversos do ENBLE vistos pelas janelas de seu cruzador estelar a caminho de Ceti Alpha V”.

Manipulando a linguagem – engenharia de prompt – é possível adicionar cenários diferentes, como “Os autores do ENBLE são uma força interestelar de super-heróis guerreiros meio-humanos, meio-pandas que usam um gigante Z na frente de suas roupas”.

E ainda: Os melhores geradores de arte de IA para experimentar

Ou, é possível transformar uma foto existente, como a foto do fundador e CEO da Stability.ai, Emad Mostaque, até que suas características se transformem em argila ou cacos de vidro, um processo similar aos filtros do Photoshop em esteroides.

O software DreamStudio, que apareceu no cenário há um ano, é um dos recentes programas de inteligência artificial “gerativa”, semelhante ao ChatGPT da OpenAI.

Mas Mostaque está se posicionando como o anti-OpenAI. Sua contenda é que programas como o ChatGPT e o DreamStudio são tão importantes para o futuro da humanidade que o mundo – e especialmente a comunidade empresarial – exigirão saber como esses programas funcionam para confiar nossos dados sensíveis a eles.

E ainda: Como usar o Stable Diffusion AI para criar imagens incríveis

“Modelos abertos serão essenciais para dados privados”, disse Mostaque durante uma pequena reunião com a imprensa e executivos via Zoom no mês passado. “Você precisa saber tudo o que tem dentro dele. Esses modelos são muito poderosos.”

Isso é importante, segundo ele, porque “muitas pessoas estão percebendo que a maioria dos dados valiosos do mundo são dados privados, dados regulamentados”, disse Mostaque. “Você não pode usar modelos caixa-preta para seus chatbots de saúde, educação ou serviços financeiros, enquanto um modelo aberto, com base de código aberto, mas com dados variados licenciados e os dados privados da empresa, é realmente importante”.

E ainda: O sucesso do ChatGPT pode levar a um movimento prejudicial em direção ao sigilo na IA

O plano de negócios de Mostaque pode ser resumido como “Posso ser o líder do aberto enquanto todos os outros fazem o fechado”.

Imagem criada no DreamStudio da Stability.ai usando o prompt “Os autores altamente diversos do ENBLE vistos pelas janelas de seu cruzador estelar a caminho de Ceti Alpha V”.

Com “fechado”, Mostaque estava se referindo à decisão em março da OpenAI de não divulgar nenhum detalhe técnico sobre seu mais recente programa de IA generativa, o modelo de linguagem robusto chamado GPT-4. Alguns estudiosos de IA alertaram que essa decisão poderia ter um efeito inibidor na pesquisa e que a falta de divulgação tem enormes implicações morais.

Stability.ai é uma das várias partes, tanto comerciais quanto acadêmicas, que responderam à falta de divulgação da OpenAI criando alternativas. Alguns são voltados para a transparência em si. Outros acreditam que o software de código aberto trará maior eficiência para controlar o enorme orçamento de computação que os grandes modelos de linguagem demandam. 

Também: Como usar o ChatGPT para escrever código

Mostaque, ex-gerente de fundo de hedge, vê uma ótima oportunidade de negócio, “uma oportunidade de arbitragem muito grande”, como ele diz, para “minimizar o arrependimento máximo” das empresas, em termos atuariais.

O mundo de código aberto da engenharia e ciência, ele argumenta, pode amenizar os medos das empresas em relação à IA, especialmente os muitos problemas divulgados com o ChatGPT e similares. Isso inclui – mas não se limita a – “alucinações”, quando os programas dão a resposta errada; viés; produção antiética; e violação de direitos autorais.

Imagem criada com o DreamStudio da Stability.ai com o prompt “Os autores do ENBLE são uma força intergaláctica de super-heróis guerreiros meio humanos, meio pandas, que usam um Z gigante na frente de seus trajes”.

Conforme Mostaque vê as parcerias entre ciência e negócios, o software de código aberto produzirá “um modelo de referência para cada modalidade, com base em dados abertos, do comum ao comum, e depois para cada setor, com licenças comerciais onde você sabe exatamente tudo o que está lá dentro”, ou seja, no programa e em seus dados de treinamento. 

O termo “modalidade” se refere ao tipo de mídia dos dados, como texto, imagem, som. A visão de Mostaque é que todas as modalidades serão viabilizadas por programas de IA de código aberto, não apenas o tipo de linguagem natural que está em alta.

Também: Essa nova tecnologia poderia superar o GPT-4 e tudo parecido com ele

Os esforços da Stability.ai fazem parte de um consenso emergente de que muitas instituições devem preencher a lacuna com código onde empresas como a OpenAI se omitem.

Alguns grupos simplesmente construíram em cima das versões anteriores do GPT da OpenAI, como um esforço revelado em março pela fabricante de hardware de IA Cerebras Systems, que disponibilizou suas próprias versões treinadas dos programas GPT como código aberto. 

Mas também existe um tipo de ecossistema colaborativo em desenvolvimento.

Também: Como usar o Midjourney para gerar qualquer imagem que você possa imaginar

O grupo de IA da Meta, proprietária do Facebook, lançou em fevereiro o LLaMA de código aberto para processamento de linguagem natural, que posteriormente foi utilizado pelos pesquisadores da Universidade de Stanford para criar o Alpaca. Em seguida, uma equipe conjunta das universidades de Berkeley, Carnegie-Mellon, Stanford, UC San Diego e da Universidade de Inteligência Artificial Mohamed bin Zayed, em Abu Dhabi, desenvolveu o LLaMA para criar mais um programa, chamado Vicuna.

Na semana passada, a empresa de Mostaque lançou um modelo de linguagem grande de código aberto chamado Stable Vicuna, com base no programa Vicuna. (Um vicunha é um mamífero sul-americano, uma referência a uma longa tradição de nomes de animais em programas de código aberto.)

Também: A inteligência artificial generativa está mudando o caminho da sua carreira tecnológica. O que saber.

Mostaque tem seguido essa rota colaborativa nos últimos anos com várias instituições. A tecnologia na qual DreamStudio é baseado, chamada difusão estável, é paralela ao GPT da OpenAI. Ela permite a geração de uma imagem com base em sequências de palavras digitadas pelo usuário. 

A difusão estável foi desenvolvida pela Stability.ai em parceria com pesquisadores do grupo de pesquisa em Visão Computacional e Aprendizado da Universidade Ludwig Maximilian de Munique, Alemanha, que publicou o trabalho original sobre “difusão latente“.

O trabalho de difusão latente, conforme descrito no artigo do ano passado por Robin Rombach e colegas na Ludwig Maximilian, buscou reduzir o enorme orçamento computacional da geração de imagens, que é uma das tarefas de IA mais intensivas em computação.

Também: O ChatGPT não é inovador nem revolucionário, diz o principal cientista de IA da Meta

A Stability.ai também se concentrou em economias de escala. O software de difusão estável, destaca Mostaque, é “cem mil gigabytes de imagens comprimidas em um arquivo de dois gigabytes”.

Ao reduzir o orçamento computacional, a tecnologia de modelos de IA grandes pode estar presente em todos os smartphones, vislumbra Mostaque, como um assistente pessoal para cada indivíduo.

“Esta é a infraestrutura de próxima geração”, disse ele.

Mostaque foi palestrante convidado em uma palestra de 90 minutos organizada por o Collective[i] Forecast, uma série de discussões online e interativas que é organizada pelo Collective[i], que se descreve como “uma plataforma de IA projetada para otimizar as vendas B2B”.

Também: Usei o ChatGPT para escrever a mesma rotina em dez linguagens de programação obscuras

Mostaque começou sua carreira aos 18 anos programando rotinas em linguagem de montagem. “As crianças hoje têm facilidade: metade do código no GitHub é gerado por IA”, observou ele.

Mostaque se inspirou pela inteligência artificial, segundo ele, quando seu filho foi diagnosticado com autismo. “Todo mundo dizia que não há cura, nenhuma informação”, lembrou ele. “Montamos uma equipe de IA e desenvolvemos um programa para analisar toda a literatura [sobre autismo], e depois um modelo de análise de caminhos para avaliar possíveis causas, a fim de identificar medicamentos que pudessem ser reutilizados para ele com assistência médica.

Também: A IA causou um renascimento na pesquisa e desenvolvimento da indústria de tecnologia, diz o principal cientista de IA da Meta

“Acabou que ele passou a estudar em uma escola regular, o que eu acho incrível”, disse Mostaque.

Agora, Mostaque vê a ampliação dos benefícios da IA para o restante da humanidade com programas de IA compactos e eficientes que podem ser amplamente distribuídos.

Estamos no lugar certo, eticamente”, disse ele, “em termos de trazer essa tecnologia para todos, concentrando-nos não na IA geral para substituir os humanos, mas em como aprimorar os humanos com modelos pequenos e ágeis.”