Por que a visualização de IA da DeepMind é completamente inútil

Por que a visualização de IA da DeepMind é inútil

Impressionante, mas o que isso significa? As imagens do DeepMind, como esta, desenvolvidas por Tim West, são impressionantes, mas não explicam o que realmente está acontecendo nos programas de inteligência artificial. A imagem aparentemente representa “os benefícios e falhas de grandes modelos de linguagem”, como o ChatGPT, mas como?

“A excelência em gráficos estatísticos consiste em ideias complexas comunicadas com clareza, precisão e eficiência.” — Edward R. Tufte, The Visual Display of Quantitative Information.

Normalmente, a visualização é algo destinado a ajudar a entender algo que não pode ser visto. A unidade DeepMind do Google recentemente publicou visualizações de inteligência artificial, criadas por vários artistas visuais. A intenção pode ser boa, mas os resultados são um desastre.

“Visualizing AI comissiona artistas de todo o mundo para criar representações mais diversas e acessíveis de IA, inspiradas por conversas com cientistas, engenheiros e éticos do Google DeepMind”, diz a empresa. Ela contrasta essas imagens “diversas e acessíveis” com as imagens típicas de IA que incluem cérebros brilhantes ou robôs e coisas do tipo.

Também: IA Generativa: Apenas não a chame de ‘artista’, dizem estudiosos na revista Science

É verdade que as imagens típicas de estoque para IA, como as letras brilhantes “A” e “I”, não ajudam ninguém a entender a arte e a ciência bastante misteriosa dos formulários de aprendizado de máquina da IA, a forma dominante de inteligência artificial.

O famoso especialista em visualização Edward R. Tufte, cujo livro, “The Visual Display of Quantitative Information”, foi um marco na compreensão da visualização, escreveu que os visuais bem-sucedidos devem, entre outras coisas, “induzir o espectador a pensar sobre a substância, em vez de se concentrar na metodologia, no design gráfico, na tecnologia de produção gráfica ou em outra coisa.”

Também: O Google atualiza o Vector AI para permitir que as empresas treinem o GenAI com seus próprios dados

As imagens do DeepMind são principalmente sobre coisas como design gráfico. Elas são uma sobrecarga de design gráfico, na verdade.

Uma imagem, do Novoto Studio, mostra o que parecem ser balas de hortelã se aproximando de algum tipo de interface de computador. Não há nada no aprendizado profundo – ou qualquer outra forma de IA – que inclua balas de hortelã.

Bala de hortelã, alguém? As imagens do DeepMind, como esta, desenvolvidas pelo Novoto Studio, são impressionantes, mas não explicam o que realmente está acontecendo nos programas de inteligência artificial.

O texto que acompanha as balas de hortelã também é enigmático. “Um dispositivo eletrônico com muitos objetos pequenos nele”, diz. “Ilustração de um artista sobre inteligência artificial (IA). Esta imagem representa o potencial da IA para a sociedade através de visualizações 3D.” O que quer que isso signifique, provavelmente não tem muito a ver com balas de hortelã.

Também: A onda de visualização múltipla da IA está chegando, e será poderosa

Um vídeo acompanhante das balas de hortelã também é incompreensível, se um tanto hipnotizante. Poderia ser intitulado como “Marcha das balas de hortelã”, mas isso pode não ajudar ninguém a entender a IA.

Outra imagem, de Wes Cockx, supostamente é uma “estrutura de metal feita de madeira e metal” e tem como objetivo representar “o método de previsão usado em grandes modelos de linguagem”. É uma estrutura imaginária fascinante, mas não está claro o que ela está fazendo em termos de previsão. Nem o vídeo acompanhante, mostrando a estrutura de madeira e metal em ação, ajuda muito. Mostra algo que se parece com um aparelho, talvez um ábaco gigante de algum tipo, mas o que esse objeto está fazendo?

Algumas das imagens são tão fantasiosas que parecem não ter relação com nada. Uma imagem, do XK Studio, que retrata algo parecido com um cubo de uma espécie de substância gelatinosa, que parece estar derramando outros tipos de substâncias gelatinosas semelhantes a células, é, novamente, bastante cativante, mas não tem nada a ver com IA ou qualquer outra coisa. Se fosse preciso adivinhar, poderia-se pensar que é uma representação de um processo de formação de gelatina.

O vídeo da coisa gelatinosa mostra muitas coisas se formando, que por sua vez formam outras coisas. Novamente, quem sabe que coisas estão sendo formadas e por quê?

Além disso: O que é IA generativa e por que é tão popular? Aqui está tudo o que você precisa saber

O texto complementar explica que a imagem e o vídeo “exploram como os humanos podem colaborar criativamente com a inteligência artificial geral (IAG) no futuro e como ela pode oferecer novos pontos de vista, acelerar processos e levar a novos territórios.” Além de não explicar o que é ou pode ser a IAG, o texto é tão vago a ponto de ser inútil. Este é um caso em que uma imagem, e até mesmo mil palavras, podem não ajudar ninguém.

A única imagem que chega mais perto do alvo é outra do Novoto Studio, que mostra o que parece ser uma configuração ramificada. O texto a descreve como “redes neurais inspiradas usadas em aprendizado profundo”.

É a que mais se aproxima do alvo porque as redes neurais artificiais podem, de fato, ser consideradas, em alguns sentidos, como redes ramificadas que envolvem muitos elementos em atividade coletiva.

Além disso: Todo mundo quer IA responsável, mas poucas pessoas estão fazendo algo a respeito

De fato, é estranho que as ilustrações estejam todas tão fora de contexto, porque há uma rica tradição em IA de ilustração. O trabalho original de pesquisa em redes neurais, de Frank Rosenblatt do Laboratório Aeronáutico da Universidade Cornell, “O Perceptron”, deu início a 60 anos de tentativas de construir redes neurais artificiais. Rosenblatt descreveu em sua ilustração uma rede composta por neurônios artificiais. É bonito em sua simplicidade:

É fácil compreender em um momento um pouco sobre o que está acontecendo porque redes de conexões perpassam nossas vidas. Mapas de estações de metrô mostram redes de conexões. O grafo social do Facebook é uma coleção de entidades conectadas. O grafo de conexões de qualquer coisa é poderoso – muito mais poderoso do que as estranhas representações de tic-tac do Novoto Studio e demais.

Até mesmo é possível transformar o diagrama técnico original de Rosenblatt em imagens fantasiosas. Tais imagens podem não ser específicas, mas podem capturar parte da sensação de um sistema que tem entrada e saída e produz conexões entre elas:

Uma rede neural transforma a entrada, os círculos à esquerda, em saída, à direita. Como isso acontece é uma transformação de pesos (centro), que muitas vezes confundimos com padrões nos próprios dados.

O problema fundamental com as imagens da DeepMind é que os artistas parecem entender muito pouco de IA e, portanto, sua missão é principalmente dar sua própria representação impressionista e desinformada do que eles imaginam que a IA seja. Isso não é particularmente útil se quisermos que o público entenda algo sobre o que realmente está acontecendo com a IA.

Além disso: A IA vai a Hollywood: Navegando na faca de dois gumes da tecnologia emergente na narrativa

Isso é uma pena porque há muitas pessoas trabalhando no campo do aprendizado de máquina que têm um sólido entendimento da tecnologia e também produzem visualizações. O grupo de pesquisa People+AI do Google, por exemplo, produziu algumas visualizações interessantes de vários aspectos da tecnologia.

Uma ilustração do grupo People+AI do Google sobre o equilíbrio entre precisão e privacidade no aprendizado de máquina.

Um ex-membro do grupo, o professor da Universidade Harvard Martin Wattenberg, é um verdadeiro estudioso da visualização de ideias difíceis. Ele é famoso por, entre outras coisas, o Mapa do Mercado do SmartMoney desenvolvido para o site da publicação de finanças do consumidor, que se fundiu com o MarketWatch em 2013.

Há pessoas por aí que entendem de IA e podem comunicar parte dela. Há também pessoas que se destacam na narrativa visual e explicação. A DeepMind parece tê-las deixado de lado em favor de estúdios de design que não sabem muito sobre ambos.