Não conte com o supercomputador Dojo da Tesla para impulsionar uma revolução de IA

Tesla's Dojo supercomputer won't drive an AI revolution.

Você teria que ser muito corajoso para apostar contra a ideia de que aplicar mais poder de computação e dados ao aprendizado de máquina – uma receita que deu origem ao ChatGPT – não levará a avanços adicionais de algum tipo em inteligência artificial. Mesmo assim, você seria ainda mais corajoso para apostar que essa combinação produzirá avanços específicos ou descobertas em um cronograma específico, não importa o quão desejável.

Um relatório divulgado no último fim de semana pelo banco de investimentos Morgan Stanley prevê que um supercomputador chamado Dojo, que a Tesla está construindo para impulsionar seu trabalho em direção autônoma, poderia adicionar US$ 500 bilhões ao valor da empresa, fornecendo uma grande vantagem na fabricação de carros, robô-táxis e venda de software para outras empresas.

O relatório impulsionou o preço das ações da Tesla, adicionando mais de 6%, ou US$ 70 bilhões – aproximadamente o valor da BMW e muito menos do que Elon Musk pagou pelo Twitter – ao valor de mercado da fabricante de veículos elétricos até 13 de setembro.

O relatório de 66 páginas do Morgan Stanley é uma leitura interessante. Ele faz um caso apaixonado pelo motivo pelo qual o Dojo, os processadores personalizados que a Tesla desenvolveu para executar algoritmos de aprendizado de máquina, e a enorme quantidade de dados de direção que a empresa está coletando dos veículos Tesla na estrada, podem render grandes dividendos no futuro. Os analistas do Morgan Stanley afirmam que o Dojo fornecerá avanços que darão à Tesla uma vantagem “assimétrica” sobre outras fabricantes de automóveis em direção autônoma e desenvolvimento de produtos. O relatório até afirma que o supercomputador ajudará a Tesla a se ramificar em outras indústrias onde a visão computacional é crítica, incluindo saúde, segurança e aviação.

Há boas razões para ser cauteloso em relação a essas pretensões grandiosas. Você pode ver por que, neste momento particular de mania de IA, a estratégia da Tesla pode parecer tão fascinante. Graças a um salto notável nas capacidades dos algoritmos subjacentes, as habilidades de tirar o fôlego do ChatGPT podem ser rastreadas até uma simples equação: mais poder computacional x mais dados = mais inteligência.

Os magos da OpenAI foram seguidores precoces dessa mantra de “mais”, apostando suas reputações e milhões de dólares de investidores na ideia de que aumentar a infraestrutura de engenharia para redes neurais artificiais levaria a grandes avanços, incluindo em modelos de linguagem como aqueles que alimentam o ChatGPT. Nos anos anteriores à fundação da OpenAI, o mesmo padrão havia sido observado no reconhecimento de imagens, com conjuntos de dados maiores e computadores mais poderosos levando a um salto notável na capacidade dos computadores de reconhecer – embora em um nível superficial – o que uma imagem mostra.

A nova biografia de Musk, escrita por Walter Isaacson, que foi amplamente divulgada na semana passada, descreve como a versão mais recente do software otimisticamente chamado de Full Self Driving (FSD) da Tesla, que guia seus veículos em ruas movimentadas, depende menos de regras codificadas e mais de uma rede neural treinada para imitar uma boa direção humana. Isso soa semelhante a como o ChatGPT aprende a escrever ao absorver inúmeros exemplos de texto escrito por humanos. Musk afirmou em entrevistas que espera que um Tesla tenha um “momento ChatGPT” com FSD no próximo ano ou algo assim.

Musk fez grandes promessas sobre avanços em direção autônoma muitas vezes antes, incluindo a previsão de que haveria um milhão de robô-táxis da Tesla até o final de 2020. Então vamos considerar isso cuidadosamente.

Ao desenvolver seus próprios chips de aprendizado de máquina e construir o Dojo, a Tesla certamente poderia economizar dinheiro no treinamento dos sistemas de IA por trás do FSD. Isso pode ajudá-la a melhorar seus algoritmos de direção usando os dados reais de direção que coleta de seus carros, algo que os concorrentes não têm. Mas se essas melhorias ultrapassarão um ponto de inflexão na direção autônoma ou visão computacional de forma geral parece virtualmente impossível de prever.

Por um lado, o FSD não se parece muito com o ChatGPT. Conforme explicaram os engenheiros da empresa durante seu evento AI Day no ano passado, o recurso é alimentado por vários programas e sistemas de aprendizado de máquina projetados para lidar com uma série de tarefas de trânsito diferentes, como direção ou decodificação de marcações de estrada. Mais dados e mais computação podem produzir avanços significativos em alguns desses aspectos, mas um grande salto em direção autônoma requer avanços significativos em muitos ou todos esses subsistemas. As capacidades notavelmente gerais do ChatGPT, por outro lado, foram possibilitadas pela melhoria de um único sistema subjacente – um algoritmo monolítico que desenrola o texto.

Outro problema: vídeo e outros dados de sensores são fundamentalmente diferentes de texto. Na semana passada, conversei com robóticos que explicaram que uma questão central para o campo deles é se o tipo de escala que desbloqueou novas capacidades no ChatGPT pode ser transferido para o sensoriamento, navegação e raciocínio robóticos. Você pode construir um supercomputador para trabalhar nesses problemas. Mas aprender com dados de vídeo requer muito mais poder computacional do que processar texto, e fazer avanços fundamentais pode exigir exponencialmente mais. Ninguém – nem a Tesla, nem o Morgan Stanley – sabe ao certo quantos dados ou quão grande um supercomputador é necessário para fazer avanços fundamentais em robótica.

Um terceiro obstáculo na tese de dominação da Dojo pela Morgan Stanley é a ideia de que os avanços na condução autônoma se transferirão para outros problemas. Aprender a dirigir requer uma extensa compreensão do mundo físico, mas não ensina uma máquina a operar no mundo além do ambiente relativamente controlado da estrada, com suas regras e sinalizações.

Perguntei a Christian Gerdes, codiretor do Centro de Pesquisa Automotiva da Universidade de Stanford (CARS), o que ele pensa sobre a abordagem da Tesla. Ele me respondeu por e-mail de um autódromo em Portugal, onde está testando um sistema de direção autônoma desenvolvido em seu laboratório. Gerdes diz que há uma crença crescente em seu campo de que as capacidades de direção autônoma escalarão com dados e poder de processamento, mas ainda não está claro até que ponto isso pode ir. “Temos redes neurais relativamente simples aprendendo a física das corridas”, diz Gerdes sobre seus próprios experimentos. “Os resultados são bem bons, mas, curiosamente, nem sempre melhoram com mais dados.”

Talvez tudo o que você precise seja ainda mais dados e silício. De acordo com a estimativa do relatório da Morgan Stanley, em breve teremos uma ideia se esse é o caso. Prevê-se que a próxima versão do FSD será revelada em um Tesla AI Day no início de 2024 e demonstrará que a Tesla fez avanços fundamentais na condução autônoma graças à Dojo.

Talvez. Mas, dado o histórico da Tesla de prometer uma utopia iminente de direção autônoma, eu não apostaria, nem investiria, nisso.