O Santo Graal’ da Qualcomm A IA Generativa está chegando em breve aos telefones

Qualcomm's Generative AI Holy Grail is coming soon to phones.

A IA generativa, como o ChatGPT e o Midjourney, tem deslumbrado imaginações e perturbado indústrias, mas sua estreia tem sido principalmente limitada a janelas de navegador em computadores desktop. No próximo ano, será possível utilizar a IA generativa em movimento, quando os smartphones premium forem lançados com os chips de última geração da Qualcomm.

Há anos, os telefones utilizam IA para aprimorar fotos e melhorar a autocorreção, mas as ferramentas de IA generativa podem trazer o próximo nível de aprimoramentos para a experiência móvel. A Qualcomm está incorporando IA generativa em sua próxima geração de chips premium, que serão lançados na Qualcomm Summit anual no Havaí, no final de outubro.

Os participantes da cúpula terão a oportunidade de vivenciar em primeira mão o que a IA generativa trará para os telefones, mas Ziad Asghar, vice-presidente sênior de gerenciamento de produtos da Qualcomm, descreveu à ENBLE por que os usuários devem ficar animados com a IA no dispositivo. Em primeiro lugar, ter acesso aos dados do usuário – padrões de direção, pesquisas de restaurantes, fotos e muito mais – tudo em um só lugar tornará as soluções geradas pela IA em seu telefone muito mais personalizadas e úteis do que respostas gerais da IA generativa baseada em nuvem.

“Acredito que isso será o Santo Graal”, disse Asghar. “Essa é a verdadeira promessa que nos deixa realmente animados em relação ao potencial dessa tecnologia”.

Há outras vantagens em ter IA generativa no dispositivo. O mais importante é que as consultas e os dados pessoais pesquisados são mantidos privados e não são transmitidos por um servidor remoto. O uso de IA local também é mais rápido do que esperar por computação em nuvem, e pode funcionar durante viagens de avião ou em áreas sem serviço celular.

No entanto, uma solução no dispositivo também faz sentido do ponto de vista empresarial e de eficiência. À medida que os modelos de aprendizado de máquina se tornaram mais complexos (de centenas de milhares de parâmetros para bilhões, segundo Asghar), ficou mais caro executar servidores que respondem a consultas, como a Qualcomm explicou em um white paper publicado no mês passado. Em abril, estimou-se que a OpenAI gastava cerca de US$ 700.000 por dia para fazer o ChatGPT responder a solicitações, e essa previsão de custo era baseada no modelo GPT-3 mais antigo, não no novo GPT-4, que é mais complexo e provavelmente terá custos mais altos de manutenção em escala. Em vez de precisar de um conjunto de servidores completo, a solução da Qualcomm é usar o cérebro de silício existente no dispositivo para realizar todo o processamento necessário, sem custo adicional.

“Executar IA no seu telefone é praticamente gratuito – você pagou antecipadamente pelo poder de computação”, disse o analista da Techsponential Avi Greengart à ENBLE por e-mail.

Greengart viu a IA generativa no dispositivo da Qualcomm em ação quando a fabricante de chips a exibiu no Mobile World Congress em fevereiro, usando um telefone Android com Snapdragon 8 Gen 2 para executar o software de geração de imagens Stable Diffusion. Apesar de ser uma demonstração inicial, ele achou “tremendamente empolgante”.

Um chipset Snapdragon 8 Gen 2.

David Lumb/CNET

O que a IA generativa no dispositivo oferece aos usuários

A Qualcomm tem ideias sobre o que as pessoas podem fazer com a IA generativa baseada em telefones, melhorando desde tarefas de produtividade até assistir a entretenimento e criar conteúdo.

Como a demonstração do Stable Diffusion mostrou, a IA generativa no dispositivo pode permitir que as pessoas ajustem imagens sob comando, como pedir para trocar o fundo e colocá-las na frente dos canais de Veneza, disse Asghar. Ou elas podem ter uma imagem completamente nova gerada – mas isso é apenas o começo, já que modelos de aprendizado grandes de texto e visual podem funcionar em sequência, partindo de uma ideia até uma saída pronta.

Usando vários modelos, disse Asghar, um usuário pode ter seu discurso traduzido por reconhecimento automático de fala em texto, que é então alimentado em um gerador de imagens. Leve isso um passo adiante e faça com que seu telefone renderize o rosto de uma pessoa, usando IA generativa para criar movimentos realistas da boca e texto para fala para falar de volta para você, e pronto, você tem um assistente virtual alimentado por IA generativa com o qual pode ter conversas completas.

Esse exemplo específico pode ser alimentado em parte por IA de terceiros, como o modelo de linguagem grande Llama 2, lançado recentemente pela Meta, empresa-mãe do Facebook, em parceria com a Microsoft, além da Qualcomm.

“[Llama 2] permitirá que clientes, parceiros e desenvolvedores criem casos de uso, como assistentes virtuais inteligentes, aplicativos de produtividade, ferramentas de criação de conteúdo, entretenimento e muito mais”, disse a Qualcomm em um comunicado à imprensa na época. “Essas novas experiências de IA no dispositivo, alimentadas pelo Snapdragon, podem funcionar em áreas sem conectividade ou até mesmo no modo avião”.

Dentro do Museu somente com agendamento da Qualcomm HQ, cheio de telefones retrô

A Qualcomm não limitará esses recursos apenas aos telefones. Em sua próxima cúpula, a empresa planeja anunciar soluções de IA generativa também para PC e automóveis. Esse assistente pessoal poderia ajudá-lo com suas listas de tarefas, agendar reuniões e enviar e-mails. Se você estiver preso fora do escritório e precisar fazer uma apresentação, Asghar disse que a IA poderia gerar um novo plano de fundo para que não pareça que você está sentado em seu carro e exibir um conjunto de slides (ou até mesmo ajudar a apresentá-lo).

“Para aqueles de nós que cresceram assistindo a Knight Rider, bem, o KITT agora vai se tornar real”, disse Asghar, referindo-se ao icônico carro inteligente do programa de TV.

Independentemente da plataforma, a solução central de IA generativa existirá no dispositivo. Ela poderia ajudar com tarefas de escritório, como gerar automaticamente notas de uma ligação e criar um conjunto de slides de cinco páginas resumindo seus pontos-chave (“Isso é como o Clippy, mas turbinado, certo?” disse Asghar). Ou ela poderia criar mundos digitais do zero em AR e VR.

Além de mundos de fantasia, a IA generativa poderia ajudar pessoas cegas a navegar no mundo real. Asghar descreveu uma situação em que a transferência de modelos de imagem para imagem 3D para texto para fala poderia usar a câmera do telefone para reconhecer quando um usuário está em um cruzamento e informá-lo quando parar, além de quantos carros estão vindo de quais direções.

No campo da educação – talvez usando uma webcam ou a câmera de um telefone – a IA generativa poderia avaliar o quanto os alunos estão absorvendo uma lição de ensino, talvez rastreando suas expressões e linguagem corporal. E então a IA generativa poderia adaptar o material às habilidades e fraquezas de cada aluno, teorizou Asghar.

Todas essas são previsões da Qualcomm, mas terceiros terão que decidir como aproveitar melhor a tecnologia para melhorar seus próprios produtos e serviços. Para telefones, a IA generativa poderia ter um impacto real assim que fosse integrada a aplicativos móveis para experiências de jogos mais personalizadas, mídias sociais e criação de conteúdo, disse Greengart da Techsponential.

É difícil dizer o que isso significa para os usuários até que os desenvolvedores de aplicativos tenham a tecnologia de IA generativa em mãos para experimentar e integrar em seus aplicativos. É mais fácil extrapolar o que ela poderia fazer com base em como a IA ajuda as pessoas atualmente. Roger Entner, analista da Recon Analytics, prevê que a IA generativa ajudará a corrigir falhas em fotos subótimas, gerar filtros para mídias sociais e aprimorar a autocorreção – problemas que existem atualmente.

“A IA generativa aqui cria uma melhoria na qualidade de uso que em breve consideraremos como garantida”, disse Entner ao ENBLE por e-mail.

Um Snapdragon 8 Gen 2 envolto em um disco vermelho na frente de um equipamento usado para testar chips em produção.

David Lumb / ENBLE

A IA generativa está chegando primeiro aos telefones premium

As soluções atuais de IA generativa dependem de grandes fazendas de servidores para responder a consultas em grande escala, mas a Qualcomm está confiante de que seu silício no dispositivo pode lidar com as necessidades de um único usuário. Nos laboratórios de Asghar, os chips da empresa lidaram com modelos de IA com 7 bilhões de parâmetros (aspectos que avaliam dados e alteram o tom ou a precisão de sua saída), o que está muito abaixo dos 175 bilhões de parâmetros do modelo GPT-3 da OpenAI que alimenta o ChatGPT, mas deve atender às pesquisas móveis.

“Na cúpula [Hawaii], seremos capazes de mostrar que está sendo executado no dispositivo”, disse Asghar.

O dispositivo de demonstração provavelmente terá o próximo chip de alto nível da Qualcomm, presumivelmente o Snapdragon 8 Gen 3 que estará nos telefones Android premium do próximo ano. O dispositivo de demonstração em execução do Stable Diffusion na MWC 2023 usou o Snapdragon 8 Gen 2 anunciado na cúpula Snapdragon do ano passado no Havaí.

Em uma era em que os telefones mal duram o dia todo antes de precisarem recarregar, também há preocupação sobre se invocar o gênio da IA generativa ao longo do dia irá esgotar ainda mais a bateria. Teremos que aguardar testes no mundo real para ver como os telefones implementam e otimizam a tecnologia, mas Asghar observou que a demonstração da MWC 2023 estava executando consultas para os participantes o dia todo e não esgotou a bateria nem esquentou ao toque. Ele acredita que o silício da Qualcomm é exclusivamente capaz, com a IA generativa sendo executada principalmente em um processador Hexagon e uma unidade de processamento neural de um chipset Snapdragon, com “consumo de energia muito bom”.

“Acho que haverá preocupação para aqueles que não têm peças de hardware dedicadas para fazer esse processamento”, disse Asghar.

Asghar acredita que os telefones Android premium do próximo ano, alimentados pelo silício da Qualcomm, serão capazes de usar IA generativa. Mas levará algum tempo para que isso chegue aos telefones mais baratos. Assim como nos telefones atuais, a assistência de IA para limpar imagens, áudio e vídeo é melhor nos modelos de ponta e menos eficaz nos telefones mais baratos, as capacidades de IA generativa serão menores (mas ainda presentes) à medida que você descer no catálogo de chips da Qualcomm.

“Talvez você possa fazer um modelo de 10 bilhões de parâmetros no premium, e o nível abaixo disso pode ser menor que isso, se você estiver abaixo disso, pode ser menor que isso”, disse Asghar. “Então será uma degradação graciosa dessas experiências, mas elas se estenderão também aos outros produtos.”

Assim como no 5G, a Qualcomm pode ser a primeira a usar IA generativa em uma nova tecnologia, mas não será a última. A Apple vem silenciosamente melhorando sua IA em dispositivos, com o vice-presidente sênior de software Craig Federighi observando em uma conversa após a Conferência Mundial de Desenvolvedores que eles substituíram um modelo de linguagem transformador mais poderoso para melhorar a autocorreção. A Apple até teria testado internamente seu próprio chatbot “Apple GPT”. A gigante da tecnologia está desenvolvendo sua própria estrutura para criar grandes modelos de linguagem, a fim de competir no espaço de IA, que se aqueceu desde que a OpenAI lançou o ChatGPT ao público no final de 2022.

Assista a isso:

A IA da Apple pode entrar na corrida contra a IA Bard do Google e a IA Bing da Microsoft, ambas com lançamentos limitados este ano para testes públicos. Essas seguem o modelo mais tradicional de “chatbot inteligente” de IA generativa que aprimora o software, mas é possível que elas cheguem aos telefones por meio de aplicativos ou sejam acessadas por meio de um navegador da web. Tanto o Google quanto a Microsoft já estão integrando a IA generativa em suas plataformas de produtividade, então os usuários provavelmente verão seus esforços primeiro nas versões móveis do Google Docs ou do Microsoft Office.

Mas para a maioria dos proprietários de telefones, a IA generativa baseada em chips da Qualcomm pode ser o primeiro uso impactante de uma nova tecnologia. Teremos que esperar pela Cúpula Snapdragon para ver o quanto nossa experiência móvel pode estar mudando já no próximo ano.