Esta nova geração de assistentes de IA quer fazer suas tarefas chatas de escritório

Esta nova geração de assistentes de IA quer realizar as tarefas chatas de escritório por você

Nesta semana, a OpenAI anunciou um serviço que torna possível para quase qualquer pessoa criar uma versão personalizada do ChatGPT, sem necessidade de habilidades de programação. A empresa sugere que os usuários podem querer criar um bot que conheça as regras de todos os jogos de tabuleiro, ensine matemática para crianças ou ofereça conselhos de culinária. Esses GPTs, como a OpenAI os chama, também podem realizar ações simples conectando-se a serviços da internet, como pesquisar por e-mails ou fazer pedidos em uma loja online.

Não se pode culpar a OpenAI por tentar tirar proveito do sucesso estrondoso do ChatGPT. Mas talvez mais chatbots não sejam o que precisamos?

Adept AI, uma startup em San Francisco fundada por veteranos da OpenAI, Google e DeepMind, está lançando hoje um agente de IA experimental que automatiza tarefas comuns de maneira mais sofisticada e potencialmente poderosa do que chatbots como o ChatGPT. Em vez de se limitar ao uso de serviços online que fornecem APIs para torná-los acessíveis ao software, o ACT-2 tenta usar um computador de maneira mais humana – analisando os pixels em uma tela e tomando ações para controlar um navegador e serviços online.

Inscreva-se hoje

Boletim informativo Fast Forward da ENBLEWill Knight

As demonstrações da Adept mostram como o ACT-2 pode ser usado para coletar informações de e-mails e documentos para preencher pedidos de seguro, inserir informações de faturas enviadas por e-mail em software de contas a pagar e criar um tour a pé por uma cidade interagindo com o Google Maps.

A maneira como o ACT-2 tenta usar as mesmas interfaces de usuário que os humanos promete torná-lo muito mais capaz e expansível. Em teoria, essa abordagem poderia permitir que um chatbot fizesse literalmente qualquer coisa que uma pessoa fizesse em seu telefone ou computador. Mas operar dessa maneira também é mais desafiador para os algoritmos e, por enquanto, torna o agente mais propenso a erros.

Por baixo do capô, o ACT-2 usa um modelo de linguagem chamado Fuyu. É semelhante ao que alimenta muitos chatbots, mas, assim como o ChatGPT, ele pode lidar tanto com texto quanto com imagens (tornando-o um “modelo multimodal”). O modelo analisa o que vê na tela do computador e tenta traduzir a solicitação digitada pelo usuário em ações úteis que o bot deve tomar. A Adept usa aprendizado por reforço – uma técnica usada para ensinar tarefas a computadores, incluindo jogar jogos de tabuleiro e jogos de vídeo – para instruir sua IA a realizar tarefas diferentes. Isso envolve assistir a muitos humanos realizando tarefas específicas e tentar obter o desempenho semelhante para si mesmo.

David Luan, fundador e CEO da Adept e anteriormente vice-presidente de engenharia da OpenAI, diz que, embora os chatbots tenham impressionado a todos com suas capacidades, tem sido desafiador tornar AI agents confiáveis em seu funcionamento. Mas ele acredita que a Adept e outras estão chegando muito perto de resolver isso.

“Este ano eles simplesmente não estavam lá”, diz Luan sobre os agentes atuais, incluindo o seu próprio. “Acho que o que vai acontecer é que no próximo ano haverá uma grande guerra em torno de agentes que realmente funcionam.” A Adept está inicialmente projetando seus agentes para realizar apenas algumas tarefas simples, mas comuns de escritório, e afirma que eles agora são pelo menos 95% confiáveis, o que é suficiente para que sejam implantados comercialmente em algumas empresas.

Alcançar esse nível de confiabilidade apenas para as tarefas iniciais e limitadas para as quais o ACT-2 foi projetado é uma grande conquista. Por anos, existem ferramentas para automatizar tarefas de escritório – o que é conhecido como automação de processos robóticos – mas elas são complicadas de construir e propensas a falhas. Se a Adept e outras empresas puderem usar a IA para automatizar de forma confiável muito mais tarefas, isso poderá transformar o trabalho de escritório e aumentar a produtividade.

Se Luan estiver certo, a batalha para automatizar suas tarefas mais tediosas pode fazer as guerras de chatbots de 2023 parecerem relativamente tranquilas.