Modelos de IA que Jogam Jogos Aprendendo a Agir em Instruções Verbais.

Modelos de IA para Jogos Existem há Décadas, Mas Costumam se Concentrar em um Jogo e Sempre Visam a Vitória. Pesquisadores do Google Deepmind Adotam uma Abordagem Diferente

O DeepMind do Google treina IA para ser seu companheiro de cooperação em jogos de vídeo!

Modelos de IA Jogando Jogos

Modelos de IA que jogam jogos existem há décadas, mas geralmente foram limitados a se especializar em um jogo e sempre buscando vencer. No entanto, os pesquisadores do Google DeepMind adotaram uma abordagem diferente com sua mais nova criação – um modelo que não apenas aprende a jogar vários jogos 3D como um humano, mas também faz o possível para entender e agir com base em instruções verbais.

Na maioria dos jogos, já existem personagens de IA ou computador que podem realizar ações semelhantes, mas geralmente são controlados indiretamente por meio de comandos formais dentro do jogo. O novo modelo da DeepMind, chamado SIMA (agente escalar instrutável multiworld), rompe com essa abordagem. Em vez de ter acesso ao código interno ou regras do jogo, o SIMA foi treinado em incontáveis horas de filmagens mostrando jogabilidade por humanos. O modelo aprende a associar representações visuais específicas de ações, objetos e interações através desses dados, juntamente com as anotações fornecidas pelos rotuladores de dados. Os pesquisadores também gravaram vídeos de jogadores instruindo uns aos outros para realizar tarefas dentro do jogo.

Por exemplo, o modelo pode aprender que um padrão específico de movimento de pixels na tela corresponde à ação de “avançar”. Da mesma forma, quando o personagem se aproxima de um objeto em forma de porta e usa o objeto que se parece com uma maçaneta, ele reconhece isso como “abrir” uma “porta”. Essas são tarefas ou eventos simples que levam alguns segundos, mas exigem mais do que simplesmente pressionar uma tecla ou identificar algo.

Os vídeos de treinamento foram retirados de vários jogos, desde Valheim até Goat Simulator 3. Os desenvolvedores destes jogos estavam envolvidos e consentiram com o uso de seu software. Um dos principais objetivos dos pesquisadores era determinar se treinar um modelo de IA para jogar um conjunto de jogos o tornaria capaz de jogar outros que nunca tinha visto antes – um processo conhecido como generalização.

A resposta, com algumas ressalvas, é sim. Agentes de IA treinados em vários jogos se saíram melhor em jogos aos quais não tinham sido expostos. No entanto, é importante notar que muitos jogos incorporam mecânicas ou termos específicos que podem representar desafios mesmo para a IA mais bem preparada. Mesmo assim, o modelo pode aprender essas nuances com dados de treinamento suficientes.

Curiosamente, apesar da variedade de jargões nos jogos, há apenas um número limitado de “verbos” que os jogadores têm que impactam significativamente o mundo do jogo. Seja montar um abrigo improvisado, armar uma tenda ou invocar um abrigo mágico, você está essencialmente “construindo uma casa”. Este mapa ilustra as dezenas de primitivos que o agente SIMA reconhece atualmente, revelando como ele interpreta diversas ações no jogo:

🏢 Construindo uma casa 🛡 Defendendo 🍌 Coletando recursos ✈ Viajando

A ambição dos pesquisadores, além de avançar com a IA baseada em agentes, é criar um companheiro de jogo mais natural do que os rígidos e codificados que temos atualmente. Em vez de competir contra uma IA super-humana, os jogadores poderiam ter jogadores SIMA ao seu lado que são cooperativos e responsivos a instruções verbais. Como os jogadores do SIMA só veem os pixels da tela do jogo, eles aprendem como realizar tarefas de forma semelhante aos humanos. Isso lhes permite se adaptar e desenvolver comportamentos emergentes também.

🤖💬 Quer saber como a IA está transformando diversas indústrias? Confira este vídeo para ver mais aplicações da IA na vida real em ação: Colaboração e Criação Abertas 👈

Agora, você pode se perguntar como essa abordagem se compara ao método de simulador comumente usado na construção de IA do tipo agente. Na abordagem do simulador, um modelo principalmente não supervisionado experimenta em um mundo simulado 3D, aprendendo intuitivamente as regras e projetando comportamentos com base nelas. No entanto, esse método requer um sinal de recompensa fornecido pelo jogo ou ambiente do qual o agente pode aprender. Em muitos jogos comerciais, tais sinais não estão disponíveis. Além disso, os pesquisadores estavam interessados em treinar agentes capazes de realizar uma ampla variedade de tarefas descritas em texto aberto, o que seria impraticável para avaliar usando sinais de recompensa específicos para cada objetivo. Em vez disso, eles treinaram os agentes usando aprendizado por imitação do comportamento humano, onde os objetivos são fornecidos em formato de texto.

Essa abordagem permite que os agentes busquem uma variedade maior de objetivos, pois não estão limitados a uma estrutura de recompensas estrita. Em vez de serem guiados apenas por pontos ou resultados de vitória/derrota, os agentes podem ser treinados para valorizar critérios mais abstratos, como a similaridade de suas ações com aquelas observadas anteriormente. Consequentemente, eles podem ser treinados para “desejar” realizar quase qualquer tarefa, desde que os dados de treinamento a representem de alguma forma.

“`html

Outras empresas também estão explorando iniciativas semelhantes. NPCs em jogos estão sendo examinados como oportunidades potenciais para empregar grandes modelos de linguagem (LLMs) como chatbots. Além disso, a pesquisa em IA está explorando a simulação e o rastreamento de ações ou interações improvisadas simples, levando ao desenvolvimento de comportamentos de agentes fascinantes. Por exemplo, os pesquisadores conseguiram povoar com sucesso uma pequena cidade virtual com IA, resultando em interações saudáveis e um sentimento de comunidade.

🏡👥 Curioso sobre a cidade virtual povoada com IA? Leia mais sobre isso neste artigo: Researchers Populated a Tiny Virtual Town with AI (and It Was Very Wholesome)

Por último, há experimentos em andamento explorando jogos infinitos como o MarioGPT, que investigam o potencial de agentes de IA para jogar jogos com possibilidades infinitas. No entanto, esse é um tópico para outra discussão.

Em conclusão, o modelo SIMA da DeepMind representa um avanço significativo no campo dos agentes de jogos de IA. Ao treinar os modelos para aprender com o jogo humano e responder a instruções verbais, os pesquisadores não estão apenas empurrando os limites da IA, mas também estão se esforçando para criar companheiros de jogo mais naturais, cooperativos e interativos. À medida que a IA continua a se desenvolver, podemos esperar ver novas e empolgantes aplicações em diversas indústrias e formas de entretenimento.


Q&A

P: Os modelos de IA treinados em vários jogos podem efetivamente jogar jogos que nunca viram antes?

R: Sim, os agentes de IA treinados em vários jogos mostraram a capacidade de se sair bem em jogos aos quais não foram expostos. No entanto, existem mecânicas ou termos específicos em jogos individuais que poderiam representar desafios para os modelos de IA. Com dados de treinamento suficientes, o modelo pode superar esses desafios.

P: Como o modelo SIMA aprende a entender instruções verbais em jogos?

R: O modelo SIMA é treinado em imagens de vídeo de humanos jogando jogos, junto com as anotações fornecidas por rotuladores de dados. Ao associar representações visuais de ações, objetos e interações com instruções verbais, o modelo aprende a entender e agir com base nessas instruções.

P: Como o treinamento do SIMA difere do treinamento de agentes baseados em simulador tradicional?

R: O treinamento de agentes baseados em simulador tradicional depende de aprendizado por reforço e requer um sinal de recompensa do jogo ou ambiente. No entanto, a abordagem de treinamento do SIMA se concentra na aprendizagem por imitação do comportamento humano, usando metas de texto aberto em vez de sinais de recompensa específicos. Isso permite que o modelo persiga uma ampla gama de tarefas e objetivos.

P: Existem outras aplicações de IA em jogos além de jogar e entender jogos?

R: Com certeza! A IA tem inúmeras aplicações em jogos, incluindo comportamento de NPCs, simulações realistas de física, reconhecimento de voz para comandos dentro do jogo, e muito mais. A tecnologia de IA continua a evoluir, aprimorando vários aspectos das experiências de jogo.


📚 Referências:DeepMind’s Agent57 AI agent can best human players across a suite of 57 Atari gamesResearchers Populated a Tiny Virtual Town with AI (and It Was Very Wholesome)Open-Ended Collaboration and Creation (Vídeo)


Quais são suas opiniões sobre os modelos de IA que podem jogar jogos como humanos e responder a instruções verbais? Você acredita que essa tecnologia tem o potencial de revolucionar a indústria de jogos? Compartilhe suas opiniões nos comentários abaixo! E não se esqueça de compartilhar este artigo com seus amigos nas redes sociais! 🎮🤖✨

“`