O novo IA da DeepMind controla tarefas robóticas sem treinamento específico

O novo IA da DeepMind controla tarefas robóticas sem treinamento específico' can be condensed to 'O novo IA da DeepMind controla tarefas robóticas sem treinamento'.

O Google DeepMind possui um novo modelo de IA que pode direcionar tarefas robóticas para as quais nunca foi treinado.

Chamado de RT-2, o modelo aprende a partir de dados da web e da robótica. Em seguida, transforma essas informações em instruções simples para as máquinas.

Em testes, o modelo foi solicitado a realizar ações nunca vistas nos dados robóticos, como colocar laranjas em uma tigela correspondente. Para seguir esses comandos, o sistema teve que traduzir conhecimentos dos dados baseados na web. De acordo com o DeepMind, o modelo obteve sucesso em 62% dessas operações, o dobro do seu antecessor, o RT-1.

“Assim como os modelos de linguagem são treinados com texto da web para aprender ideias e conceitos gerais, o RT-2 transfere conhecimento dos dados da web para informar o comportamento do robô”, disse Vincent Vanhoucke, chefe de robótica do DeepMind. “Em outras palavras, o RT-2 pode falar robô.”

O RT-2 foi testado em várias habilidades robóticas que não estavam presentes nos dados robóticos. Crédito: Google DeepMind

Os testes mostraram que o RT-2 possui capacidades impressionantes de generalização. Ele também possui uma compreensão semântica e visual aprimorada dos dados robóticos que não foram previamente encontrados.

Notavelmente, o modelo pode usar raciocínio rudimentar para seguir novos comandos do usuário. Impressionantemente, ele também pode realizar raciocínio semântico de várias etapas. Por exemplo, quando instruído a pegar um objeto que possa ser usado como martelo, o RT-2 identificou corretamente uma pedra como a melhor opção.

Em um teste, o RT-2 descobriu que uma pedra seria o melhor objeto para pegar como um martelo improvisado. Crédito: Google DeepMind

Em outra avaliação, o modelo recebeu o comando de empurrar uma garrafa de ketchup em direção a um cubo azul.

Havia vários itens na cena, mas apenas o cubo estava presente no conjunto de treinamento. No entanto, o RT-2 conseguiu empurrar o ketchup em direção ao destino especificado.

O RT-2 teve um bom desempenho em tarefas do mundo real. Crédito: Google DeepMind

O DeepMind anunciou o RT-2 como uma grande inovação em inteligência artificial. O laboratório de Londres diz que o modelo nos aproxima de um futuro com robôs úteis.

“O RT-2 não apenas mostra como os avanços em IA estão se propagando rapidamente para a robótica, mas também mostra um enorme potencial para robôs de propósitos mais gerais”, disse Vanhoucke. “Embora ainda haja muito trabalho a ser feito para permitir robôs úteis em ambientes centrados no ser humano, o RT-2 nos mostra um futuro empolgante para a robótica ao nosso alcance.”

Você pode ler o artigo de estudo do RT-2 aqui.