O novo AI da Meta pode traduzir fala e texto para quase 100 idiomas

O novo AI da Meta traduz para quase 100 idiomas

A Meta introduziu uma nova modelo de tradução de IA “tudo-em-um” que ela apresentou como um grande avanço na “busca por criar um tradutor universal.”

O modelo, chamado de SeamlessM4T, é capaz de lidar com vários tipos de tradução – incluindo texto para fala, fala para texto, fala para fala e texto para texto – em quase 100 idiomas. Ao contrário de outros tradutores de idiomas que usam vários modelos, o SeamlessM4T é um único sistema, o que, segundo a Meta, “reduz erros e atrasos” e aumenta a “eficiência e qualidade do processo de tradução.”

O SeamlessM4T baseia-se no trabalho anterior de IA da Meta. Em julho de 2022, a empresa lançou seu projeto No Language Left Behind, que usa IA para fazer traduções de texto para texto em 200 idiomas, com ênfase na melhoria das traduções para idiomas mais raros ou menos comumente usados.

A empresa também lançou modelos que permitem conversar com bots de IA com personalidades, juntamente com mais informações sobre como ela usa IA para organizar seus feeds do Facebook e Instagram.

Assim como muitas grandes empresas de tecnologia, a Meta tem se concentrado cada vez mais este ano no desenvolvimento e lançamento de ferramentas e serviços alimentados por IA. A Microsoft lançou sua nova busca Bing com IA em fevereiro, que usa a mesma tecnologia que alimenta o ChatGPT da OpenAI. A Amazon recentemente afirmou que usará IA generativa para analisar e resumir as avaliações dos clientes, e o Google está testando uma Experiência de Busca Generativa que “reimagina a busca online.”

A IA está pronta para perturbar quase todos os setores da indústria e encontrou seu caminho em tudo, desde fitness até contratação. Quando se trata de tradução, a IA também é usada em ferramentas como o aplicativo Google Tradutor para ajudar a adicionar contexto aos resultados. A rápida ascensão da IA generativa também levantou preocupações sobre os riscos dessa tecnologia e os efeitos potenciais na sociedade.

Assim como muitos dos modelos anteriores de IA da Meta, o SeamlessM4T está sendo lançado sob uma licença de pesquisa para permitir que pesquisadores e desenvolvedores construam em cima da tecnologia. A Meta também está lançando os metadados do projeto em um conjunto de dados chamado SeamlessAlign. A Meta afirma que é o maior conjunto de dados multimodal de código aberto, contendo 270.000 horas de fala extraída e alinhamento de texto em que sua IA foi treinada.

Para obter mais informações técnicas sobre o SeamlessM4T, confira a postagem da Meta em seu blog de IA ou a página de pesquisa da empresa no Github.

Nota dos editores: A ENBLE está usando um mecanismo de IA para ajudar a criar algumas histórias. Para mais informações, consulte esta postagem.