A pesquisa em inteligência artificial (IA) não é novidade para o Google, que está há anos no ramo, e inclusive já usa a tecnologia em vários produtos e serviços, como o Google Cloud e na própria busca do Google. Agora, a empresa deu mais um passo para construir seu modelo de IA com 1.000 idiomas, revelando mais detalhes sobre o USM, ou Universal Speech Model.
O Google anunciou que iria criar um modelo de IA de 1.000 idiomas no final de 2022, Na atualização publicada na última segunda (06/03), a empresa disse ter dado o primeiro “passo crítico” para atingir esse objetivo.
O Google contou que a atual versão do seu modelo de IA tem mais de 2 bilhões de parâmetros, e que o USM foi treinado com 12 milhões de horas de fala, e 28 bilhões de frases de texto, em mais de 300 línguas diferentes.
No paper “Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages”, o Google mostrou que usar um grande conjunto de dados multilíngues não rotulados para pré-treinar o codificador do modelo e ajustar em um conjunto menor de dados rotulados permite que eles reconheçam línguas sub-representadas. Além disso, a empresa conta que o processo de treinamento do modelo é eficaz na adaptação a novas línguas e dados.
Modelo de IA do Google pode eliminar barreiras linguísticas
A inteligência artificial de 1.000 idiomas do Google é um sistema de processamento de linguagem natural treinado em muitos idiomas diferentes. Isso significa que a ferramenta conseguirá entender e interpretar uma grande variedade de idiomas e assim, traduzi-los com maior precisão.
Hoje em dia, existem mais de 7.000 idiomas falados no mundo inteiro. Assim, o objetivo final do Google é criar uma IA que permita a comunicação com pessoas de todos os lugares do mundo em seu próprio idioma, eliminando as barreiras linguísticas.
O objetivo do modelo de IA é criar uma ferramenta que ajude a traduzir as línguas minoritárias que não são bem representadas na tecnologia atual. Isso é importante porque muitas vezes as pessoas que falam esses idiomas não têm acesso a informações essenciais na Internet simplesmente porque a tecnologia não está disponível em seu idioma.
Esse novo recurso com maior variedade de idiomas tem enormes implicações para a acessibilidade da tecnologia e a inclusão de línguas minoritárias. Com a ferramenta, será possível entender e interpretar uma ampla variedade de línguas, além de tornar mais fácil para as pessoas acessarem informações e se comunicarem em seus próprios idiomas, independentemente de onde estejam no mundo.
Avanços na tradução automática
Além disso, esse modelo pode ter implicações importantes para a tradução automática. Atualmente, a maioria dos sistemas de tradução automática é treinada em apenas alguns idiomas, o que significa que a qualidade da tradução pode variar amplamente entre diferentes idiomas.
Com uma nova IA de 1.000 idiomas, a tradução automática pode se tornar muito mais precisa e consistente, independentemente do idioma que está sendo traduzido. A nova IA também pode ter implicações importantes para a tradução automática, tornando-a mais eficiente em todos os idiomas.
Saiba mais sobre o Universal Speech Model do Google.
Assine nossa Newsletter para receber os melhores conteúdos do Itshow em sua caixa de entrada.