Há mais de uma década que o Google está interessado na língua. Recentemente, têm vindo a pesquisar novas técnicas de aprendizagem de máquinas para compreender pesquisas ou traduzir diferentes línguas, o que lhes tem permitido desenvolver novos métodos de organização da informação através da língua. Como tal, estes avanços significarão um investimento imenso e ganhos futuros.

O novo modelo linguístico para aplicações de diálogo, LaMDA, é o seu mais recente estudo de investigação sobre conversação. A conversação entre pessoas é muito volátil porque pode passar rapidamente de um tópico de conversa para outro e isto é muito complexo para agentes de conversação modernos ou chatbots, que normalmente têm conversas lineares e definidas.

No entanto, LaMDA é capaz de dialogar fluidamente sobre uma multiplicidade de tópicos de conversação, permitindo ao sistema gerar novas formas mais naturais de interagir com a tecnologia e novas aplicações.

Juntamente com modelos recentes de linguagem inteligente como o GPT-3 ou BERT, LaMDA está em desenvolvimento há muito tempo e baseia-se no Transformer, uma arquitectura de rede neural da Google Research e open source. Assim, é esta arquitectura que permite treinar o modelo de leitura da língua, a relação das palavras entre si e, consequentemente, a previsão da língua.

A diferença entre LaMDA e outras novas línguas é que foi treinada através do diálogo, com características como a razoabilidade e diferentes nuances que distinguem uma conversa de outras formas de linguagem.

Por conseguinte, desde 2020, a Google tem vindo a introduzir modelos linguísticos baseados em Transformer, baseados no diálogo. Estes modelos são capazes de falar de praticamente tudo, e especialmente LaMDA pode ser corrigida e ajustada à especificidade das suas respostas.

Ao mesmo tempo, e mais lentamente, o Google está a desenvolver a MUM. Este é um modelo que promete revolucionar o BERT (o actual modelo de pesquisa utilizado pelo Google), também baseado na arquitectura Transformer, para responder a perguntas complexas em mais de 75 línguas e compreender melhor o contexto de cada tópico.

Como funciona LaMDA?

A forma como os assistentes de voz de hoje funcionam é que programaram respostas de modo a funcionar. Além disso, a dificuldade para a IA é que é difícil para eles manter uma conversa não linear. As conversas humanas não vão do ponto A ao ponto B, mas tocam em diferentes tópicos, levando a caminhos de conversação inesperados, dada a sua proveniência. Portanto, embora os assistentes estejam a tornar-se cada vez mais sofisticados, ainda se baseiam em sistemas simples de conversação.

AMDA presta especial atenção à correcção deste aspecto, procurando a razoabilidade de qualquer conversa e caracteriza-se por ser suficientemente flexível para controlar qualquer eixo de direcção em que o utilizador possa conduzir tal conversa.

No entanto, os assistentes de voz não são a sua única aplicação, LaMDA poderia ser aplicada a chatbots, especialmente para websites voltados para o cliente. Um modelo de IA adequado e melhorado proporcionará sempre uma melhor experiência ao cliente.

No entanto, LaMDA ainda não está pronta para ser introduzida no mercado, uma vez que elementos como o interesse e a realidade ainda precisam de ser trabalhados para combater o preconceito presente na IA, um problema constante na IA e na aprendizagem de máquinas. Por outras palavras, a IA por vezes dá prioridade à raça, sexo ou religião, sem proporcionar condições de igualdade a todos os utilizadores.

Portanto, o Google está a dar grandes passos nesta direcção em termos de parcialidade, especialmente na área linguística, mas ainda têm um longo caminho a percorrer antes de poderem aperfeiçoar o sistema.

O que é que LaMDA espera alcançar?

Razoabilidade e especificidade são as principais características desta língua. No entanto, os seus criadores estão a explorar outras dimensões, tais como “interesse”, ou seja, estão a medir se as respostas que gera são engenhosas e inesperadas. Há também um interesse especial na objectividade, investigando formas em que a linguagem não só é convincente, mas também correcta.

A linguagem é a maior ferramenta de comunicação disponível para os humanos, mas como tudo o resto pode ser mal utilizada, e é importante verificar se LaMDA cumpre com os princípios da IA. Até agora, quase todas as línguas inteligentes foram consideradas como sendo mal utilizadas através de preconceitos, usando o discurso do ódio ou replicando informações falsas.

A Google, juntamente com outras empresas, continua a fazer o seu melhor para criar tecnologias como a LaMDA, onde estes riscos são minimizados. Estas grandes empresas estão habituadas aos problemas de enviesamento injusto que muitas vezes são gerados pela aprendizagem de máquinas, uma vez que trabalham com elas há muitos anos. Por esta razão, a Google decidiu tornar os seus modelos de fonte aberta para que diferentes investigadores possam utilizar e analisar os modelos. Assim, LaMDA tem sido analisada em cada passo do seu desenvolvimento, a fim de incorporar pouco a pouco as capacidades de conversação.

Obviamente, todos os sucessos obtidos com esta linguagem e todas as suas capacidades de conversação, o Google incluirá no seu assistente, pelo que promete uma nova abordagem de conversação que procura interpretar a interacção humana de uma forma mais eficaz.

O primeiro caso de utilização

AMDA atraiu a atenção dos media após uma primeira conversa, onde adoptou o papel do planeta Plutão e respondeu como se fosse um planeta. Seguiu-se outra conversa, em que a IA era um avião de papel. Em ambas as situações, as conversas foram fluidas e foi determinado que as palavras-chave não se destacaram do resto da conversa, obtendo-se resultados muito bons em termos de coerência.

As conclusões deste primeiro contacto são impressionantes, especialmente na área da facilidade com que se adapta a qualquer tópico de conversa, sendo sensato, fluente e interessante. No entanto, este é um primeiro teste e a língua ainda está sob investigação.

O principal objectivo da Google é mudar a opinião gerada pelos chatbots, transformando uma interacção rígida e fria numa conversa mais fluida e produtiva, que pode gerar uma melhor experiência para o cliente.

Após testes, a Google afirma que LaMDA compreende mais nuances do que os algoritmos actuais, além de ser capaz de evitar dar respostas repetitivas e compreender o contexto da conversa.

MUM: o próximo marco na compreensão da informação

Em paralelo, MUM é um modelo capaz de transformar a forma como o Google ajuda com tarefas complexas em mais de 75 línguas, gerando respostas coerentes. Este é um sistema que funciona com base em texto e imagens, e é considerado como o algoritmo mais poderoso criado pelo Google.

MUM significa Modelo Unificado Multitarefa e afirma ser a revolução do BERT, a actual rede neural utilizada nas pesquisas do Google. O novo modelo também se baseia na arquitectura do Transformer.

A empresa afirma também que o modelo responderá a questões complexas e compreenderá melhor o contexto associado a cada tópico. O principal objectivo da MUM é eliminar a barreira linguística, encontrando informação de forma mais eficiente e com conteúdo mais apropriado, independentemente da língua em que a pesquisa é conduzida.

Este modelo procura tornar a informação tão precisa quanto possível, independentemente da informação disponível na língua em que a pesquisa é efectuada. Por exemplo, mesmo que esteja à procura de informação em espanhol sobre tópicos que só existem em chinês, a MUM fornecerá toda a informação sobre esse tópico na língua que estiver disponível.

Além disso, como é multimodal, poderá associar texto com imagens e vídeos, ou seja, também será possível efectuar pesquisas e consultas baseadas em imagens. A Google afirma que a MUM tem a capacidade de associar o contexto das duas formas e fornecer uma resposta em conformidade.

Conclusões

Assim, a IA conversacional e a IA de pesquisa estão actualmente em desenvolvimento no Google. As apresentações da empresa são uma prévia do que está para vir no campo da IA, com algumas soluções promissoras.

TheMDA ajudará muitas empresas a transformar a sua experiência de cliente trazendo conversas humanas reais aos seus chatbots, com um forte enfoque na correcção de grandes problemas de IA, tais como o preconceito e a exploração de novas dimensões, tais como o interesse por modelos.

Finalmente, ao mesmo tempo o Google apresentou a MUM, um modelo do futuro sistema neural para pesquisas Google, onde perguntas complexas em diferentes línguas serão mais facilmente respondidas através da compreensão do contexto associado à pergunta.