Ir direto ao conteúdo

Qual a precisão atual de tradutores on-line

Ferramentas de tradução gratuitas vêm se aproximando cada vez mais de trabalhos de humanos, mas não devem substituí-los tão cedo

     

    A Microsoft anunciou no dia 14 de março que seu mais novo tradutor de chinês para inglês pode decodificar um texto tão bem quanto um tradutor-intérprete humano faria. Para chegar a esse resultado, a empresa testou a ferramenta em cerca de 2 mil frases, retiradas de um banco de jornais on-line, e comparou os resultados com traduções feitas por humanos.

    Além disso, o projeto contou também com consultores bilíngues, que testaram a precisão do trabalho. Tudo para garantir que os resultados estivessem corretos e, sobretudo, próximos daquilo que um tradutor de carne e osso faria.

    A ferramenta está disponível para testes neste link, e qualquer um pode acessá-la para colocar o robô à prova. Após inserir um texto em chinês (novos exemplos-teste surgem quando se atualiza a página) e clicar no botão “Translate & Compare”, aparecem duas versões de tradução. O usuário pode avaliá-las e votar na que lhe parece mais precisa. Não raro, a oração escolhida é aquela feita pela inteligência artificial.

    “Colocar uma tradução automática em pé de igualdade com a feita por um humano é o sonho que todos nós tínhamos”, diz Xuedong Huang, responsável pela divisão da Microsoft que pesquisa comunicação oral, linguagem e ferramentas de tradução, em comunicado. “Nós apenas não fazíamos ideia de que isso pudesse ser atingido tão já.” De acordo com a empresa, é a primeira vez que uma ferramenta gratuita de tradução automática consegue atingir um resultado como esse.

    “Acreditamos que nosso sistema de tradução mais recente alcançou um novo patamar, e que sua eficácia está no nível da humana no que diz respeito a traduções profissionais. Percebemos também que sua qualidade é significativamente superior a de outras traduções não-profissionais”

    Trecho do artigo científico feito pela Microsoft para explicar a ferramenta

    Usuários que costumam fazer uso de serviços de tradução desse tipo podem ter uma ideia do que essa afirmação representa - sobretudo, considerando o funcionamento atual de tradutores on-line.

    Submeter uma página de internet a um tradutor automático costuma servir muito mais para simplificar a tarefa de compreensão. Para entender um assunto com profundidade, captando detalhes do tema, só o resultado oferecido por ferramentas desse tipo não é suficiente.

    Isso porque tradutores instantâneos on-line acabam não considerando como deveriam uma série de fatores importantes no trabalho de tradução. Apesar de contarem com um bom vocabulário e conseguirem apontar erros de norma culta, por exemplo, há quesitos que acabam ficando de fora. Contextos, expressões, regionalismos, sinônimos e outros recursos linguísticos costumam ser entraves para que trechos longos sejam adequadamente traduzidos pela máquina.

    “O processo de tradução não envolve apenas o aspecto linguístico, base principal dessas ferramentas; esse processo envolve a tomada de decisões por parte de um profissional bem versado nas línguas envolvidas, atento às características extra-linguísticas do texto e ciente das exigências do mercado, bem como das expectativas e necessidades do público-alvo da tradução”, diz Adauri Brezolin, professor do departamento de Letras-Tradução da Universidade Metodista, em entrevista ao Nexo.

    Nos últimos anos, no entanto, a aplicação de novas técnicas de aprendizagem de máquina tem revolucionado as inteligências artificiais usadas em tradução - e melhorado seus resultados. Um bom exemplo desse novo momento é o do Google Tradutor, principal ferramenta gratuita de tradução.

    Lançada em 2006, a ferramenta funcionou por cerca de dez anos a partir do algoritmo PBMT (Phrase-Based Machine Translation). Esse sistema “quebrava” o texto em blocos ou sequências de palavras, a partir da tradução de cada termo. Considerar mais do que a frase gramatical, mas também seu sentido, contribui para que o resultado da tradução seja mais refinado do que se o processo fosse feito palavra por palavra, por exemplo.

    À época, porém, o comunicado do Google contava com um trecho que reconhecia as limitações da ferramenta. “Nosso sistema funciona melhor com alguns tipos de texto (como notícias) do que com outros (como livros de ficção) - e você provavelmente não deveria tentar traduzir poesia… mas fique ligado para as próximas atualizações.”

    Mais recentemente, ao fim de 2016, a empresa anunciou a adoção de um novo método de tradução, a partir de redes neurais. Ganham esse nome sistemas de algoritmos em rede que tentam simular o processo que acontece nos neurônios humanos. Eles costumam funcionar na base da tentativa e erro, aprendendo padrões e refinando sua percepção com o tempo.

    “É como se você analisasse milhares de pares de sentenças traduzidas do chinês para o grego (sem conhecimento prévio algum), e aprendesse as ocorrências mais frequentes, mais prováveis. Quando se deparasse, então, com uma nova sentença em chinês, saberia qual a tradução mais provável para o grego”, explicou Graça Nunes, professora sênior do ICMC-USP (Instituto de Ciências Matemáticas e Computação da USP) e pesquisadora do NILC (Núcleo Interinstitucional de Linguística Computacional) ao Nexo.

    “Repare que, mesmo sem entender o chinês, você teria aprendido qual é a correspondência mais provável no grego (também sem entender o grego). Dizemos a mais provável, pois, de fato, pode haver diferentes traduções corretas, mas você reproduziria a mais frequente, pois ela provavelmente seria a mais usada, a mais natural”, completa.

    O novo método, que permanece vigente até hoje, foi considerado pelo Google 60% mais preciso que o anterior. Em um teste, participantes tinham de analisar 500 frases selecionadas randomicamente da Wikipedia ou de notícias, avaliando sua precisão de 0 a 6. Para idiomas como inglês e espanhol, o algoritmo registrou nota 5.43 - muito próxima dos 5,55 atribuídos a traduções humanas, como você pode ver na imagem abaixo.

     

    “No modelo antigo, o PBMT, quando traduzíamos uma sentença de um idioma para outro, tínhamos de traduzir uma palavra ou frase por vez, e então reorganizar essas palavras na gramática correta da língua em questão”, explicou Quoc Le, pesquisador do Google que trabalhou no projeto. “O que complica é que a língua tem muitas ambiguidades.”

    De acordo com Ricardo Souza, professor de Tecnologias da Tradução na PUC-Rio (Pontifícia Universidade Católica do Rio de Janeiro), o melhor desempenho dessas linguagens se deve à quantidade de material de referência. Se a ferramenta tem mais artigos em inglês do que em vietnamita para usar de referência, por exemplo, a tendência é que a ferramenta seja “mais fluente” na primeira língua.

    “Ferramentas públicas de tradução recorrem ao acervo da internet para consultar traduções possíveis. Quanto mais textos traduzidos naquele idiomas houver, melhor serão os resultados”, disse, em entrevista ao Nexo. “Há muito texto em inglês na internet. Por conta disso, se consegue sugerir edições muito boas. Em casos [de idiomas] mais raros, as sugestões vão ficando menos aproveitáveis.”

    Atualmente, 96 das 103 línguas disponíveis no Google Tradutor já operam dessa maneira, a partir das redes neurais.

    Para Souza, a atual dinâmica de funcionamento de ferramentas de tradução permanece esbarrando no teor dos textos. A dificuldade assumida do Google Tradutor de verter um poema para outro idioma tende a aparecer também em textos mais técnicos, com linguagem menos generalista.

    Manuais de equipamentos, bulas de medicamentos, textos jurídicos, da área médica ou de tecnologia, costumam ser traduzidos por softwares espec��ficos - normalmente pagos e de uso exclusivo. “Essas [ferramentas] de fato substituem o tradutor humano. Mas elas são muitos especializadas, só funcionam em determinadas aplicações”, completa.

    Nesse tipo de funcionalidade, é comum que cada trecho traduzido passe por uma espécie de pós-edição. Após ser corrigido, o material que sofreu tradução retorna à ferramenta, para que ela, literalmente, aprenda com os erros e refine seu vocabulário.

    “A tendência é que a máquina traduza cada vez mais, e que os profissionais tradutores se tornem mais especialistas em revisar e dar o tom necessário”, completa Souza.Para Graça, mesmo sem a humanidade necessária para a precisão absoluta, ferramentas automáticas gratuitas ainda podem ser importantes acessórios em tarefas de tradução do dia a dia."Ainda assim, os resultados da tradução estatística podem ser muito úteis em diversos cenários. Para o usuário que não conhece uma das línguas envolvidas, as traduções podem informar tudo o que ele precisa saber. Basta ter consciência de que elas podem conter alguns erros".ESTAVA ERRADO: Em uma versão anterior deste texto, a sigla para a tecnologia "Phrase-Based Machine Translation" estava grafada como BMPT. Na verdade, a forma correta é PBMT. A informação foi corrigida no dia 28 de março, às 13h57.

    Todos os conteúdos publicados no Nexo têm assinatura de seus autores. Para saber mais sobre eles e o processo de edição dos conteúdos do jornal, consulte as páginas Nossa equipe e Padrões editoriais. Percebeu um erro no conteúdo? Entre em contato. O Nexo faz parte do Trust Project.

    Mais recentes

    Você ainda tem 2 conteúdos grátis neste mês.

    Informação com clareza, equilíbrio e qualidade.
    Apoie o jornalismo independente. Junte-se ao Nexo!