Tradução Automática - Máquina de Traduzir

Observações sobre traduções feitas de forma automática
"Tradução completamente exata não existe"
- Werner Winter

"A fidelidade é o ponto mais importante de qualquer tradução."
- Brenno Silveira

"A fidelidade é outra das falácias da tradução."
- Paulo Rónai

Para realizar uma tradução de texto de um idioma para outro não basta simplesmente converter as palavras pois dois idiomas não possuem a mesma estrutura ou o mesmo significado das palavras. Existem diferenças culturais, valores estilísticos, nuances, expressões idiomáticas, ambiguidades e muitos outros elementos que podem dificultar a tradução, mesmo que esta seja feita pelos melhores tradutores humanos. Normalmente é necessário primeiro compreender o significado do texto para poder efetuar uma tradução correta.

Quando se trata de uma tradução feita por um computador o problema é ainda maior pois o computador não possui conhecimento do mundo externo que muitas vezes é necessário para compreensão e tradução do texto.

Entre os principais desafios encontrados na tradução estão as formas de lidar com os seguintes elementos:

1. Verbetes que não devem ser traduzidos.
Diariamente dezenas ou centenas de novos termos comuns e expressões aparecem na linguagem do dia-a-dia e não vão constar em dicionários. São nomes de empresas, pessoas, grupos, cidades, regiões, etc. A cidade do Rio de Janeiro não é "January River" assim como o grupo "Chemical Brothers" não deve ser traduzido para "Irmãos Químicos". Estes casos podem ser tratados à parte mas às vezes é difícil ou impossível saber se a palavra se refere a um nome próprio sem ter conhecimento do contexto ou do mundo externo. "Bush promised that..." não deve ser traduzido para "Arbusto prometeu que...". Neste caso é necessário ter conhecimento do mundo externo para saber que é mais provável que a promessa tenha sido feita por Bush (nome próprio) do que por um arbusto. Uma forma de tentar resolver casos deste tipo é criar um verbete exato no banco de dados que diz que a tradução de "Bush promised" é "Bush prometeu", porém os problemas seriam que o tamanho da base de conhecimento precisaria ser muito grande e mesmo assim não consegueria traduzir todos os outros casos similares.

2. Falta de palavra específica no idioma.
Mesmo quando a tradução é feita por um ser humano, dificilmente seria possível traduzir algo para um idioma e ao traduzir de volta obter o texto original pois termos e significados podem ser perdidos no caminho. Por exemplo, "Eu estou" em inglês fica "I am". Mas ao traduzir "I am" de volta para o português é possível que a tradução fique "Eu sou" pois estes dois termos diferentes em português ficam iguais em inglês.

3. Erros gramaticais
Um tradutor automático tem muita dificuldade em traduzir termos escritos de forma errada (o que infelizmente é muito comum, a maioria de todos os textos escritos possuem erros gramaticais). Por exemplo "Café da manha" (sem acento na manhã) seria percebido por uma pessoa (tradutor humano) e traduzido corretamente para "breakfast", mas um software poderia não achar que tem erro pois a palavra "manha" (sem acento) existe na língua portuguesa e poderia ser traduzida como "coffe of the malice" ou similar. Assim um programa de tradução automática precisa ter um método de correção de erros que antecede o processo de tradução. Os programas que não possuem corretores ortográficos simplesmente não conseguem traduzir "conciência" (faltou o s) ou mesmo a palavra "voce" (sem acento) pois não encontrariam estas palavras em seus glossários e léxicos internos. Métodos fonéticos também devem ser considerados neste corretor.

4. Domínios específicos do conhecimento
Muitas palavras e expressões mudam de significado quando estão em textos específicos de alguma área do conhecimento. Em informática por exemplo "driver" é "driver" em inglês e em português. Em outros contextos "driver" pode ser "motorista". Além disso, termos técnicos exigem dicionários específicos.

5. Ambiguidades
A frase "A bolsa caiu." pode se referir tanto à bolsa de valores ("stock market" em inglês) quanto à bolsa tipo sacola ("purse"). Este tipo de frase isolada nem um tradutor humano teria certeza do significado desejado. Porém a frase "Investidores temem que a bolsa caia novamente" com certeza seria interpretada corretamente por um tradutor humano mas um tradutor automático teria dificuldades para resolver a ambiguidade por não ter conhecimento do mundo externo.

6. Dependência de contexto
Muitas vezes uma tradução depende do que foi dito anteriormente para saber como traduzir corretamente o termo no contexto determinado. "O poeta adormeceu. Sua inspiração sonhava". A palavra "Sua" pode ser traduzida por "Your", "His" ou "Her". É necessário entender o contexto para saber que neste caso deve ser "His" por se referir à terceira pessoa no gênero masculino. Neste caso o contexto é dado pela frase anterior mas poderia ser por uma frase muito anterior ou até por algo externo ao texto.

7. Gírias, expressões, neologismos
As vezes uma palavra que originalmente tinha um significado passa a ter diversos outros. Em alguns casos é possível resolver o problema como no caso da palavra "Cara" que se usada como palavra masculina ou feminina querem dizer coisas diferentes. "a cara" fica "the face" e "o cara" fica "the guy". Mas "Com que cara vou ficar?" já complica.

8. Inversões
A ordem das palavras na estrutura da frase muda razoavelmente entre o inglês e o português. Por exemplo em inglês normalmente primeiro vem o adjetivo e depois o substantivo. Assim "casa amarela" deve ser "yellow house" e não "house yellow". Ou então mesmo dentro do idioma inglês a ordem das palavras muda quando a frase é simplesmente passada da afirmação para interrogação. "Você não quer" fica "You don't want." na forma afirmativa e "Don't you want?" na forma interrogativa. Estes são os casos mais simples de inversão.

9. Traduções ao pé da letra
São os casos de "translations on the foot of the letter". Bem conhecidos por leitores do livro "The cow went to the swamp.", de Millôr Fernandes.


Rodrigo Siqueira
© 2011

© - Grupo de Lingüística da Insite