Processamento de Linguagem Natural

    Durante milhões de anos o cérebro humano foi desenvolvido e evoluiu para a capacidade de comunicação social através da linguagem. Atualmente os computadores e equipamentos eletrônicos nos obrigam a aprender formas não intuitivas de comunicação com essas máquinas através de comandos precisos, linguagens de programação, menus, links e botões. As interfaces entre as máquinas e seres humanos estão ficando mais sofisticadas e caminhando aos poucos em direção às formas mais humanas de comunicação. Muitas vezes ainda precisamos dar comandos do tipo "copy c:\file.doc a:\" para copiar um arquivo para o disquete, ou podemos fazer isso de forma gráfica, mas estamos (ou melhor, estávamos) longe de poder dizer "Computador, copie para o disquete o texto acabei de salvar".

    O Processamento de Linguagem Natural (NLP, sigla em inglês) é o conjunto de métodos formais para analisar textos e gerar frases escritas em um idioma humano. Normalmente computadores estão aptos a compreender instruções escritas em linguagens de computação como o Java, C, PERL, Basic, etc., mas possuem muita dificuldade em entender comandos escritos em uma linguagem humana. Isso se deve ao fato das linguagens de computação serem extremamente precisas, contendo regras fixas e estruturas lógicas bem definidas que permitem o computador saber exatamente como deve proceder a cada comando. Já em um idioma humano uma simples frase normalmente contém ambiguidades, nuances e interpretações que dependem do contexto, do conhecimento do mundo, de regras gramaticais, culturais e de conceitos abstratos.

    O objetivo final do Processamento de Linguagem Natural é fornecer aos computadores a capacidade de entender e compor textos. E "entender" um texto significa reconhecer o contexto, fazer análise sintática, semântica, léxica e morfológica, criar resumos, extrair informação, interpretar os sentidos e até aprender conceitos com os textos processados.

    Não se sabe se um dia os computadores poderão igualar (ou superar) a capacidade humana de entender ou compor textos. Atualmente estas capacidades são bastante limitadas no computador mas muitos resultados práticos já são possíveis e utilizados por diversos tipos de programas.

    O Grupo de Lingüística da Insite desenvolveu 3 aplicativos que utilizam recursos do NLP:

  • InSearch - Sistema de Busca com recursos similares ao Google ou Altavista. Utiliza recursos de NLP nas queries (buscas), na categorização do conteúdo indexado e na organização da informação.
  • InBot - Sistema de Inteligência Artificial que permite simular uma pessoa conversando com o usuário.
  • InTranslator - Tradutor entre idiomas que usa recursos linguísticos para traduzir frases corretamente. Pode ser usado em salas de "chat" para tradução simultânea das conversas mesmo que contenham gírias, abreviações e até alguns erros de grafia.


© 2001 - Grupo de Lingüística da Insite

© - Grupo de Lingüística da Insite