Durante milhões de anos o cérebro humano foi desenvolvido
e evoluiu para a capacidade de comunicação social através da linguagem. Atualmente
os computadores e equipamentos eletrônicos nos obrigam a aprender formas
não intuitivas de comunicação com essas máquinas através de
comandos precisos, linguagens de programação, menus, links e botões.
As interfaces entre as máquinas e seres humanos estão ficando mais
sofisticadas e caminhando aos poucos em direção às formas mais humanas
de comunicação. Muitas vezes ainda precisamos dar comandos do tipo
"copy c:\file.doc a:\" para copiar um arquivo para o disquete, ou podemos
fazer isso de forma gráfica, mas estamos (ou melhor, estávamos) longe de poder dizer
"Computador, copie para o disquete o texto acabei de salvar".
O Processamento de Linguagem Natural (NLP, sigla em inglês)
é o conjunto de métodos formais para analisar textos e gerar frases
escritas em um idioma humano.
Normalmente computadores estão aptos a compreender instruções escritas
em linguagens de computação como o Java, C, PERL, Basic, etc., mas
possuem muita dificuldade em entender comandos escritos em uma linguagem
humana. Isso se deve ao fato das linguagens de computação serem extremamente
precisas, contendo regras fixas e estruturas lógicas bem definidas que
permitem o computador saber exatamente como deve proceder a cada comando.
Já em um idioma humano uma simples frase normalmente contém ambiguidades,
nuances e interpretações que dependem do contexto, do conhecimento do mundo,
de regras gramaticais, culturais e de conceitos abstratos.
O objetivo final do Processamento de Linguagem Natural é fornecer
aos computadores a capacidade de entender e compor textos. E "entender" um
texto significa reconhecer o contexto, fazer análise sintática, semântica,
léxica e morfológica, criar resumos, extrair informação, interpretar os
sentidos e até aprender conceitos com os textos processados.
Não se sabe se um dia os computadores poderão igualar (ou superar)
a capacidade humana de entender ou compor textos. Atualmente estas capacidades
são bastante limitadas no computador mas muitos resultados práticos já são
possíveis e utilizados por diversos tipos de programas.
O Grupo de Lingüística
da Insite desenvolveu 3 aplicativos que utilizam recursos do NLP:
- InSearch - Sistema de Busca com recursos similares ao Google ou Altavista.
Utiliza recursos de NLP nas queries (buscas), na categorização do conteúdo
indexado e na organização da informação.
- InBot - Sistema de Inteligência Artificial que permite simular uma
pessoa conversando com o usuário.
- InTranslator - Tradutor entre idiomas que usa recursos linguísticos para
traduzir frases corretamente. Pode ser usado em salas de "chat" para tradução
simultânea das conversas mesmo que contenham gírias, abreviações e até
alguns erros de grafia.
© 2001 - Grupo de Lingüística da Insite