Manual para marcação de alinhamentos lexícais.
Arquivos
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Este relatório apresenta as diretrizes definidas, no âmbito do projeto ReTraTos, para o processo de alinhamento lexical de textos paralelos escritos em Português do Brasil, Espanhol e Inglês. Os textos paralelos e sua versão alinhada são, ambos, de grande importância para diversas aplicações de Processamento de Línguas Naturais (PLN), como: aprendizado de regras de tradução (objetivo do projeto ReTraTos), Ezample-Based Machine Translation (EBMT), Statistical Machine Translation (SMT), extração de léxicos bilingues, desambiguação lexical de sentido, entre outras. As diretrizes aqui apresentadas possibilitaram a criação de córpus paralelos alinhados lexicalmente que seguem padrões bem definidos eliminando, assim, um grande número de ambiguidades inerentes do processo de alinhamento. Tanto os córpus quanto as diretrizes produzidos neste trabalho poderão ser utilizados em projetos futuros para a produção de ferramentas e recursos para o Processamento de Linguagem Natural.