Manual para marcação de alinhamentos lexícais.
dc.contributor | Instituto de Ciências Matemáticas e de Computação – ICMC/USP | pt_BR |
dc.contributor.author | Caseli, Helena de Medeiros | |
dc.contributor.author | Scalco, Miriam Antunes Gonçalves | |
dc.contributor.author | Nunes, Maria das Graças Volpe | |
dc.date.accessioned | 2018-08-29T16:48:39Z | |
dc.date.available | 2018-08-29T16:48:39Z | |
dc.date.issued | 2005-04 | |
dc.description.abstract | Este relatório apresenta as diretrizes definidas, no âmbito do projeto ReTraTos, para o processo de alinhamento lexical de textos paralelos escritos em Português do Brasil, Espanhol e Inglês. Os textos paralelos e sua versão alinhada são, ambos, de grande importância para diversas aplicações de Processamento de Línguas Naturais (PLN), como: aprendizado de regras de tradução (objetivo do projeto ReTraTos), Ezample-Based Machine Translation (EBMT), Statistical Machine Translation (SMT), extração de léxicos bilingues, desambiguação lexical de sentido, entre outras. As diretrizes aqui apresentadas possibilitaram a criação de córpus paralelos alinhados lexicalmente que seguem padrões bem definidos eliminando, assim, um grande número de ambiguidades inerentes do processo de alinhamento. Tanto os córpus quanto as diretrizes produzidos neste trabalho poderão ser utilizados em projetos futuros para a produção de ferramentas e recursos para o Processamento de Linguagem Natural. | pt_BR |
dc.description.notes | Relatórios Técnicos do ICMC; 256 | pt_BR |
dc.format | 21 p. | pt_BR |
dc.identifier.uri | http://repositorio.icmc.usp.br//handle/RIICMC/6835 | |
dc.language.iso | por | pt_BR |
dc.publisher.city | São Carlos, SP, Brasil. | pt_BR |
dc.subject | Linguistica computacional | pt_BR |
dc.title | Manual para marcação de alinhamentos lexícais. | pt_BR |
dc.title.alternative | Manual for marking of alignments. | pt_BR |
dc.type.category | Relatórios técnicos | pt_BR |
usp.description.abstracttranslated | This report presents the guidelines defined, within the framework of the ReTraTos project, for the lexical alignment process of parallel texts written in Brazilian Portuguese, Spanish and English. Parallel texts and their aligned version are both of great importance for various applications of Natural Language Processing (PLN), such as: learning of translation rules (objective of the ReTraTos project), Ezample-Based Machine Translation (EBMT), Statistical Machine Translation (SMT), extraction of bilingual lexicons, lexical meaning disambiguation, among others. The guidelines presented here allowed the creation of lexical parallel aligned corpus that follows well defined patterns, thus eliminating a large number of inherent ambiguities of the alignment process. Both the corpus and the guidelines produced in this work can be used in future projects for the production of tools and resources for Natural Language Processing. | pt_BR |