Navegando por Autor "Caseli, Helena de Medeiros"
Agora exibindo 1 - 2 de 2
Resultados por página
Opções de Ordenação
- ItemAnali: uma ferramenta de análise morfossintática.(2006-10) Caseli, Helena de Medeiros; Nunes, Maria das Graças VolpeEste relatório apresenta a ferramenta de análise morfossintática anali, a qual foi desenvolvida no NILC (Núcleo Interinstítucional de Linguística Computacional) como resultado da união de outras duas ferramentas de Processamento de Língua Natural: o etiquetador MXPOST e a ferramenta de análise de corpus Unitex. Nesse sentido anali representa um ganho em relação ao que é produzido pelas ferramentas citadas em dois sentidos. Por um lado, enriquece a saída de MXPOST inserindo mais informação a respeito da análise retornada por esse etiquetador: e, por outro, desambigua a saída de Unitex ao definir qual das várias análises existentes em seus dicionários eletrônicos é a melhor em cada caso. Além disso, anali pode operar em três modos distintos: etiquetação (com base apenas na saída de MXPOST), análise morfossintática (com base apenas na, saída de Unitex) ou ambos.
- ItemManual para marcação de alinhamentos lexícais.(2005-04) Caseli, Helena de Medeiros; Scalco, Miriam Antunes Gonçalves; Nunes, Maria das Graças VolpeEste relatório apresenta as diretrizes definidas, no âmbito do projeto ReTraTos, para o processo de alinhamento lexical de textos paralelos escritos em Português do Brasil, Espanhol e Inglês. Os textos paralelos e sua versão alinhada são, ambos, de grande importância para diversas aplicações de Processamento de Línguas Naturais (PLN), como: aprendizado de regras de tradução (objetivo do projeto ReTraTos), Ezample-Based Machine Translation (EBMT), Statistical Machine Translation (SMT), extração de léxicos bilingues, desambiguação lexical de sentido, entre outras. As diretrizes aqui apresentadas possibilitaram a criação de córpus paralelos alinhados lexicalmente que seguem padrões bem definidos eliminando, assim, um grande número de ambiguidades inerentes do processo de alinhamento. Tanto os córpus quanto as diretrizes produzidos neste trabalho poderão ser utilizados em projetos futuros para a produção de ferramentas e recursos para o Processamento de Linguagem Natural.