Identificação automática de segmentos discursivos: o uso do parser PALAVRAS.
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
O processo de segmentação textual é uma tarefa prévia para a maior parte das aplicações de Processamento de Língua Natural (PLN), sendo que tarefas diferentes exigem segmentos com granularidades diferentes. Este trabalho visa à produção de segmentos que encerrem em si uma idéia ou conceito básico do texto, os quais são ideais a uma análise retórica/discursiva do texto. Mais especificamente, aborda-se a RST (Rhetorical Structure Theory), uma das teorias discursivas mais utilizadas atualmente. O método de segmentação aqui exposto será incorporado ao sistema DiZer (DIscourse analyZER for BRazilian Portuguese), substituindo sua etapa de segmentação textual, objetivando melhor desempenho deste analisador retórico automático pioneiro para o português do Brasil. O método apresentado baseia-se em informações morfossintáticas produzidas pelo parser PALAVRAS, um dos melhores analisadores para o português do Brasil.