PRED.ARG: ferramenta para gerar representações de documentos com base em papéis semânticos.
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Neste relatório técnico é apresentada a ferramenta PRED.ARG, desenvolvida para gerar representações de coleções de documentos que foram propostas por Persson et al. (2009). As representações de Persson et al. (2009) consideradas neste trabalho são geradas a partir de estruturas de predicador e argumentos identificadas e anotadas em textos escritos em língua natural. Essas representações fazem uso de informações sobre os papéis semânticos, visando a obtenção de atributos mais expressivos e, consequentemente, uma representação mais rica do que a bag of words. Esse trabalho foi desenvolvido com o objetivo de possibilitar a comparação das representações de Persson et al. (2009) com outras representações em diferentes tarefas de Mineração de Textos, além de disponibilizar a implementação para pesquisas futuras. A ferramenta possibilita a geração de diferentes representações de coleções de documentos. Ela recebe como entrada um conjunto de documentos pré-processados em um padrão pré-definido e gera como saída um arquivo CSV que representa a coleção de documentos.