Creating interactive document maps through dimensionality reduction and visualization techniques.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorLopes, Alneu de Andrade
dc.contributor.authorMinghim, Rosane
dc.contributor.authorMelo, Vinicius
dc.date.accessioned2018-08-29T15:24:29Z
dc.date.available2018-08-29T15:24:29Z
dc.date.issued2005-06
dc.description.abstractThe current availability of information many times impair the tasks of searching, browsing and analysing information pertinent to a topic of interest. This paper presents a methodology to create a meaningful graphical representation of corpora of documents targeted at supporting exploration of correlated information. The purpose of such an approach is to produce a map from a document body on a research topic or field based on the analysis of their contents, and similarities amongst articles. The document map is generated, after text pre-processing, by projecting the data in two dimensions using Latent Semantic Indexing. The projection is followed by hierarchical clustering to support sub-area identification. The map can be interactively explored, helping to narrow down the search for relevant articles. Tests were performed using a collection of documents pre-classified in three research subject classes: Case Based Reasoning, Information Retrieval, and Inductive Logic Programming, the map produced was capable of separating the main areas and approaching documents by their similarity, revealing possible topics, and identifying boundaries between them. The tool can deal with the exploration of inter-topics and intra-topic relationship and is useful in many contexts that need deciding on relevant articles to read, such as scientific research education, and training.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 259pt_BR
dc.format14 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6833
dc.language.isoengpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectEngenharia de produçãopt_BR
dc.titleCreating interactive document maps through dimensionality reduction and visualization techniques.pt_BR
dc.title.alternativeCriando mapas de documentos interativos através de técnicas de redução de dimensionalidade e visualização.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedA disponibilidade atual de informações muitas vezes prejudica as tarefas de pesquisar, navegar e analisar informações pertinentes a um tópico de interesse. Este artigo apresenta uma metodologia para criar uma representação gráfica significativa de corpora de documentos destinados a apoiar a exploração de informações correlacionadas. O propósito de tal abordagem é produzir um mapa de um corpo de documento sobre um tópico ou campo de pesquisa baseado na análise de seus conteúdos e semelhanças entre os artigos. O mapa do documento é gerado, após o pré-processamento do texto, projetando os dados em duas dimensões usando o Latent Indexação Semântica. A projeção é seguida pelo agrupamento hierárquico para apoiar a identificação da sub-área. O mapa pode ser explorado de forma interativa, ajudando para restringir a busca por artigos relevantes. Os testes foram realizados usando um coleta de documentos pré-classificados em três disciplinas de pesquisa: Raciocínio Baseado em Casos, Recuperação de Informações e Programação Lógica Indutiva, o mapa produzido foi capaz de separar as áreas principais e aproximar documentos por sua semelhança, revelando possíveis tópicos e identificando limites entre eles . A ferramenta pode lidar com a exploração de inter-tópicos e relacionamento intra-tópico e é útil em muitos contextos que precisam decidir sobre artigos relevantes para ler, como educação de pesquisa científica e treinamento.pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
relatorio_259.pdf
Tamanho:
4.4 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: