Improved visual clustering of large multi-dimensional data sets.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorTejada, Eduardo
dc.contributor.authorMinghim, Rosane
dc.date.accessioned2018-09-26T12:44:10Z
dc.date.available2018-09-26T12:44:10Z
dc.date.issued2003-09
dc.description.abstractLowering computational cost of data analysis techniques is an essential step towards including the user in the process and achieving scalability of algorithms for large scale visualization. In this paper we present an improved algorithm for visual clustering of large multi-dimensional data sets. This algorithm is a version with lower computational cost of the IPCLUS algorithm. The original algorithm is an approach that deals efiiciently with multi—dimensionality using various projections of the data in order to perform multi-space clustering, pruning outliers through direct user interaction. The algorithm presented here, named HC-Enhanced, adds a scalability level to the approach without reducing clustering quality. Additionally, an algorithm to improve clusters is added to the approach. A number of test cases is presented with good results.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 215pt_BR
dc.format16 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6864
dc.language.isoengpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectComputação gráficapt_BR
dc.titleImproved visual clustering of large multi-dimensional data sets.pt_BR
dc.title.alternativeAgrupamento visual aprimorado de grandes conjuntos de dados multidimensionais.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedReduzir o custo computacional das técnicas de análise de dados é um passo essencial em direção a inclusão do usuário e a atingir a escalabilidade de algoritmos para visualização de grandes conjuntos de dados. Neste trabalho apresentamos um algoritmo melhorado para agrupamento visual de grandes conjuntos de dados multidimensionais. Esse algoritmo é uma versão com menor custo computacional do algoritmo IPCLUS. O algoritmo original é uma abordagem que lida eficientemente com multidimensionalidade usando várias projeções dos dados para realizar um agrupamento em multiplos espaços, eliminando outliers através da interferência do usuário.O algoritmo apresentado aqui, denominado HC-Enhanced, adiciona um nível de escalabilidade a abordagem sem reduzir a qualidade do agrupamento. Adicionalmente, um algoritmo para melhorar os grupos é incluido na abordagem. Vários testes são apresentados com bons resultados.pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
relatorio_215.pdf
Tamanho:
6.88 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: