Improved visual clustering of large multi-dimensional data sets.
dc.contributor | Instituto de Ciências Matemáticas e de Computação – ICMC/USP | pt_BR |
dc.contributor.author | Tejada, Eduardo | |
dc.contributor.author | Minghim, Rosane | |
dc.date.accessioned | 2018-09-26T12:44:10Z | |
dc.date.available | 2018-09-26T12:44:10Z | |
dc.date.issued | 2003-09 | |
dc.description.abstract | Lowering computational cost of data analysis techniques is an essential step towards including the user in the process and achieving scalability of algorithms for large scale visualization. In this paper we present an improved algorithm for visual clustering of large multi-dimensional data sets. This algorithm is a version with lower computational cost of the IPCLUS algorithm. The original algorithm is an approach that deals efiiciently with multi—dimensionality using various projections of the data in order to perform multi-space clustering, pruning outliers through direct user interaction. The algorithm presented here, named HC-Enhanced, adds a scalability level to the approach without reducing clustering quality. Additionally, an algorithm to improve clusters is added to the approach. A number of test cases is presented with good results. | pt_BR |
dc.description.notes | Relatórios Técnicos do ICMC; 215 | pt_BR |
dc.format | 16 p. | pt_BR |
dc.identifier.uri | http://repositorio.icmc.usp.br//handle/RIICMC/6864 | |
dc.language.iso | eng | pt_BR |
dc.publisher.city | São Carlos, SP, Brasil. | pt_BR |
dc.subject | Computação gráfica | pt_BR |
dc.title | Improved visual clustering of large multi-dimensional data sets. | pt_BR |
dc.title.alternative | Agrupamento visual aprimorado de grandes conjuntos de dados multidimensionais. | pt_BR |
dc.type.category | Relatórios técnicos | pt_BR |
usp.description.abstracttranslated | Reduzir o custo computacional das técnicas de análise de dados é um passo essencial em direção a inclusão do usuário e a atingir a escalabilidade de algoritmos para visualização de grandes conjuntos de dados. Neste trabalho apresentamos um algoritmo melhorado para agrupamento visual de grandes conjuntos de dados multidimensionais. Esse algoritmo é uma versão com menor custo computacional do algoritmo IPCLUS. O algoritmo original é uma abordagem que lida eficientemente com multidimensionalidade usando várias projeções dos dados para realizar um agrupamento em multiplos espaços, eliminando outliers através da interferência do usuário.O algoritmo apresentado aqui, denominado HC-Enhanced, adiciona um nível de escalabilidade a abordagem sem reduzir a qualidade do agrupamento. Adicionalmente, um algoritmo para melhorar os grupos é incluido na abordagem. Vários testes são apresentados com bons resultados. | pt_BR |