Estudo e análise das diversas representações e estruturas de dados utilizadas nos algoritmos de clustering hierárquico.

Metz, Jean; Monard, Maria Carolina

Estudo e análise das diversas representações e estruturas de dados utilizadas nos algoritmos de clustering hierárquico.

Arquivos

Relatório Técnico_269_2006.pdf(1.95 MB)

Data

2006-01

Autores

Metz, Jean

Monard, Maria Carolina

Resumo

Tarefas de aprendizado de máquina não-supervisionado são, frequentemente, utilizadas em diversas aplicações de Mineração de Dados e Textos, nas quais grandes conjuntos de dados devem ser analisados em busca de conhecimento novo e potencialmente util. O clustering, especificamente, é uma técnica de análise e exploração de dados usualmente aplicada com objetivo de extrair padrões latentes nesses conjuntos de dados. Existem diversas abordagens e algoritmos de clustering propostos na literatura, entre eles, os algoritmos hierárquicos, objeto de estudo deste trabalho. Esses algoritmos constroem uma estrutura que descreve os clusters identificados por meio de uma hierarquia, que pode ser representada de diversas formas, tais como dendograma ou banner, por exemplo. Além disso, essas formas de representação podem ser armazenadas em diferentes estruturas de dados. Um dos objetivo deste trabalho ´e revisar algumas das formas de representação mais comumente utilizadas no clustering e, também, as estruturas de dados utilizadas na implementação dessas representações. Outro objetivo é, com base nesse estudo, decidir qual das formas de representação e estrutura de dados serão utilizadas na implementação do módulo de clustering hierárquico do Discover, um ambiente computacional em desenvolvimento no Laboratório de Inteligência Computacional do ICMC.

Palavras-chave

Inteligência artificial

URI

http://repositorio.icmc.usp.br//handle/RIICMC/6718

Coleções

Publicações do ICMC

Página do item completo