Estudo e análise das diversas representações e estruturas de dados utilizadas nos algoritmos de clustering hierárquico.

Carregando...
Imagem de Miniatura
Data
2006-01
Autores
Monard, Maria Carolina
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo

Tarefas de aprendizado de máquina não-supervisionado são, frequentemente, utilizadas em diversas aplicações de Mineração de Dados e Textos, nas quais grandes conjuntos de dados devem ser analisados em busca de conhecimento novo e potencialmente util. O clustering, especificamente, é uma técnica de análise e exploração de dados usualmente aplicada com objetivo de extrair padrões latentes nesses conjuntos de dados. Existem diversas abordagens e algoritmos de clustering propostos na literatura, entre eles, os algoritmos hierárquicos, objeto de estudo deste trabalho. Esses algoritmos constroem uma estrutura que descreve os clusters identificados por meio de uma hierarquia, que pode ser representada de diversas formas, tais como dendograma ou banner, por exemplo. Além disso, essas formas de representação podem ser armazenadas em diferentes estruturas de dados. Um dos objetivo deste trabalho ´e revisar algumas das formas de representação mais comumente utilizadas no clustering e, também, as estruturas de dados utilizadas na implementação dessas representações. Outro objetivo é, com base nesse estudo, decidir qual das formas de representação e estrutura de dados serão utilizadas na implementação do módulo de clustering hierárquico do Discover, um ambiente computacional em desenvolvimento no Laboratório de Inteligência Computacional do ICMC.

Descrição
Palavras-chave
Inteligência artificial
Citação