Estudo e comparação de métodos para estimação de números de grupos em problemas de agrupamento de dados.

Loading...
Thumbnail Image
Date
2009-03
Authors
Naldi, Murilo Coelho
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract

O volume de dados gerado em certos cenários é cada dia maior e a capacidade de armazenamento destes dados ultrapassa a habilidade humana de análise e extraçãoao de conhecimento dos mesmos. Mineração de Dados é a área que pesquisa a extração de informações e conhecimento em bases de dados. Um dos problemas centrais desta área é o agrupamento não-supervisionado de dados que tem como objetivo particionar os dados em grupos de objetos (instâncias ou amostras) mais similares entre si do que com relação aos objetos dos demais grupos, segundo alguma medida de similaridade ou dissimilaridade. Um problema ainda hoje crítico no que tange á tarefa de agrupamento diz respeito á estimação do número mais natural de grupos contidos em um determinado conjunto de dados. A maioria dos algoritmos requerem que o número de grupos seja fornecido pelo usuário. Existem, em contrapartida, diferentes metodologias sistemáticas para tentar estimar o número mais adequado de grupos a partir da supervisão e análise do comportamento de critérios de desempenho de múltiplas execuções desses algoritmos a partir de diferentes números de grupos. Não são claras, no entanto, as reais diferenças existentes entre essas diferentes metodologias em termos de eficácia e eficiência computacional. Esse projeto tem como objetivo investigar algumas das técnicas de múltiplas execuções de algoritmos de agrupamento e suas diferenças em termos de complexidade e desempenho.

Description
Keywords
Mineração de dados
Citation