Estudo e comparação de métodos para estimação de números de grupos em problemas de agrupamento de dados.

Carregando...
Imagem de Miniatura
Data
2009-03
Autores
Naldi, Murilo Coelho
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo

O volume de dados gerado em certos cenários é cada dia maior e a capacidade de armazenamento destes dados ultrapassa a habilidade humana de análise e extraçãoao de conhecimento dos mesmos. Mineração de Dados é a área que pesquisa a extração de informações e conhecimento em bases de dados. Um dos problemas centrais desta área é o agrupamento não-supervisionado de dados que tem como objetivo particionar os dados em grupos de objetos (instâncias ou amostras) mais similares entre si do que com relação aos objetos dos demais grupos, segundo alguma medida de similaridade ou dissimilaridade. Um problema ainda hoje crítico no que tange á tarefa de agrupamento diz respeito á estimação do número mais natural de grupos contidos em um determinado conjunto de dados. A maioria dos algoritmos requerem que o número de grupos seja fornecido pelo usuário. Existem, em contrapartida, diferentes metodologias sistemáticas para tentar estimar o número mais adequado de grupos a partir da supervisão e análise do comportamento de critérios de desempenho de múltiplas execuções desses algoritmos a partir de diferentes números de grupos. Não são claras, no entanto, as reais diferenças existentes entre essas diferentes metodologias em termos de eficácia e eficiência computacional. Esse projeto tem como objetivo investigar algumas das técnicas de múltiplas execuções de algoritmos de agrupamento e suas diferenças em termos de complexidade e desempenho.

Descrição
Palavras-chave
Mineração de dados
Citação