Navegando por Autor "Voltolini, Richardson Floriani"
Agora exibindo 1 - 2 de 2
Resultados por página
Opções de Ordenação
- ItemAvaliação experimental e comparação de algoritmos de seleção de atributos importantes com o algoritmo FDimBF baseado na dimensão fractal.(2005-08) Lee, Huei Diana; Monard, Maria Carolina; Voltolini, Richardson Floriani; WU, Feng ChungEm aprendizado de máquina, a tarefa de pré-processamento do conjunto de dados inclui selecionar os atributos mais importantes para realizar o aprendizado. A seleção de atributos é de fundamental importância pois, no caso de aprendizado supervisionado,atributos não relevantes ou redundantes podem reduzir a precisão e a compreensibilidade das hipóteses induzidas por esses algoritmos. Vários algoritmos para a seleção de atributos relevantes têm sido propostos na literatura. Entretanto, tem sido observado que somente o critério de relevância não é suficiente para a seleção de atributos importantes. Trabalhos recentes têm mostrado que também deve-se levar em conta o critério de redundância para selecionar os atributos importantes, pois atributos redundantes afetam a qualidade das hipóteses induzidas. Vários modelos têm sido propostos para tratar tanto relevância quanto redundância de atributos, porém, alguns desses modelos apresentam um custo computacional muito alto. Um modelo mais recente sugere realizar o tratamento de relevância e redundância como dois processos separados. A vantagem desse modelo é que, por meio dessa separação, é possível diminuir o custo computacional da busca pelo subconjunto que aproxima o subconjunto ótimo de atributos. Neste trabalho é proposto um algoritmo baseado nesse modelo, i.e. que separa as análises de relevância e de redundância. Nesse algoritmo encontram-se implementadas duas medidas para realizar a análise de relevância, uma medida baseada em ganho de informação e outra baseada em distância. Quanto à redundância, é proposto o uso da Dimensão Fractal do subconjunto de atributos relevantes selecionados na etapa anterior. Resultados experimentais utilizando vários conjuntos de dados e diversos algoritmos que selecionam atributos importantes, mostram que a Dimensão Fractal é um critério apropriado para filtrar atributos redundantes no aprendizado supervisionado.
- ItemProjeto e implementação do sistema DiscoverGraphics para a geração de gráficos de dados.(2006-09) Voltolini, Richardson Floriani; Monard, Maria CarolinaO pré-processamento de dados é uma das primeiras fases do processo de Mineração de Dados - MD- e busca. principalmente, proporcionar ao usuário do processo uma maior compreensão dos dados sendo utilizados e a preparação desses dados para as fases seguintes. Sendo o pré-processamento um passo inicial da MD, os resultados obtidos nele influenciam as demais fases, tendo um impacto significativo no resultado final da mineração. Além disso, uma vez que o processo de MD é interativo e, em cada uma de suas fases, decisões de quais tarefas e procedimentos devem ser considerados e essas decisões muitas vezes são relativas aos dados utilizados. a compreensão dos mesmos é de essencial importância para a obtenção de bons resultados. Uma das principais maneiras de auxiliar o usuário do processo de MD a aumentar sua compreensão dos dados é por meio da análise de diferentes tipos de gráficos que representem esses dados. Este trabalho busca contribuir com essa tarefa, por meio de uma proposta, projeto e implementação de um sistema computacional para geração de gráficos de dados, denominado DISCOVERGRAPHICS. Esse sistema apresenta facilidades para a utilização de métodos de geração de gráficos para dados que se encontram no formato atributo-valor, muito comum nessa área de MD. Além disso, outras ferramentas simples que auxiliam a realização de algumas outras tarefas de pré-processamento foram implementadas. Neste trabalho são apresentados detalhes do sistema DISCOVERGRAPHICS, uma descrição das ferramentas utilizadas para a sua construção. bem como as diferentes interfaces que o sistema proporciona aos usuários. Essas interfaces permitem a utilização do sistema por: usuários avançados, utilizando principalmente a interface de linha de comando que permite acesso a um maior número de recursos do sistema; usuários iniciantes, utilizando principalmente a interface WEB que permite acesso as funcionalidades de geração de gráfico por usuários com pouco ou nenhum conhecimento da área de computação; e, por outros sistemas, que podem compartilhar dados e requisitar a execução de funcionalidades do sistema DISCOVERGRAPICS por meio de arquivos XML. O sistema DISCOVERGRAPHICS desenvolvido apresenta facilidades de expansão para a inserção de novos métodos de geração de gráficos e novas ferramentas e funcionalidades, Ele está inserido em um sistema computacional de maior porte, que vem sendo desenvolvido em nosso Laboratório de Inteligência Computacional-LABIC-, para realizar as tarefas envolvidas nas diferentes fases do processo de Mineração de Dados.