RESUMOClusterização ou Agrupamento de Dados é uma das técnicas mais conhecidas em Mineração de Dados. Um problema de Clusterização consiste em agrupar objetos de uma base de dados em grupos de objetos similares de acordo com um conjunto de características. Para resolver este problema propomos uma nova abordagem híbrida do uso das metaheurísticas PSO (Particle Swarm Optimization) e ILS (Iterated Local Search) Este trabalho propõe a criação de uma nova abordagem para o uso do algoritmo CPSO na Clusterização de Dados. Nesta versão, utiliza-se um número caótico para gerar o índice do vetor que guarda os valores do componente inercial w. A principal inovação desta variação do CPSO é a utilização de uma estratégia de aceleração utilizando outra meta-heurística, o ILS, para acelerar a convergência do CPSO. A técnica de busca local utilizada no ILS é o algoritmo K-Means.Os resultados de testes feitos com a utilização de cinco bases de dados reais com diferentes problemas de Clusterização demonstram que a versão proposta é superior às encontradas na literatura, tais como K-Means, PSO, K-PSO, CPSO, ACPSO [8;10;11] e ILS-KM. II. CLUSTERIZAÇÃO DE DADOSClusterização de Dados é o processo que visa reunir vetores multidimensionais em grupos, tendo em vista obter a maior similaridade dentro de cada grupo. Esta técnica também conhecida como Agrupamento de Dados é uma das mais conhecidas em Mineração de Dados. Segundo [12;13], Clusterização é a classificação não-supervisionada de dados, formando agrupamentos ou clusters. Ela representa uma das principais etapas de processos de análise de dados, denominada análise de clusters. Um Problema de Clusterização consiste em dado uma base de dados X, agrupar (clusterizar) os n elementos ou objetos de X de modo que objetos mais similares fiquem no mesmo cluster e objetos menos similares sejam alocados para clusters distintos. Para medir a similaridade entre elementos de um mesmo cluster a métrica mais utilizada é a distância entre eles, quanto mais próximo mais similar e vice-versa. As
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.