RESUMOClusterização ou Agrupamento de Dados é uma das técnicas mais conhecidas em Mineração de Dados. Um problema de Clusterização consiste em agrupar objetos de uma base de dados em grupos de objetos similares de acordo com um conjunto de características. Para resolver este problema propomos uma nova abordagem híbrida do uso das metaheurísticas PSO (Particle Swarm Optimization) e ILS (Iterated Local Search) Este trabalho propõe a criação de uma nova abordagem para o uso do algoritmo CPSO na Clusterização de Dados. Nesta versão, utiliza-se um número caótico para gerar o índice do vetor que guarda os valores do componente inercial w. A principal inovação desta variação do CPSO é a utilização de uma estratégia de aceleração utilizando outra meta-heurística, o ILS, para acelerar a convergência do CPSO. A técnica de busca local utilizada no ILS é o algoritmo K-Means.Os resultados de testes feitos com a utilização de cinco bases de dados reais com diferentes problemas de Clusterização demonstram que a versão proposta é superior às encontradas na literatura, tais como K-Means, PSO, K-PSO, CPSO, ACPSO [8;10;11] e ILS-KM.
II. CLUSTERIZAÇÃO DE DADOSClusterização de Dados é o processo que visa reunir vetores multidimensionais em grupos, tendo em vista obter a maior similaridade dentro de cada grupo. Esta técnica também conhecida como Agrupamento de Dados é uma das mais conhecidas em Mineração de Dados. Segundo [12;13], Clusterização é a classificação não-supervisionada de dados, formando agrupamentos ou clusters. Ela representa uma das principais etapas de processos de análise de dados, denominada análise de clusters. Um Problema de Clusterização consiste em dado uma base de dados X, agrupar (clusterizar) os n elementos ou objetos de X de modo que objetos mais similares fiquem no mesmo cluster e objetos menos similares sejam alocados para clusters distintos. Para medir a similaridade entre elementos de um mesmo cluster a métrica mais utilizada é a distância entre eles, quanto mais próximo mais similar e vice-versa. As