AgradecimentosAgradeço primeiramente a Deus, pela presença constante, condução, oportunidades oferecidas a mim. Ao meu orientador, Professor Doutor Marcelo Seido Nagano, pela confiança, paciência e incentivo durante esta jornada. A minha família, meus pais, Andrea e Antônio e aos meus irmãos, Thais e Rafael, pelo apoio incondicional durante toda minha vida e por sempre se posicionarem de forma positiva e motivadora. Ao meu noivo, Thiago, pelo apoio, paciência e dedicação, não só nesta etapa, mas em todas as outras. Aos amigos do Laboratório de Pesquisa Operacional Aplicada (LAOR), Fernando Rossi, Hugo Miyata, Thiago Soares e João Vítor Robazzi pela companhia, companheirismo e pelas discussões que enriqueceram este trabalho e minha experiência de vida. Aos funcionários do departamento de Engenharia de Produção da Escola de Engenharia de São Carlos (EESC) da Universidade de São Paulo, pela competência, disposição e dedicação. E, ao CNPq, pelo apoio financeiro concedido, o que tornou possível o desenvolvimento deste trabalho."Those that know, do. Those that understand, teach" -Aristotle
ResumoMartarelli, Nádia Junqueira Seleção de atributos em agrupamento de dados utilizando algoritmos evolutivos. 137 p. Dissertação de mestrado -Escola de Engenharia de São Carlos, Universidade de São Paulo, 2016.Com o surgimento da tecnologia da informação, o processo de análise e interpretação de dados deixou de ser executado exclusivamente por seres humanos, passando a contar com auxílio computacional para a descoberta de conhecimento em grandes bancos de dados. Este auxílio exige uma organização e ordenação das atividades, antes manualmente exercidas, em um processo composto de três grandes etapas. A primeira etapa deste processo conta com uma tarefa de redução da dimensionalidade, que tem como objetivo a eliminação de atributos que não contribuem para a análise dos dados, resultando portanto, na seleção de um subconjunto dos atributos originais. A seleção de um subconjunto de atributos pode ser encarada como um problema de busca, já que há inúmeras possibilidades de combinação dos atributos originais em subconjuntos. Dessa forma, uma das estratégias de busca que pode ser adotada consiste na busca randômica, executada por um algoritmo genético ou pelas suas variações. Este trabalho propõe a aplicação de duas variações do algoritmo genético, Algoritmo Genético Construtivo e Algoritmo Genético Enviesado com Chave Aleatória, no problema de seleção de atributos em agrupamento de dados, já que estas duas variações ainda não foram aplicadas em tal problema. A fim de verificar o desempenho destas duas variações, comparou-se ambas com a abordagem tradicional do algoritmo genético. Efetuou-se também a comparação entre as duas variações. Para isto, foi utilizada três bases de dados retiradas do repositório UCI 1 de aprendizado de máquinas. Os resultados obtidos mostraram que os desempenhos, em termos de qualidade da solução, dos algoritmos: genético construtivo e genético enviesado com chave aleatório foram melhores, de maneira geral, do ...