AgradecimentosSou muito grato ao meu orientador Professor Eduardo Raul Hruschka, pessoa por quem tenho enorme admiração, que foi além de um excepcional orientador, um amigo com quem pude contar durante os longos anos da pós-graduação. Em especial, gostaria de agradecer também a sua família, Luciana e Catharina, por todo o carinho e paciência que tiveram comigo durante o período do meu doutorado-sanduíche. Tenho uma dívida eterna com vocês.Agradeço ao Professor Joydeep Ghosh, meu supervisor durante o doutorado sanduíche que realizei na Universidade do Texas em Austin, por ter me aceitado em seu grupo e pelos ensinamentos durante o desenvolvimento do trabalho. À Debora, minha namorada, por ter sido paciente e compreensiva ao longo destes anos e por estar sempre ao meu lado, tanto nos momentos bons quanto nos ruins. À minha família, meus pais José e Rosana, por todo o apoio durante todos os meus anos de vida e por me proverem condições para eu ter conseguido chegar até aqui.Gostaria também de agradecer aos amigos que fiz no ICMC, em especial a André e Victor Laguna, pelos momentos de discussão sobre assuntos relacionados a este trabalho, pelos momentos de companheirismo e confraternização e por estarem sempre dispostos a ajudar.A todos os funcionários do ICMC da USP, pela competência e dedicação. À FAPESP pelo apoio financeiro para a realização deste trabalho (Processo 2009/17795-0). Ao CNPq pelo apoio financeiro para a realização do doutorado sanduíche na Universidade do Texas (Bolsa SWE -Processo 200372/2011-4).vii Resumo Nesta tese, são estudados algoritmos para agrupamento de dados, com particular ênfase em Agrupamento de Dados com Restrições, no qual, além dos objetos a serem agrupados, são fornecidos pelo usuário algumas informações sobre o agrupamento desejado. Como fundamentação para o agrupamento, são considerados os modelos de mistura finitos, em especial, com componentes gaussianos, usualmente chamados de modelos de mistura de gaussianas. Dentre os principais problemas que os algoritmos desenvolvidos nesta tese de doutorado buscam tratar destacam-se: (i) estimar parâmetros de modelo de mistura de gaussianas; (ii) como incorporar, de forma eficiente, restrições no processo de aprendizado de forma que tanto os dados quanto as restrições possam ser adicionadas de forma online; (iii) estimar, via restrições derivadas de conceitos pré-determinados sobre os objetos (usualmente chamados de classes), o número de grupos destes conceitos. Como ferramenta para auxiliar no desenvolvimento de soluções para tais problemas, foram utilizados algoritmos evolutivos que operam com mais de uma solução simultaneamente, além de utilizarem informações de soluções anteriores para guiar o processo de busca. Especificamente, foi desenvolvido um algoritmo evolutivo baseado na divisão e união de componentes para a estimação dos parâmetros de um modelo de mistura de gaussianas. Este algoritmo foi comparado com o algoritmo do mesmo gênero considerado estado-da-arte na literatura, apresentando resultados competitivos e necessitando de ...