A maioria dos problemas de desempenho são únicos. As métricas, cargas de trabalho e técnicas de avaliação usadas em um problema geralmente não podem ser usadas no problema seguinte. Portanto, ferramentas automáticas que auxiliem no entendimento do comportamento de uma aplicação em execução e suas mudanças ao longo do ciclo de desenvolvimento são essenciais para análises de desempenho e detecção de erros. A proposta deste trabalho é explorar a descoberta de defeitos no software por intermédio da avaliação de desempenho, assumindo a premissa que tais defeitos alteram o uso dos recursos ao longo da execução da aplicação. Isso é feito com a abordagem de teste funcional do programa em execução, onde são avaliados aspectos de desempenho da aplicação, e não aspectos funcionais, na detecção de erros na execução causados por defeitos. Um algoritmo de agrupamento baseado em Distância por Compressão Normalizada é aplicado para definir de forma automática um perfil de desempenho esperado do software em casos de teste, que é usado também para detectar anomalias. O processo de validação desta proposta é feito com a geração de defeitos por meio de mutação seletiva.Palavras-chave: teste funcional, avaliação de desempenho, agrupamento de dados, injeção de falhas, confiabilidade de software.