Resumo-Recentemente, abordagens baseadas em comitês de classificadores e métodos ensemble têm sido bastante exploradas por serem uma alternativa simples e eficaz para a construção de classificadores mais acurados. A melhoria da capacidade de generalização de um ensemble está diretamente relacionada a acurácia de cada classificador individual, bem como a diversidade dos classificadores que o compõem. Sendo assim, contribuições nesse escopo ainda são relevantes. Nesse trabalho, é apresentada uma extensão de um modelo ensemble baseado em Perceptrons balanceados que permite a inclusão de funções kernel e a solução de problemas não-linearmente separáveis. Visando a melhoria da acurácia do classificador individual, o hiperplano solução é balanceado. Além disso, uma medida de dissimilaridade é introduzida com intuito de maximizar a diversidade do ensemble. Essa estratégia permite a aceitação de um novo componente no comitê se, e somente se, uma distância mínima pré-estabelecida é mantida entre o novo candidato e todos os outros componentes. Um estudo experimental foi conduzido em bases de dados não-linearmente separáveis. Os resultados obtidos mostraram que o método proposto foi capaz de superar outros algoritmos avaliados, como o AdaBoost e o SVM, na maior parte dos casos testados. Além disso, o método proposto superou consistentemente o classificador de base empregado.Keywords-Ensemble; Perceptron kernel; Classificação.
I. INTRODUÇÃORecentemente, abordagens baseadas em métodos ensemble têm sido amplamente difundidas, tornando-se uma área de pesquisa importante e ativa, por serem uma alternativa eficaz para a criação de classificadores mais acurados. De fato, resultados teóricos e empíricos demonstram que métodos ensemble apresentam desempenho superior em relação aos classificadores individuais que os compõemUm ensemble consiste em um comitê de classificadores cujas hipóteses individuais são induzidas separadamente e as decisões referentes a cada hipótese são combinadas através de um método de consenso para a classificação de novas amostras apresentadas. Entre as estratégias mais comuns para combinar decisões destacam-se a média e o voto, ponderado ou não, das soluções. Para a construção de um modelo ensemble, dois aspectos fundamentais devem ser observados, a acurácia individual do classificador de base e a diversidade dos componentes do comitê [1]. Em relação a acurácia individual, um classificador é dito acurado se a taxa de erro fornecida por ele é inferior àquela fornecida por qualquer outra escolha aleatória. Além disso, a diversidade dos componentes é extremamente importante para possibilitar a correção de amostras classificadas incorretamente por um ou mais classificadores individuais.Nesse sentido, a diversidade do comitê implica diretamente na independência de seus componentes.Considerando as duas premissas anteriormente descritas, este trabalho apresenta uma extensão da formulação do método Ensemble of Balanced Perceptrons [4], para possibilitar a utilização de funções kernel e a solução de problemas não-li...