Abstract-Neste trabalho, discute-se a seleção de dados para o projeto de classificadores em problemas sujeitos a restrições estatísticas do banco de dados. Considerando a classificação de espectros de sonar passivo, provenientes de 25 navios pertencentes a 8 classes distintas,é mostrado que a seleção dos conjuntos de projeto e teste, por meio de técnicas de análise de agrupamentos, permite, com um menor custo computacional, obter classificadores de maior eficiência média e melhor desempenho para as classes mais críticas. Utilizando esta técnica, um classificador com uma eficiência média de 94,6% foi obtido, o queé significativo para o problema em questão.
I. INTRODUÇÃOA vigilância realizada pelas forças armadas utiliza equipamentos variados, com o objetivo de buscar alvos que podem ser ameaças ou objetos de interesse. Neste contexto, os submarinos de guerra realizam, comumente, operações de patrulha e ataque. Desta maneira, a identificação, em tempo hábil, de embarcações eventualmente presentes em sua vizinhança, referidas como contatos,é fundamental.O principal sistema utilizado nos submarinos para a detecção e identificação de contatosé o sistema de sonar passivo. Operadores especialmente treinados, analisando a sonoridade e o conteúdo de freqüência do sinal de sonar, definem o contato mais provável, já que cada embarcação produz um ruído característico, conhecido como assinatura, que está relacionadoà sua cavitação, ao ruído do hélice e das máquinas em operação no seu interior [1]. A identificação de contatos nãoé uma tarefa trivial, dada a complexidade do ruído captado, que reúne sinais provenientes de múltiplas fontes, entre elas: o contato, os ruídos biológicos, assim como as múltiplas reflexões destes ruídos no assoalho submarino.Desta forma, sistemas automáticos de classificação constituem uma ferramenta bastanteútil ao operador, podendo ser utilizados como instrumento de apoioà decisão, o que reduz o volume de trabalho e aumenta o nível de confiabilidade e a rapidez do processo de decisão pelo operador. Para implementação de um tal sistema, a técnica de redes neurais artificiais [2]é especialmente adequada, dada sua habilidade em extrair informação relevante, mesmo em ambientes de altadimensionalidade, produzindo classificadores compactos e de elevada eficiência.Para o desenvolvimento de sistemas de classificação de contatos, a existência de uma base de dados que reflita as condições reais de operação das diferentes classesé fundamental. Assim, o procedimento comumente adotado no ambiente de sonar consiste em realizar corridas de navios pertencentes a variadas classes, segundo diferentes condições operativas, numa raia acústica, promovendo a aquisição dos sinais produzidos no interior da raia, de forma a simular uma situação real. Este procedimentoé um processo complexo e caro, sujeito a variadas restrições, inclusive em relação ao número de navios disponíveisà caracterização de cada classe, o que, normalmente, restringe a estatística dos dados disponíveis.Neste trabalho discutimos a seleção de dados pa...