Esse trabalho apresenta um estudo comparativo entre dois modelos de redes convolucionais profundas em tarefas de identificação e contagem de insetos em imagens digitais, considerando afídeos (Hemiptera: Aphididae) e parasitoides (Hymenoptera: Aphelinidae e Braconidae, Aphidiinae). Nesse estudo de caso, cada imagem pode conter centenas de espécimes, detritos, sobreposições e outros insetos com morfologia semelhante, o que dificulta o processo de detecção. Nesse sentido, comparou-se os resultados obtidos pelo sistema InsectCV, baseado em Mask RCNN, em termos de tempo de treinamento, inferência e precisão, com um novo modelo, treinado com a rede DarkNet. Com a utilização de imagens em tons de cinza, com menor dimensão, processamento via GPU e uma rede convolucional de um estágio, é possível a redução do custo computacional e elevação da precisão na tarefa de detecção de objetos. Com base em 580 imagens utilizadas para a validação do modelo proposto foi possível obter a precisão média de 79,9%.