Resumo-No presente trabalho, foi realizado o desenvolvimento de um modelo de detecção automática de interpolação em áudios digitais com o uso de redes neurais convolucionais (CNNs). O espectrograma dos áudios, calculado através de diferentes técnicas: transformada de fourier de tempo curto (STFT) na escala linear, STFT na escala mel e transformada Q constante (CQT), foi diretamente fornecido à rede como dado de entrada. Um estudo comparativo foi conduzido avaliando o impacto da escolha da representação no domínio tempo-frequência no desempenho do modelo em classificar corretamente os áudios originais e editados.Palavras-Chave-Detecção de edição em áudios, redes neurais convolucionais, análise tempo-frequência.