RESUMO Este trabalho se insere no contexto de análise de imagens, visando a extração automática de informações complexas com alta precisão. Este estudo teve como objetivo avaliar o desempenho de redes neurais convolucionais na classificação de imagens de concreto em duas classes: (a) não fissuradas e (b) fissuradas. Para tanto, foram empregadas as redes profundas VGG16, VGG19 e ResNet50 com aprendizagem por transferência por meio de ajuste fino. As redes foram treinadas novamente e testadas usando um banco de dados de 40.000 imagens. Após o treinamento, as redes foram testadas, alcançando uma precisão impressionante entre 99,27% e 99,78%. Este alto nível de precisão inspira confiança no uso destes modelos preditivos. Para avaliar a robustez dos modelos, foram gerados gradientes visuais dos pontos focais de atenção das redes nas imagens, mostrando que os modelos focam e capturam aspectos das fotos que realmente caracterizam as fissuras. Com base nos resultados, pode-se concluir que as redes neurais convolucionais são eficazes na classificação de problemas envolvendo concreto e podem ser aplicadas em inspeções precisas para auxiliar engenheiros com alta confiabilidade quanto aos resultados.