Este trabalho apresenta uma discussão sobre o uso de inteligência artificial (artificial intelligence – IA) e aprendizado de máquina (machine learning – ML) aplicados a navegação de veículos autônomos. Particularmente, visando a investigação de técnicas de aprendizado por reforço (reinforcement learning – RL), a implementação do algoritmo Q-learning e considerada para a solução de problemas de navegação representados por labirintos. Adicionalmente, a fim de obter alternativas para a construção e visualização de diferentes labirintos, assim como possibilitar o acompanhamento visual das tomadas de decisão de agentes robóticos simulados durante as etapas de treinamento e teste, uma interface de desenvolvimento de RL (RL framework) e aqui concebida. Resultados de simulação numérica são apresentados e permitem inferir acerca da qualidade das soluções de navegação realizadas por meio das estratégias de ML aqui investigadas, confirmando a eficácia das implementações de RL e do RL framework desenvolvido neste trabalho de pesquisa.