A ROV (Remotely Operated underwater Vehicle) system needs a precise estimation of its position in order to avoid damage and imprecise movements in certain missions. In this paper, an intelligent controller for the trajectory tracking of a ROV susceptible to external forces (water dynamics, currents, animals, etc.) is proposed based on feedback linearization with an adaptative function optimized using a machine learning strategy. This work proposes an approach to the matter employing an reinforcement learning algorithm, the-greedy, to let him discover for itself an optimal learning rate for the used compensator. Numerical results confirm a strong improvement in the performance of the controller when the proposed compensator and learning strategy is inserted. Resumo: Um sistema ROV (Remotely Operated underwater Vehicle) precisa de uma estimação precisa da sua posição para evitar danos e movimentos imprecisos para certas tarefas. Neste artigo, um controlador inteligente foi proposto para o rastreamento da trajetória de um ROV suscetível a forças externas (dinâmica daágua, correntes, animais, etc.), este controlador foi baseado no método de linearização por realimentação com uma função adaptativa otimizada utilizando uma estratégia de aprendizagem de máquina. Este trabalho propõe o emprego de um algoritmo de aprendizagem por reforço, o-greedy, para o deixar descobrir por si só uma taxa de aprendizagemótima para o compensador. Resultados numéricos confirmam uma forte melhora na performance do controlador quando o compensador proposto e a estratégia de aprendizageḿ e inserida.