O Aprendizado por Reforço (AR) é uma das linhas do Aprendizado de Máquina e que pode ser aplicado às mais diversas situações. A Otimização Combinatória, por exemplo, é uma relevante área de aplicação do AR. Destaca-se que, na literatura recente, tem ocorrido uma alta movimentação para realizar o desenvolvimento de sistemas de AR para resolução de problemas conheci- dos de Otimização Combinatória, como o Problema do Caixeiro Viajante (PCV) e o Sequential Ordering Problem (SOP). No entanto, um desafio em aberto nessa área é a automatização da transferência de aprendizado entre o PCV e o SOP. Neste sentido, o objetivo deste trabalho foi propor um sistema de transferência de aprendizado com AutoML para otimização do SOP a partir de bases de conhecimento geradas com instancias assimétricas do PCV. Essa abordagem foi denominada de Auto TL RL. Os resultados obtidos pelo Auto TL RL mostram que, para a maioria das instâncias analisadas (aproximadamente 78%), o sistema proposto alcançou os melhores resultados em comparação aos resultados obtidos sem transferência aprendizado.