Tuning of reinforcement learning parameters applied to SOP using the Scott–Knott method

Ottoni, André Luiz Carvalho; Nepomuceno, Erivelton G.; Oliveira, Marcos Santos de; Oliveira, Daniela Carine Ramires de

doi:10.1007/s00500-019-04206-w

Cited by 31 publications

(54 citation statements)

References 52 publications

(83 reference statements)

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…Aárea de otimização combinatóriaé um campo com vários estudos com AR (Gambardella and Dorigo, 1995;Bianchi et al, 2009;Lima Júnior et al, 2010;Costa et al, 2016;Alipour et al, 2018;Lins et al, 2019). Nesse aspecto, alguns domínios com aplicações de técnicas de AR são: Problema do Caxeiro Viajante (TSP) (Gambardella and Dorigo, 1995;Lima Júnior et al, 2010), Problema dos K-Servos (Costa et al, 2016;Lins et al, 2019), Problema da Mochila Multidimensional (Ottoni et al, 2017), Roteamento de Veículos (Silva et al, 2019) e Sequential Ordering Problem (SOP) (Ottoni et al, 2020).…”

Section: Seguindo Essa Linha Técnicas De Transfer Reinforcementunclassified

“…Em problemas de TSP simétrico, o custo de deslocamento entre duas cidadesé equivalente nos dois sentidos de movimentação, ou seja, c ij = c ji . Já no TSP assimétrico (ATSP), o custo de ir de i para j pode ser diferente do custo do deslocamento de j para i (c ij = c ji ) (Ottoni et al, 2020).…”

Section: Problemas De Otimização Combinatóriaunclassified

“…Nesse sentido, o SOPé semelhante ao ATSP com a adição de restrições de precedência (c ij = −1) (Gambardella and Dorigo, 2000;Ottoni et al, 2020). O custo no SOP pode assumir c ij ≥ 0 ou c ij = −1 (com c ji ≥ 0) (Gambardella and Dorigo, 2000).…”

Section: Problemas De Otimização Combinatóriaunclassified

See 2 more Smart Citations

Transferência de Aprendizado por Reforçoo em Problemas de Otimização Combinatória

Ottoni

Oliveira

et al. 2020

Anais Do Congresso Brasileiro De Automática 2020

View full text Add to dashboard Cite

O Aprendizado por Reforço (AR) é uma técnica de Machine Learning com importantes aplicações em problemas de otimização combinatória. No entanto, a literatura carece de estudos sobre a transferência de AR entre domínios de otimização. Baseando-se nisso, o objetivo deste trabalho foi aplicar e analisar a transferência de conhecimento do AR entre o Problema do Caixeiro Viajante (TSP) e o Sequential Ordering Problem (SOP). Para isso, foi adotada a biblioteca de instâncias TSPLIB e o algoritmo SARSA. A metodologia proposta compreende: modelagem do sistema de AR, geração da base de conhecimento (QTSP), experimentos para transferência de aprendizado e analise dos resultados. Os resultados obtidos a partir de testes estatísticos, apontam que, em geral, adotar a transferência de conhecimento entre os problemas possibilitou o cáalculo de melhores métricas de desempenho do domínio objetivo (SOP).

show abstract

Section: Seguindo Essa Linha Técnicas De Transfer Reinforcementunclassified

Section: Problemas De Otimização Combinatóriaunclassified

See 1 more Smart Citation

Transferência de Aprendizado por Reforçoo em Problemas de Otimização Combinatória

Ottoni

Oliveira

et al. 2020

Anais Do Congresso Brasileiro De Automática 2020

View full text Add to dashboard Cite

show abstract

“…A metodologia experimental foi baseada em trabalhos recentes: (Ottoni et al, 2018(Ottoni et al, , 2019. As simulações foram realizadas no software M AT LAB R e compreenderam 16 grupos de experimentos (2 algoritmos × 4 instâncias × 2 tipos de problemas):…”

Section: Experimentos Realizadosunclassified

“…No AR, um agente aprende a partir de sucessos e fracassos interagindo em um ambiente (Sutton and Barto, 2018). Um dos principais aspectos do ARé a estimação de parâmetros que otimizem o aprendizado, como taxa de aprendizado (α) e o fator de desconto (γ) (Even-Dar and Mansour, 2003;Schweighofer and Doya, 2003;Ottoni et al, 2019). A definição dos parâmetros podem influenciar diretamente no aprendizado de uma boa rota (Ottoni et al, 2018).…”

Section: Introductionunclassified

Estimação de Parâmetros do Aprendizado por Reforço para o Problema de Planejamento de Rotas com Reabastecimento

Ottoni

Nepomuceno

Oliveira

2019

Anais Do 14º Simpósio Brasileiro De Automação Inteligente

View full text Add to dashboard Cite

Path planning is a important problem in mobile robotics. One of the aspects of this type of autonomous vehicles planning refers to observe the fuel-constraints. In this sense, the objective of this work is to estimate the Reinforcement Learning parameters for the path planning problem with refueling. The results indicate that the parameters estimated with the Response Surface Methodology reached the best solutions in most of the experiments. Resumo: O planejamento de rotasé um importante problema na robótica móvel. Uma das vertentes desse tipo de planejamento para veículos autônomos, refere-se a observar as restrições operacionais com combustível. Nesse sentido, o objetivo deste trabalhoé estimar os parâmetros do Aprendizado por Reforço para o problema planejamento de rotas com reabastecimento. Os resultados apontam que os parâmetros estimados com a Metodologia de Superfície de Resposta alcançaram as melhores soluções na maioria dos experimentos.

show abstract

Breast Fine Needle Cytological Classification Using Deep Hybrid Architectures

Zerouaoui

Idri

Nakach

et al. 2021

Computational Science and Its Applications – ICCSA 2021

View full text Add to dashboard Cite

Tuning of reinforcement learning parameters applied to SOP using the Scott–Knott method

Cited by 31 publications

References 52 publications

Transferência de Aprendizado por Reforçoo em Problemas de Otimização Combinatória

Transferência de Aprendizado por Reforçoo em Problemas de Otimização Combinatória

Estimação de Parâmetros do Aprendizado por Reforço para o Problema de Planejamento de Rotas com Reabastecimento

Breast Fine Needle Cytological Classification Using Deep Hybrid Architectures

Contact Info

Product

Resources

About