2012 Brazilian Robotics Symposium and Latin American Robotics Symposium 2012
DOI: 10.1109/sbr-lars.2012.9
|View full text |Cite
|
Sign up to set email alerts
|

Reinforcement Learning with Case-Based Heuristics for RoboCup Soccer Keepaway

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
4
1

Citation Types

0
4
0
3

Year Published

2013
2013
2023
2023

Publication Types

Select...
2
2
1
1

Relationship

0
6

Authors

Journals

citations
Cited by 7 publications
(7 citation statements)
references
References 26 publications
0
4
0
3
Order By: Relevance
“…Em seguida, são apresentados os estudos de casos da metodologia proposta, onde o objetivoé identificar a influência provocada pela alteração nos parâmetros: taxa de aprendizado e fator de desconto. O estudo de caso 01 (α = 0,125 e γ = 0,9) refere-se a uma combinação de parâmetros adotada com frequência em aplicações do AR no futebol de robôs (Celiberto Jr et al, 2012;Berton and Bianchi, 2015). Já outros estudos de casos, são variações das configurações de α e γ, a fim de ilustrar a capacidade da interface em mostrar influência experimental desses parâmetros no aprendizado.…”
Section: Metodologia Experimentalunclassified
See 1 more Smart Citation
“…Em seguida, são apresentados os estudos de casos da metodologia proposta, onde o objetivoé identificar a influência provocada pela alteração nos parâmetros: taxa de aprendizado e fator de desconto. O estudo de caso 01 (α = 0,125 e γ = 0,9) refere-se a uma combinação de parâmetros adotada com frequência em aplicações do AR no futebol de robôs (Celiberto Jr et al, 2012;Berton and Bianchi, 2015). Já outros estudos de casos, são variações das configurações de α e γ, a fim de ilustrar a capacidade da interface em mostrar influência experimental desses parâmetros no aprendizado.…”
Section: Metodologia Experimentalunclassified
“…Já o trabalho de Fabro et al (2013), compreende uma discretização dos estados com base no posicionamento dos jogadores em relação a bola e aos oponentes. Em outros trabalhos, heurísticas são aplicadas na busca por desempenho do algoritmo de AR (Celiberto Jr et al, 2012). No entanto, apesar da relevância do AR para o futebol de robôs, a literatura ainda carece de ferramentas para a execução de algoritmos de aprendizado e a análise de jogos da Simulação 2D.…”
Section: Introductionunclassified
“…The approach has proven effective in a number of domains. Celiberto et al [2] proposed a heuristic exploration function through case-based reasoning and Bianchi et al [3] transferred existing similar cases or trajectories to heuristics. Bianchi et al [4] also proved the convergence of heuristic exploration and the boundary of error estimation in theoretical analysis.…”
Section: Introductionmentioning
confidence: 99%
“…Similar combinations of RL and CBR have already been successfully applied to various decision problems, e.g. dynamic inventory control (Jiang and Sheng, 2009), RoboCup Soccer (Celiberto et al, 2012) and control of a simulated mountain car (Bianchi et al, 2015). For example, Jiang and Sheng (2009) propose an effective case-based RL algorithm, where CBR is used for analysing the similarity between different states of a dynamic multi-agent RL problem.…”
Section: Introductionmentioning
confidence: 99%
“…For example, Jiang and Sheng (2009) propose an effective case-based RL algorithm, where CBR is used for analysing the similarity between different states of a dynamic multi-agent RL problem. Celiberto et al (2012) and Bianchi et al (2015) develop transfer learning algorithms that transfer knowledge between similar learning tasks whilst using CBR to make this process faster. However, the only example of applying this methodology in the wireless communications domain is proposed by us in (Morozs et al, 2013).…”
Section: Introductionmentioning
confidence: 99%