Mobile Robots - Control Architectures, Bio-Interfacing, Navigation, Multi Robot Motion Planning and Operator Training 2011
DOI: 10.5772/26620
|View full text |Cite
|
Sign up to set email alerts
|

Cooperative Reinforcement Learning Based on Zero-Sum Games

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1

Citation Types

0
0
0
2

Year Published

2015
2015
2016
2016

Publication Types

Select...
2
1

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(2 citation statements)
references
References 2 publications
0
0
0
2
Order By: Relevance
“…Algunos casos utilizan redes neuronales o lógica difusa para los sistemas de toma de decisiones (Jolly et al, 2010), (Chen et al, 2014), (Wu and Lee, 2004). (Hwang et al, 2011) combina aprendizaje por refuerzo y teoría de juegos para coordinación y selección de comportamientos. Otros trabajos se basan en la asignación de posiciones de juego (Yang and Jia, 2012), o máquinas de estado finito para la asignación de tácticas y roles (Lou et al, 2012).…”
Section: Introductionunclassified
“…Algunos casos utilizan redes neuronales o lógica difusa para los sistemas de toma de decisiones (Jolly et al, 2010), (Chen et al, 2014), (Wu and Lee, 2004). (Hwang et al, 2011) combina aprendizaje por refuerzo y teoría de juegos para coordinación y selección de comportamientos. Otros trabajos se basan en la asignación de posiciones de juego (Yang and Jia, 2012), o máquinas de estado finito para la asignación de tácticas y roles (Lou et al, 2012).…”
Section: Introductionunclassified
“…Para esto se toma información de juego como la distancia del balón a las porterías, las distancias lineales y angulares del jugador al balón o a jugadores oponentes. Otro trabajo implementado en la FIRA MiroSot League [51], presenta una estrategia de coordinación de fútbol de robots para la asignación de tareas y roles, envolviendo técnicas de Q-Learning con el fin de determinar la posición que los jugadores deben tomar. Los roles se asignan por criterios como el jugador más cercano al balón y otras situaciones del juego.…”
Section: Trabajos En Arquitecturas De Equipounclassified