2018 IEEE 61st International Midwest Symposium on Circuits and Systems (MWSCAS) 2018
DOI: 10.1109/mwscas.2018.8623948
|View full text |Cite
|
Sign up to set email alerts
|

Control of a Two-Dimensional Magnetic Positioning System with Deep Reinforcement Learning and Feedback Linearization

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1

Citation Types

0
0
0
1

Year Published

2019
2019
2021
2021

Publication Types

Select...
2

Relationship

0
2

Authors

Journals

citations
Cited by 2 publications
(1 citation statement)
references
References 9 publications
0
0
0
1
Order By: Relevance
“…Neste tipo de aprendizagem, temos a realização de um mapeamento entrada-saída através da interação contínua com o ambiente, visando minimizar umíndice escalar de desempenho (Haykin, 2007). RL também tem sido incorporada em diversas técnicas de controle para sistemas lineares tanto na forma de compensação de dinâmica não modelada quanto no ajuste dos parâmetros dos controladores utilizados como nos trabalhos (Brinkmann et al, 2018;Kim et al, 2019;Pradeep et al, 2016;Zhu et al, 2015;Jardine et al, 2019;Yang et al, 2018;Bejar and Moran, 2019). A aprendizagem por reforçoé um subtópico dentro da aprendizagem de máquinas, porém não se assemelha com a aprendizagem supervisionada e não-supervisionada, sendo considerada o terceiro pilar da aprendizagem de máquinas.…”
Section: Introductionunclassified
“…Neste tipo de aprendizagem, temos a realização de um mapeamento entrada-saída através da interação contínua com o ambiente, visando minimizar umíndice escalar de desempenho (Haykin, 2007). RL também tem sido incorporada em diversas técnicas de controle para sistemas lineares tanto na forma de compensação de dinâmica não modelada quanto no ajuste dos parâmetros dos controladores utilizados como nos trabalhos (Brinkmann et al, 2018;Kim et al, 2019;Pradeep et al, 2016;Zhu et al, 2015;Jardine et al, 2019;Yang et al, 2018;Bejar and Moran, 2019). A aprendizagem por reforçoé um subtópico dentro da aprendizagem de máquinas, porém não se assemelha com a aprendizagem supervisionada e não-supervisionada, sendo considerada o terceiro pilar da aprendizagem de máquinas.…”
Section: Introductionunclassified