New prioritized value iteration for Markov decision processes

García-Hernández, Ma. de Guadalupe; Ruiz-Pinales, José; Onaindía, Eva; Aviña-Cervantes, Juan Gabriel; Ledesma, Sergio; Alvarado‐Méndez, E.; Reyes-Ballesteros, A.

doi:10.1007/s10462-011-9224-z

Cited by 6 publications

(3 citation statements)

References 20 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…Euler models Scientific computation [104] Statistical methods [105] [ 106,154] Graph theory Automata [124] Graph/complex network analysis [37,[108][109][110][111][112][113][114][115][116][117] Engineering methods…”

Section: Computational Sciencementioning

confidence: 99%

Survey of Scientific Programming Techniques for the Management of Data-Intensive Engineering Environments

Álvarez-Rodríguez

Alor-Hernández

Mejia-Miranda

2018

Scientific Programming

View full text Add to dashboard Cite

The present paper introduces and reviews existing technology and research works in the field of scientific programming methods and techniques in data-intensive engineering environments. More specifically, this survey aims to collect those relevant approaches that have faced the challenge of delivering more advanced and intelligent methods taking advantage of the existing large datasets. Although existing tools and techniques have demonstrated their ability to manage complex engineering processes for the development and operation of safety-critical systems, there is an emerging need to know how existing computational science methods will behave to manage large amounts of data. That is why, authors review both existing open issues in the context of engineering with special focus on scientific programming techniques and hybrid approaches. 1193 journal papers have been found as the representative in these areas screening 935 to finally make a full review of 122. Afterwards, a comprehensive mapping between techniques and engineering and nonengineering domains has been conducted to classify and perform a meta-analysis of the current state of the art. As the main result of this work, a set of 10 challenges for future data-intensive engineering environments have been outlined.

show abstract

Section: Computational Sciencementioning

confidence: 99%

Survey of Scientific Programming Techniques for the Management of Data-Intensive Engineering Environments

Álvarez-Rodríguez

Alor-Hernández

Mejia-Miranda

2018

Scientific Programming

View full text Add to dashboard Cite

show abstract

“…Este enfoque aplica una reglamentación de acciones y un nuevo enfoque de priorización de estados en el algoritmo de iteración de valor. Al enfoque propuesto se le denominó IPVI (Improved Prioritized Value Iteration) [Garcia-Hernandez, 2012a]. Para verificar la robustez del enfoque propuesto, en este capítulo se presenta su implementación en el simulador de planificación de movimientos robóticos (SPRM) de Reyes et al [Reyes, 2006b], en una tarea compleja de ruta estocástica más corta, la cual a continuación se describe.…”

Section: Preparación Del Ambiente De Pruebaunclassified

“…− el clásico algoritmo de iteración de valor (VI) [Puterman, 1994], − el algoritmo de iteración de valor con reglamentación de acciones (ARVI) [Garcia-Hernandez, 2009 [Dibangoye, 2008], − el algoritmo propuesto en esta tesis (IPVI) [Garcia-Hernandez, 2012a].…”

Section: Conclusiones Del Capítulounclassified

Simplificación de los procesos de decisión de Markov mediante reglamentación de acciones y priorización de estados

Hernández¹,

Guadalupe²

View full text Add to dashboard Cite

A la memoria de mi papá, Ing. Felipe García Cardona (1931.A Guillermo, mi esposo. A Guillermo, Jessy y Edgar, mis hijos.A Carolina, mi mamá. "En lugar de preocuparnos acerca de si una máquina puede ser inteligente, es más importante desarrollar software que sea realmente inteligente".Oliver G. Selfridge "La inteligencia artificial de hoy en día se centra en buscar nuevas maneras de conectar personas con ordenadores, personas con conocimiento, personas con el mundo físico y personas con personas". ResumenEl problema de resolver grandes procesos de decisión de Markov con precisión y rapidez ha conducido a un reto computacional. Dado que el esfuerzo computacional es considerable, la investigación actual se centra en la búsqueda de técnicas superiores de aceleración. Por ejemplo, las propiedades de convergencia de los métodos de solución actuales dependen, en gran medida, del orden de las operaciones de actualización. Por un lado, algoritmos tales como el de ordenamiento topológico han sido capaces de encontrar buenos ordenamientos, pero sus costes de inicio han sido usualmente altos. Por otro lado, los métodos de ruta más corta tales como el clásico algoritmo de Dijkstra, que está basado en colas de prioridad, han sido aplicados exitosamente a la solución de procesos de decisión de Markov de ruta determinística más corta. Aquí se propone un nuevo algoritmo de iteración de valor basado en el algoritmo de Dijkstra para resolver procesos de decisión de Markov de ruta estocástica más corta. Los resultados experimentales obtenidos en un problema de estrategias de navegación marítima muestran la factibilidad del enfoque propuesto. ix AbstractThe problem of solving large Markov decision processes accurately and quickly has led to a computational challenge. Since the computational effort is considerable, current research focuses on finding superior acceleration techniques. For instance, the convergence properties of current solution methods depend, to a great extent, on the order of backup operations. On one hand, algorithms such as a topological sorting are able to find good orderings, but their overhead is usually high. On the other hand, shortest path methods, such as Dijkstra's algorithm which is based on priority queues, have been applied successfully to the solution of deterministic shortest-path Markov decision processes. Here, we propose a new value iteration algorithm based on Dijkstra's algorithm for solving shortest-path Markov decision processes. The experimental results on a sailing strategies problem show the feasibility of our approach.

show abstract

Employing decomposable partially observable Markov decision processes to control gene regulatory networks

Erdoğdu

Polat

Alhajj

2017

Artificial Intelligence in Medicine

View full text Add to dashboard Cite

New prioritized value iteration for Markov decision processes

Cited by 6 publications

References 20 publications

Survey of Scientific Programming Techniques for the Management of Data-Intensive Engineering Environments

Survey of Scientific Programming Techniques for the Management of Data-Intensive Engineering Environments

Simplificación de los procesos de decisión de Markov mediante reglamentación de acciones y priorización de estados

Employing decomposable partially observable Markov decision processes to control gene regulatory networks

Contact Info

Product

Resources

About