A la memoria de mi papá, Ing. Felipe García Cardona (1931.A Guillermo, mi esposo. A Guillermo, Jessy y Edgar, mis hijos.A Carolina, mi mamá. "En lugar de preocuparnos acerca de si una máquina puede ser inteligente, es más importante desarrollar software que sea realmente inteligente".Oliver G. Selfridge "La inteligencia artificial de hoy en día se centra en buscar nuevas maneras de conectar personas con ordenadores, personas con conocimiento, personas con el mundo físico y personas con personas".
ResumenEl problema de resolver grandes procesos de decisión de Markov con precisión y rapidez ha conducido a un reto computacional. Dado que el esfuerzo computacional es considerable, la investigación actual se centra en la búsqueda de técnicas superiores de aceleración. Por ejemplo, las propiedades de convergencia de los métodos de solución actuales dependen, en gran medida, del orden de las operaciones de actualización. Por un lado, algoritmos tales como el de ordenamiento topológico han sido capaces de encontrar buenos ordenamientos, pero sus costes de inicio han sido usualmente altos. Por otro lado, los métodos de ruta más corta tales como el clásico algoritmo de Dijkstra, que está basado en colas de prioridad, han sido aplicados exitosamente a la solución de procesos de decisión de Markov de ruta determinística más corta. Aquí se propone un nuevo algoritmo de iteración de valor basado en el algoritmo de Dijkstra para resolver procesos de decisión de Markov de ruta estocástica más corta. Los resultados experimentales obtenidos en un problema de estrategias de navegación marítima muestran la factibilidad del enfoque propuesto.
ix
AbstractThe problem of solving large Markov decision processes accurately and quickly has led to a computational challenge. Since the computational effort is considerable, current research focuses on finding superior acceleration techniques. For instance, the convergence properties of current solution methods depend, to a great extent, on the order of backup operations. On one hand, algorithms such as a topological sorting are able to find good orderings, but their overhead is usually high. On the other hand, shortest path methods, such as Dijkstra's algorithm which is based on priority queues, have been applied successfully to the solution of deterministic shortest-path Markov decision processes. Here, we propose a new value iteration algorithm based on Dijkstra's algorithm for solving shortest-path Markov decision processes. The experimental results on a sailing strategies problem show the feasibility of our approach.