This paper introduces recent developments in the analysis of inventory systems with partial observations. The states of these systems are typically conditional distributions, which evolve in infinite dimensional spaces over time. Our analysis involves introducing unnormalized probabilities to transform nonlinear state transition equations to linear ones. With the linear equations, the existence of the optimal feedback policies are proved for two models where demand and inventory are partially observed. In a third model where the current inventory is not observed but a past inventory level is fully observed, a sufficient statistic is provided to serve as a state. The last model serves as an example where a partially observed model has a finite dimensional state. In that model, we also establish the optimality of the basestock and (s, S) policies, hence generalizing the corresponding classical models with full information.
RésuméOn présente un certain nombre de modèles de systèmes de stocks avec information partielle. Ils sont formalisés comme des problèmes de contrôle où l'etat est une probabilité conditionnelle, dans un espace de dimension infinie. On introduit des probabilités non normalisées, permettant de transformer deséquations non linéaires enéquations linéaires. On peut alors montrer l'existence de feedbacks optimaux pour deux modèles où la demande et le stock sont partiellement observables. Dans un troisième modèle, le stock n'est pas observé, mais un stock antérieur est observé. Une statistique exhaustive est obtenue, et l'état est de dimension finie. Onétablit l'optimalité des politiques "stock de base" et (s, S), généralisant les modèles classiques avec information complète. * Recherche Opérationnelle/ Operations Research, présentée par Alain Bensoussan † Professeur Emerite, Université Paris Dauphine ‡ {alain.bensoussan, metin, sethi}@utdallas.edu
Version Française AbrégéeBien que la gestion des stocks aitété l'objet d'une littérature considérable, la situation où l'information est partielle n'a pratiquement pasété abordée jusqu'à présent. On montre, sur un certain nombre de modèles, comment l'idée très féconde des probabilités conditionnelles non normalisées, introduites dans le filtrage non linéaire par Zakaï peutêtre adaptée et permet d'établir l'existence de politiques optimales. Les problèmesà traiter sont du type suivantoù p(x|ξ) est la probabilité de transition d'une chaîne de Markov, z t est le processus observé, q t le contrôle adaptéà Z t−1 . π t (x) est une probabilité conditionnelle et représente l'état du système. L'équation de Bellman associée est donnée parLa linéarisation est obtenue par les equations (8), (10), (11) ci dessous. Un principe de contraction peut s'appliquerà (8) et permet de résoudre aussi (2), et d'obtenir un feedback optimal. Un problème beaucoup plus complexe est décrit par leséquations (25), (32), (33). Là aussi, la linéarisation simplifie considérablement, même si le principe de contraction ne s'applique plus. On prouve l'existence d'une solution maximale qu...