(Pontificia Universidad Católica del Perú, 1994) García-Cobián Jáuregui, Ramón
l. Introducción: El problema típico por considerar es el de un agente que a partir de un "hoy" tiene que decidir cada día qué "estado" ocupar; tales decisiones han de estar sujetas a ciertas restricciones previamente dadas, las cuales pueden depender de cuál haya sido el último estado ocupado. Además, cada decisión recibe una remuneración, la que también puede depender del último estado ocupado. El problema del agente consiste en hallar la senda óptima de decisiones que maximice la suma de los valores descontados de las retribuciones desde hoy en adelante.