MDP - Return function.

Issues:

Are early rewards more valuable than later rewards?

Is the system “terminating” or continuous?

Previous slide Next slide Back to first slide View graphic version