MDP model - summary

- set of k actions, |A|=k.

- transition function.

- immediate reward function.

- policy.

- discounted cumulative return.

Previous slide Next slide Back to first slide View graphic version