Algorithms - Open problems

to compute an optimal policy.

1. Non-trivial lower bounds.

2. Better upper bounds.

(for episodic MDP).

Previous slide Next slide Back to first slide View graphic version