Learning - Model Based

(approximates each transition d(s,a,s’) well.)

(Sufficient to approximate optimal policy.)

[KS, NIPS’98]

Previous slide Next slide Back to first slide View graphic version