Algorithms -Optimal control Example

g = 1/2

d(si,a)= si+a

p random

Qp(s0,-1) = 13/6

Previous slide Next slide Back to first slide View graphic version