您即将离开知乎,请注意您的账号和财产安全。
http://www.juyang.co/reinforcement-learning-ii-markov-decision-process-and-rl-agent/