What if?What if?
  • Machine Learning
  • Deep Learning
  • Reinforcement Learning
  • Statistical NLP
  • Linear Algebra
  • Information Theory
Dev
Papers
Snippets
  • Machine Learning
  • Deep Learning
  • Reinforcement Learning
  • Statistical NLP
  • Linear Algebra
  • Information Theory
Dev
Papers
Snippets
  • 基础

    • 基本概念
    • 马尔科夫决策过程
    • 贝尔曼方程
    • 基于模型的动态规划
  • 基于值函数的方法

    • 蒙特卡洛
    • 时间差分

# 蒙特卡洛

Edit this page on GitHub
Last Updated:

时间差分