最佳价值函数是()

A
搜索一种策略π ,使每个状态的价值最大,V∗ 就是到达每一个状态的极大值。
B
最佳策略使得最终状态的价值函数取得最大值。
C
每个马尔可夫决策过程的环境都是可解的,我们就可以得到一个最佳价值函数。
正确答案:A

评论0

请先
  • u******* 登录了本站
  • u******* 登录了本站
  • u******* 登录了本站
  • u******* 登录了本站
  • u******* 登录了本站
  • u******* 登录了本站
  • 游客 下载了资源 2019年420联考《行测》真题(云南卷)答案及解析
  • u******* 登录了本站
  • u******* 登录了本站
  • 游客 下载了资源 2013年广东公务员考试《行测》三卷答案及解析
  • 游客 下载了资源 2018年421联考《行测》真题(新疆卷)答案及解析
  • u******* 登录了本站
  • u******* 登录了本站
  • u******* 登录了本站
  • u******* 加入了本站
  • u******* 登录了本站
点击浏览器地址栏的⭐图标收藏本页
需要托管,代写作业,论文可以扫码加微信,也可以线上立即下单
显示验证码

社交账号快速登录

微信扫一扫关注
扫码关注后会自动登录