蒙特卡洛方法是基于采样的方法,它()。 严~ 选择题 2024-08-14 24 0 A 从不完整序列上进行学习。 B 需要全部执行完之后,到了终止状态之后,再更新价值。 C 可以在连续的环境下(没有终止)进行学习。 D 利用了马尔可夫性质。 正确答案:B 评论0 请先 登录
评论0