2023年秋江苏开放大学强化学习★★综合大作业
试题列表
单选题
题型:单选题客观题分值5分难度:简单得分:5
1
在epsilon-greedy算法中,epsilon的值越大,采取随机动作的概率越(),采用当前Q函数最大动作的概率越()。
A
小,小
...
2023年秋江苏开放大学强化学习★★形考作业3
试题列表
单选题
题型:单选题客观题分值5分难度:简单得分:5
1
蒙特卡罗方法最大的问题是()
A
偏差大
B
偏差小
C
方差小
D
方差大
学生答案:D
老师点评:
题型:单选题...