设计1个适合于MDP框架的示例任务，为每个任务确定其状态、行为和奖励。

江苏开放大学 297 领5金币 问题反馈反馈回复推广有佣金

每个MDP将被单独评分。评分标准为:
描述了一个MDP。（5分）
描述了MDP的状态。（5分）
描述了MDP的行动。（5分）
描述了MDP的回报。（5分）
示例：MDP的一个例子是自动驾驶汽车。状态将是汽车在每个时间步上获得的所有传感器读数:激光雷达、摄像机、剩余燃油量、当前车轮角度、当前速度、gps位置。动作可以是加速、减速、左转和右转。每一步的奖励可以是-1，这样agent就会被鼓励以尽快到达目标，但如果它违反了规则，奖励会是-10亿，这样它就知道不能这么做。

内容查看

查看价格2 元

VIP免费升级VIP

点点赞赏，手留余香给TA打赏

评论0

请先

游客下载了资源 2019下半年教师资格证考试《高中英语学科知识与教学能力》真题(含答案解析)5分钟前
游客下载了资源 2013年921公务员考试联考《申论》真题（河南、重庆卷）及参考答案5分钟前
游客下载了资源 2019年下半年教师资格证考试《综合素质》（小学）解析6分钟前
游客下载了资源 2004年国家录用公务员考试《申论》真题卷及答案6分钟前
游客下载了资源 2017年422公务员联考《申论》真题及参考答案（黑龙江公检法卷）7分钟前
游客下载了资源 2022年下半年教师资格证考试《初中美术》题解(OCR)7分钟前
游客下载了资源 2021年公务员多省联考《申论》题（河北乡镇卷）及参考答案7分钟前
游客下载了资源 2018年下半年教师资格证考试《初中美术》题解析8分钟前
游客下载了资源 2018年上半年教师资格证考试《教育知识与能力》（中学）真题（解析）9分钟前
游客下载了资源 2017年广东公务员考试《申论》真题卷及答案（县级）9分钟前
游客下载了资源 2019年上半年教师资格证考试《初中数学》真题解析10分钟前
游客下载了资源 2018下半年教师资格证考试《初中语文》真题(含答案解析)10分钟前
游客下载了资源 2012年广东公务员考试《申论》真题卷及答案10分钟前
游客下载了资源 2023年下半年教师资格证考试《高中英语》题解析10分钟前
游客下载了资源 2017年下半年教师资格证考试《初中地理》题解析10分钟前
游客下载了资源 2020年下半年教师资格证考试《高中历史》题（解析）（精选）10分钟前

作业代写
论文指导
繁简切换
返回顶部

需要托管，代写作业，论文可以扫码加微信