请在 下方输入 要搜索的题目:

Q(s,a)是指在给定状态s的情况下,采取行动a之后,后续的各个状态所能得到的回报( )。


A、总和
B、最大值
C、最小值
D、期望值

发布时间:2023-07-26 00:49:22
推荐参考答案 ( 由 搜搜题库网 官方老师解答 )
联系客服
答案:
专业技术学习
搜搜题找答案
用户信息
没有账号?点我注册
专业技术学习
登录 - 搜搜题库网
立即注册
注册 - 搜搜题库网
验证码
立即登录