智能体在部分可观测马尔可夫环境下的学习问题是当今国际机器学习领域的一个难点与焦点问题,因此具有重要的理论价值。本课题主要研究:SARSA激励学习算法;部分可观测马尔煞蚧肪车奶卣鳎蛔刺氩呗缘谋泶锬P停蝗死嘌暗男睦硌笛榧盎驹恚欢嘀悄芴宓南嗷プ饔糜胙暗奈侍猓约八惴ǖ氖迪趾拖喙氐氖樟残浴⒏丛有灾っ鞯任侍狻
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
农超对接模式中利益分配问题研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制
马尔可夫决策规划
马尔可夫过程的精确大偏差
马尔可夫骨架过程及其应用
马尔可夫机制转换模型下信用估值调整的计算