智能体在部分可观测马尔可夫环境下的激励学习研究

基本信息
批准号:60075019
项目类别:面上项目
资助金额:10.00
负责人:陈焕文
学科分类:
依托单位:长沙理工大学
批准年份:2000
结题年份:2003
起止时间:2001-01-01 - 2003-12-31
项目状态: 已结题
项目参与者:曹显兵,李峰,谢丽娟,李湘江
关键词:
部分可观测马尔可激励学习智能体
结项摘要

智能体在部分可观测马尔可夫环境下的学习问题是当今国际机器学习领域的一个难点与焦点问题,因此具有重要的理论价值。本课题主要研究:SARSA激励学习算法;部分可观测马尔煞蚧肪车奶卣鳎蛔刺氩呗缘谋泶锬P停蝗死嘌暗男睦硌笛榧盎驹恚欢嘀悄芴宓南嗷プ饔糜胙暗奈侍猓约八惴ǖ氖迪趾拖喙氐氖樟残浴⒏丛有灾っ鞯任侍狻

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
5

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018

陈焕文的其他基金

批准号:20505003
批准年份:2005
资助金额:25.00
项目类别:青年科学基金项目
批准号:21175019
批准年份:2011
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

马尔可夫决策规划

批准号:18700407
批准年份:1987
负责人:刘克
学科分类:A0504
资助金额:2.50
项目类别:青年科学基金项目
2

马尔可夫过程的精确大偏差

批准号:11226209
批准年份:2012
负责人:杨香凤
学科分类:A0211
资助金额:3.00
项目类别:数学天元基金项目
3

马尔可夫骨架过程及其应用

批准号:19871006
批准年份:1998
负责人:侯振挺
学科分类:A0210
资助金额:6.00
项目类别:面上项目
4

马尔可夫机制转换模型下信用估值调整的计算

批准号:11301369
批准年份:2013
负责人:董迎辉
学科分类:A0603
资助金额:22.00
项目类别:青年科学基金项目