强化学习迁移技术及其在交互式游戏中的应用研究

基本信息
批准号:61175042
项目类别:面上项目
资助金额:58.00
负责人:高阳
学科分类:
依托单位:南京大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:曹迎春,余永红,陈兴国,史颖欢,金龑,江凯,顾小东,付强
关键词:
强化学习交互式游戏迁移学习强化学习迁移
结项摘要

在强化学习迁移技术中,研究出针对单源、多源、跨域、多Agent强化学习迁移的若干模型和相关算法。采用多示例学习、分层强化学习、强化学习函数估计、关系强化学习等具体研究手段,实现以上强化学习迁移算法。并利用算法信息理论对部分的迁移方法进行理论证明。将以上方法应用到交互式游戏领域中,实现游戏在规模变化、任务变化和角色变换时的强化学习迁移。.基于所研究成果,将在国际学术刊物、国际一流学术会议和国内一级刊物上发表论文15-20篇;申请专利3-4项;并使本课题在强化学习迁移技术方面的研究在国际上处于领先水平。

项目摘要

本课题针对现有的强化学习迁移技术存在的问题,重关注强化学习迁移技术模型、算法及应用。在本课题中,我们从强化学习迁移目标、强化学习迁移方法、强化学习迁移应用三个角度加以研究,并研究评价准则的适用性和相关迁移方法的理论证明。具体地,本课题在学习任务相似性度量、多智能体强化学习迁移方法、平均奖赏强化学习中迁移方法、基于核函数估计的强化学习等方面进行了深入的研究工作,这其中包括:(1)基于bisimulation状态距离的任务相似度度量方法及其迁移学习方法;(2)基于常数奖赏偏移值的学习算法;(3)基于核函数估计的在线选择性时间差分学习方法;(4)多智能体强化学习中的均衡迁移方法;(5)稀疏交互的多智能体系统中任务间相似度度量方法及其知识迁移方法;(6)本课题所提出的理论方法在俄罗斯方块、吃豆子等游戏中的应用。基于以上的研究工作,本课题共发表学术论文32篇,其中CCF-A类论文3篇,CCF-B类论文7篇,CCF-C类论文3篇,国内核心期刊论文9篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
3

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
4

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021
5

采用深度学习的铣刀磨损状态预测模型

采用深度学习的铣刀磨损状态预测模型

DOI:10.3969/j.issn.1004-132x.2020.17.009
发表时间:2020

高阳的其他基金

批准号:41601053
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:41501087
批准年份:2015
资助金额:23.00
项目类别:青年科学基金项目
批准号:50075011
批准年份:2000
资助金额:22.00
项目类别:面上项目
批准号:70572060
批准年份:2005
资助金额:17.00
项目类别:面上项目
批准号:51765001
批准年份:2017
资助金额:34.00
项目类别:地区科学基金项目
批准号:50575028
批准年份:2005
资助金额:27.00
项目类别:面上项目
批准号:11472299
批准年份:2014
资助金额:95.00
项目类别:面上项目
批准号:41304106
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:31801708
批准年份:2018
资助金额:27.00
项目类别:青年科学基金项目
批准号:70172015
批准年份:2001
资助金额:12.00
项目类别:面上项目
批准号:60775046
批准年份:2007
资助金额:27.00
项目类别:面上项目
批准号:41503031
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目
批准号:60103012
批准年份:2001
资助金额:18.00
项目类别:青年科学基金项目
批准号:61432008
批准年份:2014
资助金额:350.00
项目类别:重点项目
批准号:41705124
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:U1435214
批准年份:2014
资助金额:150.00
项目类别:联合基金项目
批准号:51705154
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:11904049
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:60475026
批准年份:2004
资助金额:23.00
项目类别:面上项目
批准号:51172033
批准年份:2011
资助金额:65.00
项目类别:面上项目
批准号:51608336
批准年份:2016
资助金额:21.00
项目类别:青年科学基金项目
批准号:81600744
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:81102382
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:51109213
批准年份:2011
资助金额:26.00
项目类别:青年科学基金项目
批准号:71071163
批准年份:2010
资助金额:28.00
项目类别:面上项目
批准号:51879267
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:10702077
批准年份:2007
资助金额:20.00
项目类别:青年科学基金项目
批准号:11172319
批准年份:2011
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

对抗负迁移:安全迁移学习及其应用研究

批准号:61876091
批准年份:2018
负责人:汪云云
学科分类:F0603
资助金额:16.00
项目类别:面上项目
2

基于支持向量机的增量式强化学习技术及其应用研究

批准号:61373094
批准年份:2013
负责人:伏玉琛
学科分类:F06
资助金额:77.00
项目类别:面上项目
3

迁移学习在图像分类中的应用研究

批准号:61300163
批准年份:2013
负责人:闫胜业
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目
4

强化学习关键技术及其在机器人行为学习中的应用

批准号:60974050
批准年份:2009
负责人:程玉虎
学科分类:F0310
资助金额:31.00
项目类别:面上项目