新型强化学习算法及应用研究

基本信息
批准号:60775046
项目类别:面上项目
资助金额:27.00
负责人:高阳
学科分类:
依托单位:南京大学
批准年份:2007
结题年份:2010
起止时间:2008-01-01 - 2010-12-31
项目状态: 已结题
项目参与者:申富饶,商琳,赵志宏,朱亮,赵波,葛屾,王皓,陈兴国,王巍巍
关键词:
Model智能NPC游戏平台Action关系强化学习基于核的强化学习传递学习
结项摘要

在强化学习问题中,研究出能够解决大规模强化学习问题的若干新型强化学习模型和相关算法。研究一种新的关系强化学习模型和算法;将关系强化学习模型应用到Action Model中,研究基于关系强化学习的Action Model学习算法;结合关系强化学习和 传递学习技术,设计满足传递学习任务要求的关系强化学习算法;研究基于核的强化学习算法,设计强化学习核函数选取策略,设计有效的Exploration算法。将以上研究的关系强化学习、基于核的强化学习、Action Model和传递学习应用到智能NPC游戏平台中,研究一个基于机器学习技术的面向第1人称射击类游戏的智能NPC游戏平台。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

Is long-term climate memory important in temperature/precipitation predictions over China?

Is long-term climate memory important in temperature/precipitation predictions over China?

DOI:https://doi.org/10.1007/s00704-018-2608-0
发表时间:2019
2

结直肠癌免疫治疗的多模态影像及分子影像评估

结直肠癌免疫治疗的多模态影像及分子影像评估

DOI:10.13609/j.cnki.1000-0313.2022.04.019
发表时间:2022
3

Characterization of the Driving Style by State-Action Semantic Plane Based on the Bayesian Nonparametric Approach

Characterization of the Driving Style by State-Action Semantic Plane Based on the Bayesian Nonparametric Approach

DOI:10.3390/app11177857
发表时间:2021
4

Research on parameter identification of Johnson–Cook constitutive model for TC17 titanium alloy cutting simulation

Research on parameter identification of Johnson–Cook constitutive model for TC17 titanium alloy cutting simulation

DOI:https://doi.org/10.1016/j.mtcomm.2022.103772
发表时间:2022
5

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020

高阳的其他基金

批准号:41601053
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:41501087
批准年份:2015
资助金额:23.00
项目类别:青年科学基金项目
批准号:50075011
批准年份:2000
资助金额:22.00
项目类别:面上项目
批准号:70572060
批准年份:2005
资助金额:17.00
项目类别:面上项目
批准号:51765001
批准年份:2017
资助金额:34.00
项目类别:地区科学基金项目
批准号:50575028
批准年份:2005
资助金额:27.00
项目类别:面上项目
批准号:11472299
批准年份:2014
资助金额:95.00
项目类别:面上项目
批准号:41304106
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:31801708
批准年份:2018
资助金额:27.00
项目类别:青年科学基金项目
批准号:70172015
批准年份:2001
资助金额:12.00
项目类别:面上项目
批准号:41503031
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目
批准号:60103012
批准年份:2001
资助金额:18.00
项目类别:青年科学基金项目
批准号:61432008
批准年份:2014
资助金额:350.00
项目类别:重点项目
批准号:41705124
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:U1435214
批准年份:2014
资助金额:150.00
项目类别:联合基金项目
批准号:51705154
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:11904049
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:60475026
批准年份:2004
资助金额:23.00
项目类别:面上项目
批准号:51172033
批准年份:2011
资助金额:65.00
项目类别:面上项目
批准号:61175042
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:51608336
批准年份:2016
资助金额:21.00
项目类别:青年科学基金项目
批准号:81600744
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:81102382
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:51109213
批准年份:2011
资助金额:26.00
项目类别:青年科学基金项目
批准号:71071163
批准年份:2010
资助金额:28.00
项目类别:面上项目
批准号:51879267
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:10702077
批准年份:2007
资助金额:20.00
项目类别:青年科学基金项目
批准号:11172319
批准年份:2011
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

量子强化学习理论、算法及应用

批准号:60703083
批准年份:2007
负责人:董道毅
学科分类:F0201
资助金额:20.00
项目类别:青年科学基金项目
2

基于值函数估计的强化学习算法研究

批准号:61403208
批准年份:2014
负责人:陈兴国
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目
3

面向不平衡数据的学习算法及应用研究

批准号:61070061
批准年份:2010
负责人:蒋盛益
学科分类:F0605
资助金额:32.00
项目类别:面上项目
4

基于深度强化学习的集群资源调度算法研究

批准号:61872397
批准年份:2018
负责人:肖臻
学科分类:F0204
资助金额:66.00
项目类别:面上项目