新型强化学习算法及应用研究

基本信息

批准号：60775046

项目类别：面上项目

资助金额：27.00

负责人：高阳

学科分类：

依托单位：南京大学

批准年份：2007

结题年份：2010

起止时间：2008-01-01 - 2010-12-31

项目状态：已结题

项目参与者：申富饶,商琳,赵志宏,朱亮,赵波,葛屾,王皓,陈兴国,王巍巍

关键词：

Model智能NPC游戏平台Action关系强化学习基于核的强化学习传递学习

结项摘要

在强化学习问题中，研究出能够解决大规模强化学习问题的若干新型强化学习模型和相关算法。研究一种新的关系强化学习模型和算法；将关系强化学习模型应用到Action Model中，研究基于关系强化学习的Action Model学习算法；结合关系强化学习和传递学习技术，设计满足传递学习任务要求的关系强化学习算法；研究基于核的强化学习算法，设计强化学习核函数选取策略，设计有效的Exploration算法。将以上研究的关系强化学习、基于核的强化学习、Action Model和传递学习应用到智能NPC游戏平台中，研究一个基于机器学习技术的面向第1人称射击类游戏的智能NPC游戏平台。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：https://doi.org/10.1007/s00704-018-2608-0

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：10.3390/app11177857

发表时间：2021

DOI：https://doi.org/10.1016/j.mtcomm.2022.103772

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

高阳的其他基金

批准号：41601053

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：41501087

批准年份：2015

资助金额：23.00

项目类别：青年科学基金项目

批准号：50075011

批准年份：2000

资助金额：22.00

项目类别：面上项目

批准号：70572060

批准年份：2005

资助金额：17.00

项目类别：面上项目

批准号：51765001

批准年份：2017

资助金额：34.00

项目类别：地区科学基金项目

批准号：50575028

批准年份：2005

资助金额：27.00

项目类别：面上项目

批准号：11472299

批准年份：2014

资助金额：95.00

项目类别：面上项目

批准号：41304106

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：31801708

批准年份：2018

资助金额：27.00

项目类别：青年科学基金项目

批准号：70172015

批准年份：2001

资助金额：12.00

项目类别：面上项目

批准号：41503031

批准年份：2015

资助金额：22.00

项目类别：青年科学基金项目

批准号：60103012

批准年份：2001

资助金额：18.00

项目类别：青年科学基金项目

批准号：61432008

批准年份：2014

资助金额：350.00

项目类别：重点项目

批准号：41705124

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：U1435214

批准年份：2014

资助金额：150.00

项目类别：联合基金项目

批准号：51705154

批准年份：2017

资助金额：23.00

项目类别：青年科学基金项目

批准号：11904049

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：60475026

批准年份：2004

资助金额：23.00

项目类别：面上项目

批准号：51172033

批准年份：2011

资助金额：65.00

项目类别：面上项目

批准号：61175042

批准年份：2011

资助金额：58.00

项目类别：面上项目

批准号：51608336

批准年份：2016

资助金额：21.00

项目类别：青年科学基金项目

批准号：81600744

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：81102382

批准年份：2011

资助金额：22.00

项目类别：青年科学基金项目

批准号：51109213

批准年份：2011

资助金额：26.00

项目类别：青年科学基金项目

批准号：71071163

批准年份：2010

资助金额：28.00

项目类别：面上项目

批准号：51879267

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：10702077

批准年份：2007

资助金额：20.00

项目类别：青年科学基金项目

批准号：11172319

批准年份：2011

资助金额：60.00

项目类别：面上项目

相似国自然基金

量子强化学习理论、算法及应用

批准号：60703083

批准年份：2007

负责人：董道毅

学科分类：F0201

资助金额：20.00

项目类别：青年科学基金项目

基于值函数估计的强化学习算法研究

批准号：61403208

批准年份：2014

负责人：陈兴国

学科分类：F0603

资助金额：25.00

项目类别：青年科学基金项目

面向不平衡数据的学习算法及应用研究

批准号：61070061

批准年份：2010

负责人：蒋盛益

学科分类：F0605

资助金额：32.00

项目类别：面上项目

基于深度强化学习的集群资源调度算法研究

批准号：61872397

批准年份：2018

负责人：肖臻

学科分类：F0204

资助金额：66.00

项目类别：面上项目

新型强化学习算法及应用研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

Is long-term climate memory important in temperature/precipitation predictions over China?

结直肠癌免疫治疗的多模态影像及分子影像评估

Characterization of the Driving Style by State-Action Semantic Plane Based on the Bayesian Nonparametric Approach

Research on parameter identification of Johnson–Cook constitutive model for TC17 titanium alloy cutting simulation

智能煤矿建设路线与工程实践

高阳的其他基金

封育草地根系功能性状演变及其对土壤碳蓄积的作用机制

半干旱区沙地开发利用对生态系统服务的扰动及变化机制

超高温低能量湍流非转移弧热等离子体特性的研究

实现多级供货能力承诺的虚拟企业生产计划协同优化研究

珩轮齿面CBN涂层多磨粒微刃珩削加工特性研究

大功率双阳极等离子喷枪射流特性与涂层性能研究

层状准晶智能复合材料的力学行为研究

利用核磁共振测井进行页岩气储层评价的理论与方法研究

与马铃薯Y病毒HC-Pro蛋白互作的桃蚜口针受体蛋白的筛选鉴定

基于敏捷制造的多智能体协同生产管理及其系统研究

大别钼矿带斑岩型钼矿床含矿岩浆的性质和演化及其对钼成矿的制约：副矿物微量元素和同位素证据

多Agent信念修正理论研究

面向大数据的知识表示、推理、在线学习理论及应用研究

气候变化下我国华北地区热浪和静稳天气对臭氧影响的高精度区域模拟研究

面向大数据的知识表示、推理、在线学习理论及应用研究

高延展性石墨烯应变传感器及其性能衰变机理研究

贵金属超原子团簇与小气体分子的反应性理论研究

非马尔可夫决策过程中强化学习技术研究与应用

超低压等离子沉积新技术制备YSZ类柱状晶涂层生长机理研究

强化学习迁移技术及其在交互式游戏中的应用研究

铁路隧道衬砌脱空的裂损机理及其失稳前兆研究

介导VLDLR调节Wnt通路—非诺贝特治疗糖尿病视网膜病变的机制研究

Chitosan oligomers 用于改善蛋白质、肽类难吸收药物口服吸收及其吸收促进机制的研究

水、氮供应对间作群体种间相互作用的影响机理

不确定环境下再制造逆向物流网络的多周期多目标设计研究

干旱绿洲区核桃/小麦间作系统水热碳氮过程与耦合模拟

准晶弹性力学与精确的梁板理论

准晶材料的缺陷分析与失效行为研究

相似国自然基金