面向tableau模型的逻辑强化学习理论及方法研究

基本信息
批准号:61070223
项目类别:面上项目
资助金额:35.00
负责人:刘全
学科分类:
依托单位:苏州大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:孙涌,陈冬火,鲜学丰,张广铭,傅启明,闫其粹,张乐
关键词:
Deep维数灾Webtableau模型逻辑强化学习
结项摘要

典型的强化学习算法采用状态- - 活动对来表示行为策略,因而不可避免地出现学习参数个数随着状态变量维数呈指数级增长的现象,即"维数灾",这一问题严重制约着强化学习在实际中的应用。本项目拟针对强化学习中存在"维数灾"的问题,提出面向tableau模型的逻辑强化学习方法,并应用于Deep Web信息搜索中。主要思想是将强化学习与归纳逻辑程序设计相结合,采用逻辑语言表示状态和活动等方面的知识,使用tableau模型简化状态空间,达到更大程度地提高强化学习算法收敛速度的目的。因此面向tableau模型的逻辑强化学习的研究,可以有效地解决强化学习中的"维数灾"的问题,对于强化学习在大规模网络信息搜索中的应用,既具有一定的理论价值,又有广阔的应用前景。

项目摘要

本项目针对强化学习中存在“维数灾”的问题,提出基于tableau模型的逻辑强化学习方法,并应用于Deep Web信息搜索中。主要完成了以下五方面内容:.⑴ 将强化学习与归纳逻辑程序设计相结合,对强化学习算法中的状态、活动用逻辑表达式进行抽象。充分利用归纳逻辑程序设计语言的谓词、表、截断等的优势,建立起强化学习状态之间的逻辑关系,简化活动策略的选择,提高强化学习的收敛速度。.⑵ 采用tableau推理模型对逻辑状态和逻辑活动进行建模,研究一种新的函数估计模型,使其一方面能够以任何精度逼近理论的强化学习值函数,另一方面在增量环境中保证收敛性。.⑶ 将布尔剪枝、IP-tableau等方法与逻辑强化学习相结合,对逻辑状态空间模型进行相应的等价转换,采用解线性方程组的方式来简化状态空间,降低状态空间维数,解决大规模、连续的MDP问题。在tetris问题中,试验所设计的强化学习框架和算法,并对比收敛速度。.⑷ 结合我们所研究的模型和算法,研究一种面向Deep Web搜索引擎的自适应爬虫搜索算法。在模型不确定的情况下,寻找满足搜索算法的优化目标的最优策略,达到爬虫总搜索路径最短、搜索无关页面最低等,并在性能上对比目前常用的几种爬虫调度算法。.⑸ 设计实现上述理论、优化算法的系统原型,并应用于Deep Web搜索引擎中,实现对Deep Web搜索的策略优化。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

Vibration suppression of drilling tool system during deep-hole drilling process using independence mode space control

Vibration suppression of drilling tool system during deep-hole drilling process using independence mode space control

DOI:10.1016/j.ijmachtools.2020.103525
发表时间:2020
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

刘全的其他基金

批准号:31372430
批准年份:2013
资助金额:85.00
项目类别:面上项目
批准号:31672542
批准年份:2016
资助金额:61.00
项目类别:面上项目
批准号:61772355
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:51379164
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:10902078
批准年份:2009
资助金额:21.00
项目类别:青年科学基金项目
批准号:30972178
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:60907017
批准年份:2009
资助金额:22.00
项目类别:青年科学基金项目
批准号:60873116
批准年份:2008
资助金额:35.00
项目类别:面上项目
批准号:41505129
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:61272005
批准年份:2012
资助金额:61.00
项目类别:面上项目
批准号:81600783
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目
批准号:61472262
批准年份:2014
资助金额:82.00
项目类别:面上项目
批准号:81670343
批准年份:2016
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

基于模糊逻辑的大规模强化学习理论及方法

批准号:61472262
批准年份:2014
负责人:刘全
学科分类:F0201
资助金额:82.00
项目类别:面上项目
2

基于tableau的非经典逻辑经典化的自动定理证明研究

批准号:60873116
批准年份:2008
负责人:刘全
学科分类:F0201
资助金额:35.00
项目类别:面上项目
3

基于部分可观察模型的深度强化学习理论及方法

批准号:61876119
批准年份:2018
负责人:章宗长
学科分类:F0603
资助金额:62.00
项目类别:面上项目
4

基于部分感知模型的贝叶斯强化学习理论及方法

批准号:61772355
批准年份:2017
负责人:刘全
学科分类:F06
资助金额:65.00
项目类别:面上项目