基于多维向量的动作模型表示及其学习方法的研究

基本信息
批准号:61906216
项目类别:青年科学基金项目
资助金额:25.00
负责人:萧展豪
学科分类:
依托单位:中山大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
动作模型学习规划系统数值变量启发式函数学习智能规划
结项摘要

AI planning techniques often require an action model as input, which is designed by the knowledge engineer. It generally is a difficult task, which requires the knowledge engineer to have the qualified domain knowledge and to spend a lot of time. However, the traditional approaches to learning deterministic action models are based on the classical planning language, such as STRIPS and PDDL. .On one hand, whether a plan can be computed by the planner based on this planning language is sensitive to the accuracy of the learned domain model and it may fail if some critical effects are not learned correctly. On the other hand, numeric variables, which exist commonly in the real-world scenarios, are omitted in these traditional approaches and it has become the bottleneck of AI planning applications. For that, different from these declarative planning languages, we aim to study the vectorization representation for the action models with numeric variables and study how to learn the action models from the partially observed plan traces. It contributes to implementing a planning system to solve new planning problems. Furthermore, based on the vectorization of states, we study how to learn goal-driven heuristic function to speed up the problem-solving. Finally, our approaches overcome the difficulties of constructing action models in a hand-coded way, which leads to promoting AI planning to the applications in the real world.

应用智能规划技术来解决实际问题需要构建相应的动作模型,而人工建立动作模型对知识工程师的专业领域知识要求很高,而且需要投入的大量时间。因此,研究动作模型获取方法是十分有必要的。然而,一方面,已有的确定性动作模型获取方法大都基于如STRIPS、PDDL等声明式经典规划语言,而基于这些规划语言的规划求解对动作模型的准确性要求很高,若学习得到的动作模型不准确,往往无法求得一个有效的规划解。另一方面,在实际问题中广泛存在的数值变量却被这些动作模型获取方法忽略了,这已经成为了智能规划技术在实际问题上的应用瓶颈。为此,不同于这些声明式规划语言,本项目研究基于多维向量的动作模型表示方法,同时研究如何从部分观测的规划轨迹中自动学习带数值变量的动作模型,使规划系统能够解决同领域内的新的规划问题。而基于向量化表示的状态,研究如何学习目标状态导向的启发式函数,来辅助求解规划问题,促进智能规划技术的推广应用。

项目摘要

应用智能规划技术来解决实际问题需要构建相应的动作模型,而人工建立动作模型对知识工程师的专业领域知识要求很高,而且需要投入的大量时间。因此,研究动作模型获取方法具有重要的研究意义和应用前景。然而,已有的确定性动作模型获取方法大都基于如STRIPS等声明式经典规划语言,而基于这些规划语言动作模型对准确性要求很高,学习得到的动作模型往往无法应用于实际问题中。.为此,不同于这些声明式规划语言,本项目研究基于多维向量的鲁棒性更强的动作模型表示方法,提出一套面向部分观察的结构化规划轨迹的动作模型学习方法,通过多维实数向量表示的动作模型更新模式来增强规划系统的鲁棒性,避免因为符号化表示的动作模型中的错误而导致的规划失败,从而能够解决更多的规划问题。本项目提出的动作模型学习方法将能够减轻领域专家的建模工作以及调试时间,降低人工建立动作模型的耗费,促进智能规划技术在更多的领域上的推广应用。.同时,本项目一套基于深度神经网络启发式学习的规划方法,利用以目标为导向的启发式函数来辅助规划,帮助基于多维实数向量的规划系统求解规划实例,提高规划效率以及规划解的质量,进一步促进智能规划技术的落地应用。.另外,本项目还将动作模型学习的思想推广到层次任务网络规划,提出了一个基于偏好的层次任务网络规划模型学习方法,从规划轨迹中学习并补全层次任务网络规划方法模型,用于解决新层次任务网络规划实例。此外,本项目探究符号表示以及实数向量结合的推理方法,提出了一个基于符号规划与深度神经网络相融合的启发式函数学习方法,通过梯度下降的方法学习选择最优的动作参数,实现面向任意障碍物的环境的路径规划算法。.本项目基本按照预定计划开展研究,总体上依原定计划实施,较好地完成了项目研究任务。在本项目支持下围绕本项目的相关研究问题,本项目申请人已经发表5篇高质量论文以及一项科研奖励(中国电子学会科技进步奖三等奖),其中3篇发表在CCF推荐A类会议和期刊上。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
4

带有滑动摩擦摆支座的500 kV变压器地震响应

带有滑动摩擦摆支座的500 kV变压器地震响应

DOI:10.13336/j.1003-6520.hve.20200528028
发表时间:2021
5

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020

萧展豪的其他基金

相似国自然基金

1

多源多维感知数据向量化表达与分布式认知学习方法研究

批准号:61902167
批准年份:2019
负责人:罗海波
学科分类:F0201
资助金额:22.00
项目类别:青年科学基金项目
2

基于人体姿态表示的动作识别方法研究

批准号:61272321
批准年份:2012
负责人:王亮
学科分类:F0210
资助金额:80.00
项目类别:面上项目
3

基于多模态融合的语义表示学习方法

批准号:61872113
批准年份:2018
负责人:陈清财
学科分类:F0211
资助金额:64.00
项目类别:面上项目
4

多维信号结构保真的矢量稀疏表示模型研究

批准号:61671298
批准年份:2016
负责人:徐奕
学科分类:F0117
资助金额:58.00
项目类别:面上项目