Semantic parsing is the core task of natural language processing and the key to realizing natural language understanding. Semantic parsing can positively promote the development of other tasks in natural language processing, and also provide technical support for intelligent search engines, intelligent applications, and intelligent robots. Semantic parsing transforms natural language into a computer computable language, which allows computers to understand natural language. However, the semantic parsing technology at this stage is not yet mature, especially after facing the open domain, there are many challenges. To this end, this research focuses on the key technologies of open domain semantic parsing based on semantic graph generation. The research contents and innovations include: 1. For open domain semantic parsing, a semantic graph based semantic representation system is proposed, which lays a foundation for semantic parsing research. 2. Proposing two semantic parsing models: Sequence-to-Action based and Sequence-to-MacroAction based; 3. To address the problem of insufficient corpus in open domain semantic parsing, a weakly supervised learning algorithm based on knowledge-driven optimized sampling strategy is proposed.
语义解析是自然语言处理的核心任务,也是实现自然语言理解的关键。语义解析能对自然语言处理其他任务的发展起积极地推动作用,也能为智能搜索引擎、智能应用和智能机器人等智能体提供技术支持。语义解析把自然语言转换成计算机可计算的语言,这使得计算机理解自然语言。然而现阶段的语义解析技术尚未成熟,特别是面向开放域后,存在诸多的挑战。为此,本课题围绕基于语义图生成的开放域语义解析关键技术展开研究。研究内容和创新之处包括:1. 针对开放域语义解析,提出了一种基于语义图的语义表示体系,为语义解析研究奠定基础;2. 提出了基于序列到动作的语义解析模型和基于序列到超动作的语义解析模型;3. 针对开放域语义解析中标注语料不足的问题,提出了基于知识驱动的优化采样策略的弱监督学习算法。
针对面向开放域语义解析问题,本项目确立以基于语义图生成的开放域语义解析为题,研究基于语义图的语义表示体系,探究弱监督学习算法手段,研究面向开放域的语义解析器的构建,为当前的语义解析难以面向开放域的挑战提供解决方案。本项目在语义表示、模型和学习算法三个方面对语义解析进行了研究:首先,语义表示是语义解析的基础,基于语义图的语义表示体系为面向开放域的语义解析奠定基础;然后利用神经网络模型的超强模拟能力,在基于序列到动作的开放域语义解析模型的基础上构建基于序列到超动作的开放域语义解析模型;为了更好地建模结构在语义解析中的作用,提出了基于结构转换的语义解析模型;针对语义表示的完整性和细粒度的特点,提出了基于多层次对比学习的语义解析模型;为了使上下文无关的语义解析模型能够直接运用于上下文有关的情境,如对话,提出了基于骨架指导的对话改写模型;最后,针对开放域语义解析模型需要大量标注语料,且标注语料难以获取的问题,提出了基于受限复述生成的无监督学习算法和基于数据合成和迭代更新的无监督学习算法。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
开放域语义关系抽取、表示和计算关键技术研究
基于语义组合的开放域汉语复述研究
句法语义分析与开放域信息抽取融合技术研究
汉语框架语义依存图自动抽取关键技术研究