Semantic parsing is the core task of natural language processing and the key to realizing natural language understanding. Semantic parsing can positively promote the development of other tasks in natural language processing, and also provide technical support for intelligent search engines, intelligent applications, and intelligent robots. Semantic parsing transforms natural language into a computer computable language, which allows computers to understand natural language. However, the semantic parsing technology at this stage is not yet mature, especially after facing the open domain, there are many challenges. To this end, this research focuses on the key technologies of open domain semantic parsing based on semantic graph generation. The research contents and innovations include: 1. For open domain semantic parsing, a semantic graph based semantic representation system is proposed, which lays a foundation for semantic parsing research. 2. Proposing two semantic parsing models: Sequence-to-Action based and Sequence-to-MacroAction based; 3. To address the problem of insufficient corpus in open domain semantic parsing, a weakly supervised learning algorithm based on knowledge-driven optimized sampling strategy is proposed.
语义解析是自然语言处理的核心任务,也是实现自然语言理解的关键。语义解析能对自然语言处理其他任务的发展起积极地推动作用,也能为智能搜索引擎、智能应用和智能机器人等智能体提供技术支持。语义解析把自然语言转换成计算机可计算的语言,这使得计算机理解自然语言。然而现阶段的语义解析技术尚未成熟,特别是面向开放域后,存在诸多的挑战。为此,本课题围绕基于语义图生成的开放域语义解析关键技术展开研究。研究内容和创新之处包括:1. 针对开放域语义解析,提出了一种基于语义图的语义表示体系,为语义解析研究奠定基础;2. 提出了基于序列到动作的语义解析模型和基于序列到超动作的语义解析模型;3. 针对开放域语义解析中标注语料不足的问题,提出了基于知识驱动的优化采样策略的弱监督学习算法。
针对面向开放域语义解析问题,本项目确立以基于语义图生成的开放域语义解析为题,研究基于语义图的语义表示体系,探究弱监督学习算法手段,研究面向开放域的语义解析器的构建,为当前的语义解析难以面向开放域的挑战提供解决方案。本项目在语义表示、模型和学习算法三个方面对语义解析进行了研究:首先,语义表示是语义解析的基础,基于语义图的语义表示体系为面向开放域的语义解析奠定基础;然后利用神经网络模型的超强模拟能力,在基于序列到动作的开放域语义解析模型的基础上构建基于序列到超动作的开放域语义解析模型;为了更好地建模结构在语义解析中的作用,提出了基于结构转换的语义解析模型;针对语义表示的完整性和细粒度的特点,提出了基于多层次对比学习的语义解析模型;为了使上下文无关的语义解析模型能够直接运用于上下文有关的情境,如对话,提出了基于骨架指导的对话改写模型;最后,针对开放域语义解析模型需要大量标注语料,且标注语料难以获取的问题,提出了基于受限复述生成的无监督学习算法和基于数据合成和迭代更新的无监督学习算法。
{{i.achievement_title}}
数据更新时间:2023-05-31
肥胖型少弱精子症的发病机制及中医调体防治
针对弱边缘信息的左心室图像分割算法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于多色集合理论的医院异常工作流处理建模
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
开放域语义关系抽取、表示和计算关键技术研究
基于语义组合的开放域汉语复述研究
句法语义分析与开放域信息抽取融合技术研究
汉语框架语义依存图自动抽取关键技术研究