为了应对信息爆炸带来的挑战,迫切需要一些自动化的技术帮助人们在海量数据中迅速找到自己真正需要的信息。信息抽取技术在自然语言处理领域正越发地体现出它的重要性。本课题将对信息抽取的关键支撑技术,即关系抽取任务,进行深入研究,指导计算机从自由文本中自动识别出实体之间的关系。当前国际上更多的是针对有监督学习的关系抽取技术的研究,这种技术通过训练样本的学习获得抽取模式,实现特定领域的关系抽取功能,因而需要对该知识领域较熟悉的人根据事先约定的规则来标记训练样本,同时需要足够数量的训练数据才能保证系统的抽取质量。为此,本课题积极探索面向开放领域的自动关系抽取技术,提出用多知识融合的手段来构建关系候选,建立基于图的关系抽取模型,并充分利用很容易获得的未标签样本的信息,在该图模型上进行非监督的学习,解决手工标注样本的困难,使其在各应用领域中都可扮演重要的角色,也为下一代基于自动问答的搜索引擎的发展奠定基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
低轨卫星通信信道分配策略
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
面向开放网络数据的多元关系抽取、表示与推理研究
面向开放域知识网络的实体语义关系抽取方法研究
开放域语义关系抽取、表示和计算关键技术研究
面向农业领域的维汉双语术语抽取的关键技术研究