In response to the emergent needs of natural language processing in the big data era, this project aims to explore novel approximate semantic computing theories and approaches based on knowledge linking from the following five perspectives:1) propose “entity-event relation networks”, to provide a unified description for both static and dynamic knowledge in knowledge bases and natural language texts from multiple sources, model the combination of logic expressions and representation learning, in order to support multi-source heterogeneous knowledge fusion and uncertain textual inference and computation; 2) investigate deep knowledge fusion approaches with the focus on semantic linking to build fundamental knowledge foundations for open-domain text computation;3)Exploit knowledge bases and information redundancy in texts to generate weakly annotated data, and investigate open-domain text computation approaches through knowledge-driven representation learning, to provide cutting-edge techniques for deep text understanding;4) investigate the approaches of link prediction on large-scale knowledge bases and open-domain textual inference based on the combination of logic reasoning and representation learning,to shed light on new directions of semantic computation;5) build a Chinese deep Question Answering system and evaluation platform,to verify the proposed knowledge linking, text semantic computation and knowledge inference approaches. The research outcome of this project will provide key technical support for critical applications such as e-learning and intelligent health care.
本项目面对大数据时代自然语言处理的需求,以探索一种基于知识关联的近似语义计算理论和方法为目标,在以下五方面展开研究:(1)提出“实体-事件关系网络”,对多源知识库和自然语言文本中的静态和动态知识进行统一描述,并利用逻辑表达和表示学习相结合的方法进行建模,支撑多源异构知识的融合和不确定性文本推理计算;(2)研究以语义关联为核心的知识深度融合方法,为开放域文本计算建立基础知识设施;(3)利用知识库和文本的冗余信息构建弱标注数据,以知识引导的表示学习为手段,研究开放域文本语义分析方法,为文本内容理解提供关键技术;(4)研究融合逻辑推理和表示学习的大规模知识库链接预测和开放域文本推理方法,支持新知识发现和文本深层语义理解,为语义计算探索新途径;(5)建立中文开放域深度问答系统及应用测试平台,对知识关联和文本语义计算方法进行应用验证。本项目的研究成果可为在线教育、智慧医疗等重大应用提供核心技术支撑。
本项目面对大数据时代自然语言处理的需求,以探索一种基于知识关联的近似语义计算理论和方法为目标,在以下五方面展开研究:(1)提出“实体-事件关系网络”,对多源知识库和自然语言文本中的静态和动态知识进行统一描述,并利用逻辑表达和表示学习相结合的方法进行建模,支撑多源异构知识的融合和不确定性文本推理计算;(2)研究以语义关联为核心的知识深度融合方法,为开放域文本计算建立基础知识设施;(3)利用知识库和文本的冗余信息构建弱标注数据,以知识引导的表示学习为手段,研究开放域文本语义分析方法,为文本内容理解提供关键技术;(4)研究融合逻辑推理和表示学习的大规模知识库链接预测和开放域文本推理方法,支持新知识发现和文本深层语义理解,为语义计算探索新途径;(5)建立中文开放域深度问答系统及应用测试平台,对知识关联和文本语义计算方法进行应用验证。主要研究成果包括:(1)在学术成果方面:出版专著1本,在国内外重要学术会议和期刊上共发表论文127篇,其中国际学术期刊和会议上共发表论文88篇,国内学术期刊和会议上发表论文39篇,CCF-A类46篇, CCF-B类26篇,申请发明专利26项,授权4项;(2)基础资源方面:构建了开放、链接的大规模语义链接知识库两个(以事件为核心的大规模多元知识图谱CogNet-1.0,大规模跨语言知识图谱XLORE);(3)系统和评测方面:构建了大规模链接知识资源的中文开放域深度问答系统及测试平台2个。参加相关国际评测4个并获得优秀成绩,构建了文本语义分析、问句语义分析、知识库补全、文本推理以及深度问答测试数据集合8个,启动了国际化中文深度语义理解及深度问答公开评测5个;(4)学术奖励方面:获得北京市科学技术进步奖一等奖2项、中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖1项、最佳论文奖7项。本项目的研究成果可为在线教育、智慧医疗、智能金融、智慧通信等重大应用提供核心技术支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
面向汉语文本理解的语义计算方法
多知识源下概念语义相似度或关联度计算方法及其评价
面向词汇功能的学术文本语义识别与知识图谱构建
面向特定领域文本的知识元及其关联挖掘方法研究