常识获取一直被视为人工智能领域最重要和最困难的问题之一。在当前的研究中,其获取方式已逐步由人工编辑转向机器的半自动获取;面向的知识源也由人脑转向文本这一知识载体。.但是,目前的常识获取研究基本处于停滞状态,研究工作主要集中在获取上下位、整体部分等特殊关系;而对于因果知识这类重要的常识知识,尚未提出一个系统的获取和验证方法。已有工作一般是从封闭语料中获取因果知识,得到的知识数量较少,难以面向实际应用。. 针对这些问题,在已有工作的基础上,本课题将系统地研究从Web上获取因果常识知识的理论和方法,具体包括:(1)因果知识的表示方法;(2)因果知识在Web文本中的表达方式;(3)适于因果常识挖掘的语料获取和清洗方法;(4)因果事件的抽取方法;(5)因果知识的验证方法;(6)因果知识的扩充方法。通过该研究,我们旨在获取一个面向应用的大规模事件因果网络。
常识获取死人工智能中的基础性问题,研究从Web资源中自动或者半自动地获得常识的方法是解决这一问的重要途径。围绕该项目,我们在以下方面取得了成果:.1、在常识挖掘方法研究方面 . 1) 研究基于Web查询模式的因果关系抽取方法。面向Web的因果关系抽取分为因果关系的识别和提取两个阶段。实验表明,本文给出的Web查询模式的命中率和查全率较高,满足大规模因果知识获取对“数量”和“效率”的要求。. 2) 研究基于依存句法分析的事件抽取方法。针对因果事件的表示粒度问题,定义了一种事件五元组表示模型,并提出了基于依存句法分析的事件抽取方法。. 3) 研究因果知识的评估方法。为了保证因果知识获取的精度,从“正确性”和“因果性”两方面对已获取的知识进行评价。. 4) 研究基于类比学习的因果关系扩充方法。对于给定的目标事件,因果关系的类比学习过程包括类比事件的选择和相关事件的映射,其关键问题是事件相似度的度量。.2、在常识资源建设方面. 1) 定义了家庭本体:包括家庭中的各种角色、常见事件;同时定义了家庭角色之间的关系公理,完成了部分家庭事件的常识公理的设计工作。. 2) 定义了学校本体:包括学校中的各种角色、常见事件;同时定义了学习角色之间的关系公理,完成了部分学校事件的常识公理的设计工作。. 3) 以语义分类为核心,总结了各类事件的分类结构、描述文法,初步形成了一个以事件为核心的语义分类与描述框架。
{{i.achievement_title}}
数据更新时间:2023-05-31
服务经济时代新动能将由技术和服务共同驱动
中外学术论文与期刊的宏观差距分析及改进建议
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
环境信息披露会影响分析师盈余预测吗?
知识产权保护执法力度、技术创新与企业绩效 — 来自中国上市公司的证据
面向Web文本的属性和属性值知识获取方法研究
面向非结构化文本的领域知识获取方法的研究
基于用户知识情境的Web信息语义获取方法研究
一种新型的Web知识获取方法及其应用研究