Domain ontologies play an important role in knowledge sharing and reuse. However, building such domain ontologies is a difficult task requiring many skills, especially when building Chinese domain ontologies due to the lack of a complete methodology. This research will integrate ontology learning methods into the ontology building process to complete the task of Chinese domain ontology building semi-automatically and efficiently. The research process includes 3 stages: (a) learning domain-specific concepts from explicit knowledge resources, including automatically extracting the domain terminology, discovering synonyms and formalizing these concepts; (b) learning ontology relations, including automatically discovering relevant concepts, naming and formalizing these ontology relations and pruning redundant relations; (c) semi-automantically building Chinese domain ontologies based on ontology learning methods.
领域本体是利用计算机实现知识共享和重用的基础,但是构建领域本体是一项困难的任务。由于缺乏完善的方法论支持,中文领域本体的构建尤为困难。本项目通过将本体学习方法集成到本体构建过程,半自动地高效地完成中文领域本体的构建任务。主要研究内容:(1)获取领域概念集合的本体学习方法,研究从电子化的显性知识源中自动提取领域专有术语的方法、自动甄别同义术语的方法、形式化地定义和描述概念的方法;(2)获取概念间关系集合的本体学习方法,研究从知识源中自动获取相关概念对的方法、命名和形式化本体关系的方法、甄别和剪枝冗余关系的方法;(3)研究基于本体学习的中文领域本体的半自动化构建方法。
领域本体在知识共享和语义检索等知识管理活动的应用前景日益明显,但构建领域本体是一项繁琐而困难的工程,人工构建效率低、结果差,阻碍了基于领域本体的应用的研发。为此,本项目以降低中文领域本体的构建难度为研究目标,结合统计学和自然语言处理的理论与方法,研究了一系列能够自动获取中文领域本体对象的本体学习方法,并研发相应的本体半自动构建方法及软件工具,以促进我国利用计算机来实施知识管理。.项目主要研究内容:.(1)研究了获取领域概念集合的本体学习方法。领域概念集合是领域本体的关键基础。本项目首先研究了从中文电子文档中自动提取词语的方法;分析领域专有术语在领域文档及非领域文档中出现的统计规律,研究了自动提取领域专有术语的方法;然后,研究了自动识别同义术语的方法,将每一组同义术语合并为一个领域概念。给定合适的中文电子文档集,这一系列方法能够以令人满意的性能自动地获取领域概念集合。.(2)研究了获取本体关系集合的本体学习方法。本体关系集合描述领域概念之间的语义关系,是领域本体的主要构成部分。基于领域概念集合,本项目首先采用语境分析和统计分析方法,研究了如何自动发现相关概念对;将其初步形式化为本体关系之后,研究了如何消除其中的冗余关系,得到领域本体的关系集合。给定合适的中文电子文档集,这一系列本体关系学习方法能够支持领域本体关系集合的自动构建。.(3)研发了一套中文领域本体的半自动构建软件工具。基于(1)和(2)所研发的中文领域本体学习方法,借鉴已有的本体学习工具,本项目设计实现了一个中文领域本体学习工具的原型系统。该原型系统主要包括3个模块:领域概念学习模块、本体关系学习模块和本体形式化模块。给定合适的中文电子文档集,该工具可用于领域本体的(半)自动构建。.项目主要研究结果:在给定合适的中文电子文档集的条件下,采用本项目所研发的一系列中文领域本体学习方法及半自动构建软件工具,能够自动地获取领域概念集合和本体关系集合,构建轻量级的领域本体。这些方法和软件均经多次实验和修改,主要性能指标比已有研究均有提高。自动构建所得到的轻量级本体可用于支持知识共享和语义检索等知识管理活动。若应用所需为重量级本体,则将学习结果交由领域专家进行人工修正和完善。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
黄河流域水资源利用时空演变特征及驱动要素
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
服务经济时代新动能将由技术和服务共同驱动
基于弱指导机器学习技术的中文领域本体非分类关系自动学习研究
基于主动学习的半监督领域本体自动构建
面向领域本体的深度学习方法研究
领域本体的自适应学习及其评估方法研究