基于生成模型的本体学习方法研究

基本信息
批准号:61602260
项目类别:青年科学基金项目
资助金额:21.00
负责人:朱曼
学科分类:
依托单位:南京邮电大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:高志强,陈兴国,刘倩,傅建仁,张继成,王玉婵
关键词:
语义网谓词发现生成模型本体学习
结项摘要

Ontology is crucial to the success of the Semantic Web. Ontology learning provides (semi-) automatic support for ontology construction, which effectively alleviates the time-consuming and labor-extensive issues of manual construction. Current researches are not sufficient because: (1) they mainly learn relationships among existing concepts and relationships, but they seldom go further on the ontological vocabularies, as a result, the knowledge coverage is bounded; (2) most of them are suitable for large, high-qualitative datasets, so their value in real-world applications is limited. This application study the ontology learning approaches based on generative models mainly because: firstly, generative models are suitable frameworks for handling hidden variables, which are important to ontology learning and vocabulary augmentation, secondly, generative models are adaptive to the scalability and quality of the datasets. This project will focus on these problems: (1) the transformation mechanisms between generative models and ontology axioms; (2) the constrained search of hidden variables in generative models. This study will not only meaningful to developing new theories to machine learning, ontology learning, but also providing techniques and theoretical supports to the knowledge discovery in other domains.

本体是语义Web成功的关键。本体学习为构建本体提供(半)自动支持,可以有效缓解手工构建本体耗时费力的问题。当前研究的不足在于:(1)现有方法大多学习已有概念、关系间的关系,很少对本体的词汇表进行扩展,使得本体中知识覆盖的范围受到局限;(2)已有方法大多适用于大规模的、或高质量的数据集,限制了本体学习方法的实际应用价值。本项目拟研究基于生成模型的本体学习方法,主要原因有两条:一方面生成模型易于处理隐藏变量,而隐藏变量在本体学习以及词汇表扩充方面很重要;另一方面生成模型对数据源的规模、数据源的质量有较强的适应性。本项目将着重探索以下两个问题:(1)本体生成模型与本体公理间的转换机理;(2)本体生成模型中隐藏变量的约束搜索。本课题的研究不仅对机器学习、本体学习的理论创新具有重要意义,也为其他应用领域的知识发现提供理论支撑和技术储备。

项目摘要

本体学习主要关注如何利用机器学习等方法为本体构建提供(半)自动支持,可以极大地缓解手工构建本体耗时费力的问题。本项目在执行期间研究了本体实例层及概念层公理学习的各个方面,现总结如下:.1.在本体概念层知识学习方面,项目组研究了隐藏概念的约束搜索问题,提出一种高效的前向后向算法发现本体中高“信息量”的谓词,从而使得本体更加紧凑;除此之外,我们研究了所发现的匿名谓词的标签搜索问题。项目组研究了深度学习模型M-RNNs,发现并证明了DAC准则;.2.在本体实例层知识学习方面,项目组提出利用基于解释的学习处理本体学习过程中普遍存在的长尾问题,特别针对已有方法采用的top 1策略无法得到最佳结果的问题,提出应用强化学习框架从top k中寻找最优解的方法;除此之外,项目组设计并实现了基于集成学习技术的预标注系统,提出基于回答集编程方法的比较性知识学习方法;.3.在本体学习的应用方面,项目组将所提出的方法和技术应用于医药信息学领域以及高考地理的自动问答中,取得了一定的效果。项目培养毕业本科生2名、硕士生2名以及博士生1名。..

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021

朱曼的其他基金

相似国自然基金

1

基于语义数据的迭代本体学习方法研究

批准号:61602259
批准年份:2016
负责人:季秋
学科分类:F06
资助金额:21.00
项目类别:青年科学基金项目
2

OWL DLP本体的学习方法研究

批准号:60773107
批准年份:2007
负责人:高志强
学科分类:F06
资助金额:8.00
项目类别:面上项目
3

面向领域本体的深度学习方法研究

批准号:61003204
批准年份:2010
负责人:刘桃
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目
4

基于归纳逻辑程序设计的本体学习方法

批准号:60873153
批准年份:2008
负责人:高志强
学科分类:F0211
资助金额:28.00
项目类别:面上项目