基于概率图的判别式关系隐层空间模型研究

基本信息
批准号:61305066
项目类别:青年科学基金项目
资助金额:26.00
负责人:陈宁
学科分类:
依托单位:清华大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:李岱峰,刘才良,徐旻捷,季剑秋,陈蓓,谢凌曦,张傲南
关键词:
非参数化贝叶斯推理最大间隔学习关系学习隐层空间模型
结项摘要

Latent subspace models could effectively discover latent feature representations of complex data, and they have been widely used in analyzing relational network data. In order to handle the large-scale complex relational network data widely available in the Internet, this project aims to address some key basic issues of probabilistic relational latent subspace models in the aspects of model representation, learning and inference, model complexity control, and etc. More specifically, this project proposes to do the following work to improve existing relational latent subspace models. First, to improve the expressiveness and flexibility on modeling both symmetric and asymmetric networks, as well as the networks with entity attributes, and to overcome the common issue of data imbalance, this project proposes to learn a generalized relational latent subspace model, by exploring the ideas of posterior regularization and introducing a regularization parameter to well balance the data. Second, to improve the ability in learning predictive latent feature representations and the prediction performance in various tasks (such as link prediction, recommendation, document retrieval, etc.), this project proposes to do discriminative learning for the generalized relational latent subspace model, and also to develop an "accurate" inference algorithm by exploring the statistical ideas of data augmentation. Finally, to avoid the highly inefficient model selection step of parametric models, this project proposes a nonparametric Bayesian approach to learning generalized relational subspace models, which can automatically resolve the number of hidden features according to the given data.

隐层空间模型可以有效发掘复杂数据的隐含特征表示,已广泛用于关系网络数据分析。面向互联网环境下的海量复杂关系网络数据,本项目拟系统解决基于概率图的关系隐层空间模型中存在的模型表示、学习与推理、以及模型复杂度等若干基础性关键问题。更具体地说,本项目将:(1)提出基于后验正则化的广义关系隐层空间模型,提高传统关系隐层空间模型在描述对称和非对称关系网络以及包含实体对象属性的关系网络数据的能力和灵活性,克服关系网络中广泛存在的数据不均衡问题;(2)提出关系隐层空间模型的判别式最大间隔学习方法以及基于数据增广统计思想的"精确"推理算法,提高关系隐层空间模型学习判别性的特征表示的能力及其在链接预测、网络推荐、文本检索等任务中的预测性能;(3)提出非参数化的广义关系隐层空间模型,自动确定隐含特征的数目(即模型复杂度),克服参数化隐层空间模型需要时间代价很高的模型选择的缺陷。

项目摘要

针对项目任务书的研究目标,本项目系统解决了基于概率图的关系隐层空间模型中存在的模型表示、学习与推理、以及模型复杂度等若干基础性关键问题,顺利完成各项研究任务,取得优良成果。具体地说,本项目:(1)提出了基于后验正则化的广义关系隐层空间模型,提高了传统关系隐层空间模型在描述对称和非对称关系网络以及包含实体对象属性的关系网络数据的能力和灵活性,克服了关系网络中广泛存在的数据不均衡问题;(2)提出了关系隐层空间模型的判别式最大间隔学习方法以及基于数据增广统计思想的"精确"推理算法,提高关系隐层空间模型学习判别性的特征表示的能力及其在链接预测、网络推荐、文本检索等任务中的预测性能;(3)提出了非参数化的广义关系隐层空间模型,自动确定隐含特征的数目(即模型复杂度),克服了参数化隐层空间模型需要时间代价很高的模型选择的缺陷。(4)提出了一种判别式的非参数化的隐含特征关系网络模型,可以自动推断出可能的隐特征维度,同时实现链接关系预测。在各种实际网络中的实验结果证明LFRM模型有广泛的应用场景和用途。(5)针对机器学习的基本问题特征提取,提出了一种简单而高效的方法:最大间隔数据偏移变换。该方法在原始数据中学习一个最大间隔分类器,通过建立一个特征抽取器,能够学习适用于分类任务的特征;(6)面向大数据的应用需求,提出了基于噪声扰动的支持向量机及罗杰斯特回归预测方法。该方法高效、简单,显著提高模型在二分类、多分类任务中的性能,有望用于海量复杂数据的预测任务中。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021

陈宁的其他基金

批准号:61272253
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:61273240
批准年份:2012
资助金额:81.00
项目类别:面上项目
批准号:51608193
批准年份:2016
资助金额:22.00
项目类别:青年科学基金项目
批准号:31571228
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:31101793
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:51203095
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:81000162
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:11575176
批准年份:2015
资助金额:56.00
项目类别:面上项目
批准号:61673241
批准年份:2016
资助金额:63.00
项目类别:面上项目
批准号:81302247
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目
批准号:81500959
批准年份:2015
资助金额:17.50
项目类别:青年科学基金项目
批准号:61271349
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:61074001
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:69973033
批准年份:1999
资助金额:12.00
项目类别:面上项目
批准号:81271109
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:61673399
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:11272159
批准年份:2012
资助金额:78.00
项目类别:面上项目
批准号:31700373
批准年份:2017
资助金额:26.00
项目类别:青年科学基金项目
批准号:31770053
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:81670966
批准年份:2016
资助金额:58.00
项目类别:面上项目
批准号:21702014
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:21905039
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:81870387
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:61771196
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:51905162
批准年份:2019
资助金额:23.00
项目类别:青年科学基金项目
批准号:69101006
批准年份:1991
资助金额:3.00
项目类别:青年科学基金项目
批准号:41603125
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:31771318
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:60903186
批准年份:2009
资助金额:17.00
项目类别:青年科学基金项目
批准号:81701251
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

基于概率图模型的复杂行为识别

批准号:61572500
批准年份:2015
负责人:张一帆
学科分类:F0210
资助金额:66.00
项目类别:面上项目
2

基于概率图模型的图像分割方法研究

批准号:U1404606
批准年份:2014
负责人:杨关
学科分类:F0210
资助金额:30.00
项目类别:联合基金项目
3

基于概率图模型的数据降维算法研究

批准号:61100158
批准年份:2011
负责人:王秀美
学科分类:F0605
资助金额:22.00
项目类别:青年科学基金项目
4

基于概率图的文本检索模型及算法研究

批准号:61462043
批准年份:2014
负责人:左家莉
学科分类:F0211
资助金额:46.00
项目类别:地区科学基金项目