异构环境下基于社交数据的大规模本体学习模型研究

基本信息
批准号:61375054
项目类别:面上项目
资助金额:79.00
负责人:郑海涛
学科分类:
依托单位:清华大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:夏树涛,袁博,郭振华,肖喜,刘鑫吉,逯彦博,王松涛,张一驰,吴文箴
关键词:
异构环境云计算社交网络迁移学习本体学习
结项摘要

Social network has become an important medium for people to communicate with each other on the Web. With the increase of social activities on the Web, social data is growing explosivley, which has become one of the important sources for people to acquire information. The results for the semantic analysis of social data has become an important foundation for network monitoring, network detection,Web knowledge discovery, network behavior analysis, as well as information retrieval. However, semantic analysis of social network remains heterogeneity, scalability, and ambiguity problems. Therefore, we propose a social data-based ontology learning model to solve these problems. We first develop a domain-based social network topic model to model the social data in a heterogeneous environment, utilize transfer learning to extract concepts from different domains, use normalize informaiton distance to measure the semantic relations between concepts; second, we constuct a cloud computing-based ontology learning model to sovle the strong coupling and low reliability problems of large-scale ontology learning; third, we present a social network-based entity disambiguation method and propose a dynamic semantic relation credibility computing model based on the Dempster-Shafer theory and Shapley entropy. Based on the project, we will develop a set of well-established social network semantic analysis theory and algorithms.

社交网络已经成为人们通过网络进行信息活动的重要媒介,社交数据随着人们网络社交活动的增加呈现爆炸性的增长,已经成为互联网上的重要信息来源之一。针对社交数据的语义分析结果已经成为网络监督、网络侦测、网络知识发现、网络行为分析、以及网络信息检索等应用的重要基础。然而,针对社交数据的语义分析存在异构性、大规模性、以及歧义性等问题。因此,本项目通过构建基于社交数据的本体学习模型来解决以上科学问题。我们提出基于领域的社交网络话题模型对异构环境下的社交数据建模,采用迁移学习的方法对不同领域的关键概念进行抽取,基于规范信息距离衡量概念之间的语义关系;构建基于云计算的本体学习模型解决大规模本体学习的强耦合性和低可靠性问题;提出基于社交网络的实体去歧义化方法,基于Dempster-Shafer证据理论和Shapley 熵提出语义关系的动态可信度计算模型,从而实现一套对社交网络行之有效的语义分析理论和算法。

项目摘要

社交网络已经成为人们通过网络进行信息活动的重要媒介,社交数据随着人们网络社交活动的增加呈现爆炸性的增长,已经成为互联网上的重要信息来源之一。针对社交数据的语义分析结果已经成为网络监督、网络侦测、网络知识发现、网络行为分析、以及网络信息检索等应用的重要基础。然而,针对社交数据的语义分析存在异构性、大规模性、以及歧义性等问题。.因此,本项目通过构建基于社交数据的本体学习模型来解决以上科学问题。我们提出基于领域的社交网络话题模型对异构环境下的社交数据建模,采用迁移学习的方法对不同领域的关键概念进行抽取,基于规范信息距离衡量概念之间的语义关系,在此基础上,我们将语义关系融入到文本摘要模型中,在多个公开的标准评测集上的结果表明了我们所提出方法的优越性;构建基于云计算的本体学习模型解决大规模本体学习的强耦合性和低可靠性问题,在此基础上,我们对在线特征选择,文本聚类进行了改进,提升了对大规模社交数据的分析效果;提出基于社交网络的实体去歧义化方法,基于Dempster-Shafer证据理论和Shapley 熵提出语义关系的动态可信度计算模型,在此基础上,我们将社交网络的优化模型融入到推荐模型中,在多个真实的数据集上证明了所提出方法的有效性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

郑海涛的其他基金

批准号:70901003
批准年份:2009
资助金额:18.50
项目类别:青年科学基金项目
批准号:61003100
批准年份:2010
资助金额:7.00
项目类别:青年科学基金项目
批准号:71873012
批准年份:2018
资助金额:48.00
项目类别:面上项目
批准号:71371021
批准年份:2013
资助金额:56.00
项目类别:面上项目
批准号:61773229
批准年份:2017
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

基于本体学习与本体映射的组织异构数据融合方法研究

批准号:71771054
批准年份:2017
负责人:于娟
学科分类:G0112
资助金额:46.00
项目类别:面上项目
2

大数据环境下基于特征本体学习的无监督文本分类方法研究

批准号:71571064
批准年份:2015
负责人:李岳峰
学科分类:G0112
资助金额:48.00
项目类别:面上项目
3

大规模异构数据匹配的距离度量学习

批准号:61502332
批准年份:2015
负责人:朱鹏飞
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目
4

大规模多源异构社交网络数据驱动的异常群体识别

批准号:61902308
批准年份:2019
负责人:刘晓明
学科分类:F0205
资助金额:32.00
项目类别:青年科学基金项目