Social network has become an important medium for people to communicate with each other on the Web. With the increase of social activities on the Web, social data is growing explosivley, which has become one of the important sources for people to acquire information. The results for the semantic analysis of social data has become an important foundation for network monitoring, network detection,Web knowledge discovery, network behavior analysis, as well as information retrieval. However, semantic analysis of social network remains heterogeneity, scalability, and ambiguity problems. Therefore, we propose a social data-based ontology learning model to solve these problems. We first develop a domain-based social network topic model to model the social data in a heterogeneous environment, utilize transfer learning to extract concepts from different domains, use normalize informaiton distance to measure the semantic relations between concepts; second, we constuct a cloud computing-based ontology learning model to sovle the strong coupling and low reliability problems of large-scale ontology learning; third, we present a social network-based entity disambiguation method and propose a dynamic semantic relation credibility computing model based on the Dempster-Shafer theory and Shapley entropy. Based on the project, we will develop a set of well-established social network semantic analysis theory and algorithms.
社交网络已经成为人们通过网络进行信息活动的重要媒介,社交数据随着人们网络社交活动的增加呈现爆炸性的增长,已经成为互联网上的重要信息来源之一。针对社交数据的语义分析结果已经成为网络监督、网络侦测、网络知识发现、网络行为分析、以及网络信息检索等应用的重要基础。然而,针对社交数据的语义分析存在异构性、大规模性、以及歧义性等问题。因此,本项目通过构建基于社交数据的本体学习模型来解决以上科学问题。我们提出基于领域的社交网络话题模型对异构环境下的社交数据建模,采用迁移学习的方法对不同领域的关键概念进行抽取,基于规范信息距离衡量概念之间的语义关系;构建基于云计算的本体学习模型解决大规模本体学习的强耦合性和低可靠性问题;提出基于社交网络的实体去歧义化方法,基于Dempster-Shafer证据理论和Shapley 熵提出语义关系的动态可信度计算模型,从而实现一套对社交网络行之有效的语义分析理论和算法。
社交网络已经成为人们通过网络进行信息活动的重要媒介,社交数据随着人们网络社交活动的增加呈现爆炸性的增长,已经成为互联网上的重要信息来源之一。针对社交数据的语义分析结果已经成为网络监督、网络侦测、网络知识发现、网络行为分析、以及网络信息检索等应用的重要基础。然而,针对社交数据的语义分析存在异构性、大规模性、以及歧义性等问题。.因此,本项目通过构建基于社交数据的本体学习模型来解决以上科学问题。我们提出基于领域的社交网络话题模型对异构环境下的社交数据建模,采用迁移学习的方法对不同领域的关键概念进行抽取,基于规范信息距离衡量概念之间的语义关系,在此基础上,我们将语义关系融入到文本摘要模型中,在多个公开的标准评测集上的结果表明了我们所提出方法的优越性;构建基于云计算的本体学习模型解决大规模本体学习的强耦合性和低可靠性问题,在此基础上,我们对在线特征选择,文本聚类进行了改进,提升了对大规模社交数据的分析效果;提出基于社交网络的实体去歧义化方法,基于Dempster-Shafer证据理论和Shapley 熵提出语义关系的动态可信度计算模型,在此基础上,我们将社交网络的优化模型融入到推荐模型中,在多个真实的数据集上证明了所提出方法的有效性。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
基于本体学习与本体映射的组织异构数据融合方法研究
大数据环境下基于特征本体学习的无监督文本分类方法研究
大规模异构数据匹配的距离度量学习
大规模多源异构社交网络数据驱动的异常群体识别