Conventional social network analysis mainly focuses on homogeneous networks (i.e., networks with same type of objects and links). However, in real world, networked data often contain different types of objects and the links among them embody different semantics. Since heterogeneous information networks (i.e., network with different types of objects or links) constructed with these data can contain more comprehensive relations among objects and preserve more rich knowledge, it is promising to mine more accurate patterns on this type of networks. This proposal will analyze the challenges caused by complex network structure and rich semantic information of heterogeneous information networks. Based on heterogeneous networks with general network schema, this proposal will deeply study the clustering and related tasks by making full advantages of semantics contained in heterogeneous networks. The research content include: the semantic path based similarity computing, the clustering analysis under the complex network strucutre, and the clustering analysis on dynamic heterogeneous networks. By these study, we will explore how to handle heterogeneous objects and mine semantic relations in heterogeneous networks. This project will extend the social network analysis and systematicly propsoe the analysis method of heterogeneous information networks.
当前的社会网络分析主要针对同质网络(即网络中结点类型相同),但是现实世界中的网络化数据通常包含不同类型的对象,并且对象之间的关联表示不同的语义关系。构建异质信息网络(即包含不同类型的结点或边的网络)可以包含更加完整的对象之间的关联信息,因此分析这类网络有希望挖掘更加准确的模式。本课题以异质信息网络为对象,深入分析异质网络的复杂结构和丰富语义对数据挖掘带来的挑战。本课题将针对一般结构的异质信息网络,充分利用异质网络的语义信息,深入研究其中的聚类分析及其相关问题。具体研究内容包括:基于语义路径的相似性计算,基于复杂网络结构的聚类分析和动态异质网络的聚类分析。通过这些研究,探索一般结构的异质信息网络的异质对象处理方法和关系语义挖掘技术。本项目的研究成果将拓展社会网络分析的研究内容,并提出异质信息网络建模和分析方法。
社会网络分析在计算机科学领域,特别是数据挖掘领域,逐渐成为主流方向。当前的社会网络分析主要基于同质信息网络,随着在线社交媒体、信息物理系统的大量出现,对象相互关联形成的复杂网络很难用同质信息网络建模,需要建模成异质信息网络。复杂的网络结构和丰富的语义信息对基于异质信息网络的数据挖掘提出了严峻的挑战。本课题以异质信息网络为对象,通过研究其中的聚类分析及其相关任务,深入分析异质信息网络的异质对象处理和关系语义挖掘方法。主要研究内容包括:基于语义路径的相似性计算;基于复杂网络结构的聚类分析;基于异质信息网络的推荐方法。.本课题的主要代表性研究成果如下:(1)研究了异质信息网络中的相似性度量问题,提出了HeteSim标准用于度量异质信息网络中任意两个节点的相关性,提出了HRank方法度量节点和元路径的重要性;(2)提出基于网络分解的异质网络聚类方法HeProjI将异质信息网络分解成若干个简单的子网络后分而治之,更能适应实际网络化数据中复杂且不规则的结构;(3)提出基于异质信息网络的语义推荐方法SemRec,通过带权元路径灵活地整合异质信息,同时学到个性化权重来表达用户对路径的偏好,并进一步地提出一种可解释的语义个性化推荐方法;并研制了可解释的推荐系统RecExp;(4)在国际顶级期刊TKDE上发表了异质信息网络分析的第一篇综述论文;在Springer发表异质信息网络方向第一部英文专著。.总体来说,本项目按照计划执行,超额完成了研究目标。本项目的研究成果在国内外做特邀报告6次;举办国际研讨会4次;社交网络973项目结题将该成果选为代表性工作。在本项目的资助下,发表主要相关论文42篇,其中知名SCI国际期刊文章5篇,CCF A类论文2篇,B类论文6篇,C类论文10篇。取得1项软件著作权和9项发明专利。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
跨社交网络用户对齐技术综述
黄河流域水资源利用时空演变特征及驱动要素
内点最大化与冗余点控制的小型无人机遥感图像配准
城市轨道交通车站火灾情况下客流疏散能力评价
面向物联网数据的异质信息网络建模研究
异质信息网络的多粒度表示与知识获取方法研究
基于异质信息网络表征学习的社交媒体事件异常检测
大规模异质信息网络摘要和摘要可解释性研究