The various information networks based on physical and virtual relationships can be represented by the heterogeneous information networks. How to identify the communities and their evolution, the clusters (e.g. topics) and their evolution hidden in the networks is a fundamental problem in many real applications, such as analysis of public opinions, the spread of the epidemics, and the research of academic trends, etc. This issue can be formulated as a problem of evolutionary clustering of heterogeneous information network. The big challenge of this problem lies in the following two aspects: (1) how to design reasonable method to fuse the complex heterogeneous objects, heterogeneous features and heterogeneous relationships in the heterogeneous network; (2) how to design evolutionary framework to improve the results of evolutionary clustering. To solving the two key issues, this project will first propose multiple tensors based representation model for heterogeneous information network, and then explore the following research issues: (1) the nonnegative factorization model of multiple tensors, which aims to solve the fusion of heterogeneous features and heterogeneous relationships; (2) exponential degradation based evolutionary framework, which is used to integrate the historical data and current data in the process of evolutionary clustering; (3) an evolutionary clustering algorithm, which enables us to identify the communities and their evolution, the clusters (e.g. topics) and their evolution; (4) an algorithm of detecting evolutionary trends of clusters, which is used to discover the hotspot trends of the clusters over time.
各种基于现实与虚拟关系的信息网络都可以表示成一个异构信息网络。如何在异构信息网络中找出社区结构及其演化、簇内容(如话题)及其演化是许多应用的基础问题,如舆情分析、流行病传播、学术趋势研究等。该问题可以形式化的映射为异构信息网络的演化聚类问题,其研究难点是:异构信息网络中包含复杂的异构对象、异构特征、异构关系,如何设计合理的异构融合方法和时序演化框架是提高异构信息网络演化聚类性能的关键。围绕着这两个核心问题,课题将提出基于多张量的异构信息网络表示模型,并在此基础上重点研究以下内容:(1)基于联合多张量非负分解模型,用于解决异构特征及关系融合问题;(2)基于指数退化的时序演化框架,用于解决演化聚类过程中历史数据和当前数据的融合问题;(3)异构信息网络的演化聚类算法,用于发现异构信息网络中社区结构及簇内容的演化;(4)簇(如话题)趋势检测算法,用于发现异构信息网络中簇随时间的热度趋势变化。
各种基于现实与虚拟关系的信息网络都可以表示成一个异构信息网络。如何在异构信息网络中找出社区结构及其演化、簇内容(如话题)及其演化是许多应用的基础问题,如舆情分析、流行病传播、学术趋势研究等。该问题可以形式化的映射为异构信息网络的演化聚类问题,其研究难点是:异构信息网络中包含复杂的异构对象、异构特征、异构关系,如何设计合理的异构融合方法和时序演化框架是提高异构信息网络演化聚类性能的关键。围绕着这两个核心问题,课题将提出基于多张量的异构信息网络表示模型,并在此基础上提出以下方法:(1)基于联合多张量/矩阵非负分解模型,用于解决异构特征及关系融合问题;(2)基于平滑演化的时序演化框架,用于解决演化聚类过程中历史数据和当前数据的融合问题;(3)异构信息网络的演化聚类算法,用于发现异构信息网络中社区结构及簇内容的演化;(4)簇(如话题)趋势检测算法,用于发现异构信息网络中簇随时间的热度趋势变化。依托本项目,项目组发表学术论文19篇,其中SCI 9篇,包含国际重要期刊 information sciences, Knowledge-based system, Neurocomputing等;申请发明专利3项,其中1项已授权。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
跨社交网络用户对齐技术综述
黄河流域水资源利用时空演变特征及驱动要素
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
面向云工作流安全的任务调度方法
面向异构信息网络中实体归类的模糊聚类
异构多属性网络的多视图聚类关键技术研究
基于张量分析的多角度聚类算法关键问题研究及其应用
基于模型的文本聚类关键技术研究及应用