Large-scale heterogeneous information network summarization, aims at compressing, screening and representing network data to overcome the issues of “Information Overload” and “Resource Isotropic”. Summarization interpretability not only makes the network summarization generation process transparent, but also increases the users’ acceptability of the summarization results. This project considers network summarization and summarization interpretability as the research tasks, builds large-scale heterogeneous information network summarization and summarization interpretability model with the basic elements of network schemas, semantic features and external information: Firstly, we model heterogeneous information network as multi-layer networks, and construct the mining models of application-oriented meta path and high-order rich network schemas. Secondly, we construct the representation learning models of node and high-order rich network schema in heterogeneous information network, and intend to solve the problem of dynamic network representation learning. The high-dimensional sparse features are transformed into the low-dimensional dense vector space by using these models of network representation learning. Finally, we design a series of the clustering algorithms in heterogeneous information network, construct network summarization by utilizing local sensitive hash function and improved minimum description length algorithm, and intend to solve the problems of network summarization interpretability and query optimization. This project meets the multi-layer, heterogeneous, high-order and dynamic modeling of large-scale networks, and gives novel ideas and theoretical principles for further research on large-scale heterogeneous information network summarization and summarization interpretability.
大规模异质信息网络摘要旨在通过对网络数据进行压缩、筛选和表示,解决“信息过载”和“资源迷向”问题,而摘要的可解释性不仅可以透明化网络摘要的生成过程,还能增加用户对摘要的接受度。本项目以网络摘要和摘要的可解释性为研究对象,将网络模式、语义特征和外部信息作为基本元素,构建异质信息网络摘要和摘要可解释性模型:首先,拟多层化建模异质信息网络,构建面向应用的元路径和高阶富网络模式挖掘模型;然后,拟构建异质信息网络中节点表示学习模型和高阶富网络模式子图表示学习模型,解决动态网络表示学习问题,将高维稀疏特征转化成低维稠密向量形式;最后,拟构建异质信息网络聚类学习算法,利用局部敏感哈希函数和改进的最小描述长度算法构建异质信息网络摘要,同时,探索解决网络摘要的解释生成及查询优化问题。本项目考虑了大规模网络的多层性、异质性、高阶性和动态性建模,为大规模异质信息网络摘要和摘要可解释性研究提供了新思路和理论依据。
本研究将网络模式挖掘和深度表征学习作为基础,构建异质信息网络摘要和摘要可解释性模型。具体研究内容包括:1)异质信息网络中网络模式和语义特征挖掘:在多层化组织异质信息网络中,通过采样可解释的元路径和网络模体匹配,构建面向应用向导的元路径挖掘模型和高阶富网络模式挖掘模型;2)多视角的异质信息网络深度表示学习模型:提出基于对抗图自动编码器的节点表示模型AGVAE,融合对抗学习的表示学习模型HNRL-GAN++,基于网络模体的异质超图卷积网络模型MHGCN,基于图神经网络和胶囊网络的图分类模型CapsualGNN,基于旋转相对时间编码方式的动态网络表示模型RoTE-GAT,领域无关的图生成模型GHRNN和基于预训练的图预训练和提示调优GPPT模型,实现多视角的异质信息网络深度表示学习;3)多粒度的异质信息网络可解释性摘要及查询优化:提出基于Motif和深度网络表示的图聚类模型,基于密集深度神经网络结构的聚类模型,基于社区检测的摘要模型,基于摘要生成过程的可解释模型,基于细粒度数据F-ECM的解释链模型,基于生成多风格推荐解释的推荐模型(MSRE),基于三重注意力可解释推荐模型TAERT,基于强化学习的知识图谱查询补全模型,基于链接预测的结构增强文本表示StAR模型,基于知识图谱的智能问答模型,实现多粒度的异质信息网络可解释性摘要及查询优化。本项目取得的理论成果能够推动智慧医疗、金融风控、交通管理等多种实际生活中应用任务的发展,具有重要的理论意义和实际应用价值。. 在本项目资助下,项目组在国际顶级会议、SCI期刊、一级学报和核心期刊上共发表论文30篇,其中CCFA类国际顶级会议6篇、中科院一区论文5篇、一级学报4篇。被SCI检索11次、EI检索13次。批准专利5项,批准软件著作权2项,获得中国商业联合会三等奖1项。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
跨社交网络用户对齐技术综述
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
城市轨道交通车站火灾情况下客流疏散能力评价
新型社会网络模型及在社会媒体文本摘要和图像标注的应用
大规模影像集合联合摘要研究
面向大规模演化异质信息网络的未知关系学习与推理研究
基于图的大规模异质信息网络的匹配查询关键技术研究