Link prediction is an important task in heterogeneous information network mining. Aiming at the heterogeneity of the entities and links, the network dynamics and the structural complexity, how to improve the accuracy of link prediction by combining the network link structure and the semantic relationship in the context is still a problem. This project focuses on temporal link prediction model to analyze the change trend of nodes and links in the heterogeneous information network. In addition, it studies how to obtain structure information by using meta-paths and how to obtain semantic information by using text mining techniques in heterogeneous networks. It also studies combining structure information and semantic information to obtain richer knowledge in heterogeneous networks. Then, it studies the unified representation method of different types of links, to explore the strategies of predicting them simultaneously. This project not only aims to improve the accuracy of link prediction by combining the network link structure and the semantic relationship, but also studies analyzing the difference of links between structure similarity and semantic similarity to predict the anomalous links or missing links. Finally, we want to reach the goal of conducting dynamic link prediction in heterogeneous networks by combining link structure and semantic information. The research findings of this project can be applied to many areas, such as potential collaborators prediction, domain experts mining, community detection, knowledge graph construction and personalized recommendation in specific domain, and so on, which has significant theoretical value and practical value.
链路预测是异质信息网络挖掘的一项重要任务。针对网络中实体和链接的异质性、网络的动态性以及结构复杂性,如何结合网络链接结构和上下文中存在的语义关系来提高链路预测的准确性仍是我们需要考虑的问题。本课题面向异质信息网络,重点研究时序链路预测模型,来分析网络节点及链接变化趋势;结合通过元路径得到的结构信息以及通过异质网络文本挖掘方法得到的语义信息,来获取异质网络中更加丰富的知识;研究不同类型链接的统一表示方法,进而探索同时预测不同类型链接的策略等。本课题不仅通过结合网络结构和语义关系来提高正常链路预测的准确性,还将研究链接在结构相似度和语义相似度上的差异,来预测网络中存在的异常链接或缺失链接。最终实现结合链接结构和语义信息进行动态异质网络链路预测的目标。本项目研究成果可用于潜在合作关系预测、领域专家挖掘、社区发现、知识图谱构建、特定领域个性化推荐等,具有重要的理论和实际应用价值。
本项目根据目前国内外异质信息网络挖掘研究的现状,提出结合链接结构和语义关系的方法来预测网络中可能出现链接关系。提出了一种异质信息网络中基于元路径的离群点检测方法MPOutlier,该方法结合了网络中节点间的语义关系和可信度权值来进行离群点检测,使检测结果更加全面和准确。提出了一种基于节点影响力的相似度度量方法NISim,该模型既考虑了网络中的链接结构,也保留了网络中的语义信息,同时区分不同类型节点对异质网络的作用。以神经概率语言模型与预训练语言模型作为深度学习与自然语言处理结合的切入点,从语言模型的基本概念和理论出发,介绍了神经概率与预训练模型的应用情况和当前面临的挑战,对现有神经概率、预训练语言模型及方法进行对比和分析。针对知识图谱问答系统的构建,提出了流水线框架,包含实体检测、实体链接模型以及关系检测模型,来回答特定领域的问题。 结合全局层次结构嵌入和局部概率约束,提出了一种有监督的关系抽取方法。. 实验结果表明,我们提出的结合链接结构和语义关系对异质信息网络节点和链接建模的方法,有效地度量了异质网络节点间的相关程度、识别了异质网络中存在的离群点;构建了特定领域的知识图谱,解决了知识图谱问答系统构建以及关系抽取等诸多关键问题,对从异质信息网络海量数据中提取知识具有重要意义。. 在本项目的支持下,在国际期刊《Knowledge and Information Systems》、《Knowledge based Systems》、《Frontiers of Computer Science》,国内期刊《软件学报》等发表学术论文9篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
农超对接模式中利益分配问题研究
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于异质网络链路预测的新兴技术研发机会识别研究
基于子图结构和功能的复杂网络链路预测研究
基于链路预测和零模型的演化网络结构分析
基于支持向量机的无线传感网络链路质量预测方法研究