Heterogeneous information network, linking data with multiple types of nodes and edges, has rich semantic and comprehensive structures. These data generally have multi-granular semantics and structures. Heterogeneous information network brings new challenges while providing a new research mode for networked data mining and knowledge acquisition. The existing researches on heterogeneous information network research mainly focus on the single-granular level, and are not suitable for acquiring multi-granular knowledge. While methods on granular computing for homogeneous information network cannot be directly used for heterogeneous information network. This project will research the methods on multi-granular representation and knowledge acquisition for heterogeneous information network based on quotient space theory, one of granular computing theories. More details are as follows. 1) Based on semantic of nodes in the heterogeneous information network, the multi-granular quotient space models for representing heterogeneous information network and methods of multi-granular knowledge acquisition will be analyzed. 2) Based on the structural features of heterogeneous information network, the multi-granular microstructure mining methods will be studied so that the multi-granular microstructures will be detected, such as communities, key nodes and so on. 3) The multi-granular quotient space models and knowledge acquisition methods based on both semantic information and network structural features will be studied. 4) The above research will be applied to heterogeneous information networks modeled by big data, such as science and technology data. This project will not only enrich the theory of granular computing, and will also be able to provide scientific support for the efficient utilization and mining of heterogeneous information network.
多类型数据互连构成的异质信息网络,不但包含丰富的语义、全面的结构,而且它们还具有多粒度特性,为网络化数据挖掘和知识获取提供了一种新的研究模式,同时也带来了新的挑战。已有的异质信息网络研究主要集中在单粒度层面,无法获取多粒度知识,而研究同质信息网络的粒计算方法大多无法直接用于异质信息网络。本项目拟基于商空间粒计算理论,研究异质信息网络的多粒度表示和知识获取方法,具体包括:1)基于网络节点的语义信息,研究异质信息网络的多粒度商空间表示模型构建方法与多粒度知识获取方法;2)基于网络结构特征,研究异质信息网络的微观结构挖掘方法,挖掘多粒度微观结构,如社团、关键节点等;3)研究融合节点语义信息和网络结构特征的多粒度商空间表示模型构建方法与多粒度知识获取方法;4)将上述研究成果应用到科技大数据等异质信息网络。该项目的研究,既可丰富粒计算理论,又可为异质信息网络的有效利用和知识获取提供科学支撑。
异质信息网络包含复杂的结构信息和丰富的语义信息,且信息具有多粒度特性,如何表示多粒度异质信息网络,快速高效地从中进行多粒度的语义与结构、个体与群体的知识获取,是当前异质信息网络分析面临的重要挑战。项目基于商空间粒计算理论,研究:1)基于节点语义信息的多粒度商空间表示模型构建与知识获取方法;2)基于网络结构特征的多粒度微观结构挖掘;3)融合节点语义信息与网络结构特征的多粒度商空间表示模型构建与知识获取方法;4)应用示范系统开发。.经过四年研究,项目组取得以下主要研究成果:1)针对研究对象的异质性特征,分别从网络的节点属性、网络结构以及融合网络节点属性和网络结构三个角度给出异质信息网络的多粒度表示方法,构建异质信息网络的多粒度商空间模型,模型具有较高的通用性,模型的输出可应用于多种下游任务;2)探讨异质信息网络的相似性度量方法,构建基于语义的层次化概念、分层递阶的结构特征、融合语义和结构的多粒度挖掘模型,实现了基于语义的多粒度知识获取、基于网络结构的多粒度微观结构挖掘、基于语义和结构的多粒度知识获取方法,部分理论研究成果相比于SOTA方法有大幅度提升,获得了领域内专家的高度肯定;3)将理论和技术研究成果应用于科技大数据,提出知识和数据融合的新一代知识产权数据挖掘与智能分析服务框架,建成了集理论方法、关键技术和平台系统为一体的技术体系,研发了大规模知识产权数据挖掘与智能分析服务平台 PatentMiner,目前已提供权利人画像、竞争者分析、知识图谱、合作推荐等功能,能够为政府和企业提供技术溯源、发展趋势分析、产业图谱构建等服务,服务国家经济和区域经济发展,具有良好的成果转化应用前景。.本项目的研究成果对异质信息网络的有效利用和知识获取提供科学支撑,进一步完善基于商空间的粒度计算理论和应用,具有重要的理论意义和实际应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于多模态信息特征融合的犯罪预测算法研究
基于细粒度词表示的命名实体识别研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
多粒度标记数据的知识表示和知识获取研究
基于粒计算与证据理论的多粒度空间知识获取方法研究
复杂信息系统的粒度结构与知识获取研究
智能式决策系统的知识获取与表示