面向图结构聚类溯源解释的关键技术研究

基本信息
批准号:61802268
项目类别:青年科学基金项目
资助金额:27.00
负责人:宗传玉
学科分类:
依托单位:沈阳航空航天大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:夏秀峰,孙伟东,朱睿,李佳佳,祝一帆,胡振昌,于甜甜
关键词:
图结构聚类聚类参数估计溯源解释why问题whynot问题
结项摘要

Structural graph clustering is a key technique for understanding and analyzing large-scale graph data. Due to the quality of graph data and the unreasonable setting of clustering parameters, clustering results do not satisfy the users' real requirements. Providing provenance explanations for the clustering results can effectively improve the quality and availability of the graph database, which is also an effective supplement to the existing structural graph clustering system. This research proposal proposes studying on structural graph clustering oriented key techniques of provenance explanation from the aspects of index structure construction of structural graph data, data sensitive oriented provenance explanation, and parameter sensitive oriented provenance explanation. We study the structural graph clustering algorithms, which builds an index structure for provenance explanation of structural graph clustering. We analyze that how the data affect the clustering results, and propose a provenance explanation technique based on data sensitivity. We also analyze the effect of parameters on the clustering results, and explore a technique to estimate the clustering parameters based on the user instances, and propose a provenance explanation technique in terms of parameter sensitivity. We plan to implement a structural graph clustering oriented prototype system of provenance explanation. Our research results would provide theoretical and practical supports for provenance explanations of structural graph clustering, which has very important theoretical value and research significance.

图结构聚类是理解和分析大规模图数据的关键技术,而图数据的质量问题以及聚类参数的设定不合理问题,导致得到的聚类结果并不能够满足用户的真实需求。为聚类结果提供溯源解释能够有效的提高图数据库的质量和可用性,也是对现有图结构聚类系统的一个有效补充。课题从图结构数据的索引结构构建、面向数据敏感的溯源解释、面向参数敏感的溯源解释等三个方面,对面向图结构聚类溯源解释的关键技术进行研究。研究图结构聚类算法,提出面向图结构聚类溯源解释的索引结构;研究数据敏感对聚类结果的影响,实现面向数据敏感的图结构聚类的溯源解释技术;研究参数敏感对聚类结果的影响,实现基于用户实例的聚类参数估计技术和面向参数敏感的图结构聚类的溯源解释技术。课题最终实现一个面向图结构聚类的溯源解释原型系统,研究成果将在理论和实践两个层面,为图结构聚类提供良好的溯源解释支持,具有十分重要的理论价值和研究意义。

项目摘要

图结构聚类作为理解和分析大规模图数据的关键技术,具有重要的应用价值。然而,当图数据出现质量问题或聚类参数出现设置不合理问题时,得到的聚类结果可能无法满足用户的真实需求,降低了图结构聚类的质量和图数据的可用性。针对该问题,本项目对面向图结构聚类溯源解释的关键技术展开研究。主要包括:(1)支持图数据查询的索引策略;(2)基于数据敏感的溯源解释技术;(3)基于参数敏感的溯源解释技术。主要成果如下:.(1)支持图数据查询的索引构建:项目组基于网格索引研究了路网图中的路径规划、最近邻查询以及同出发点拼车等查询优化问题,查询效率提升了2~3倍,为基于结点密度和聚类特征构建支持图结构聚类溯源解释的双层索引技术奠定了理论基础。.(2)基于数据敏感的溯源解释:项目组首先研究了基于数据敏感的图结构聚类溯源解释算法,能够为不同的期望数据提供有效的数据修改策略。随后项目组研究了支持数据敏感溯源解释的隐私保护技术,信息损失降低了82.53%,数据可用率提升了10%左右。为研究支持保护隐私的溯源解释技术提供了技术支撑。 .(3)基于参数敏感的溯源解释:项目组首先研究了基于参数敏感的图结构聚类溯源解释算法,为不同的非期望数据提供了有效的参数精炼策略,随后项目组对算法进行了优化,解释效率提升了一个数量级。第二,项目组研究了基于参数敏感的top-k查询溯源解释算法,在保护隐私的同时对top-k查询中的期望数据进行了有效的解释。然后,项目组研究了流数据环境下内存受限的近似连续top-k查询优化算法,查询效率提升了数倍,为提升top-k查询溯源解释的效率提供了技术支撑。第三,项目组研究了基于参数变化的图结构聚类增量计算算法,聚类效率提升了至少10倍,为提高基于参数敏感的图结构聚类溯源解释的效率提供了理论保证。第四,项目组基于机器学习研究了图数据中结点的文本属性分类算法以及基于用户实例簇的图结构聚类参数计算算法,为提高图结构聚类溯源解释的效率提供了技术支撑。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020

宗传玉的其他基金

相似国自然基金

1

基于空间聚类和关联分析地测资料综合解释关键技术研究

批准号:40762003
批准年份:2007
负责人:孟海东
学科分类:D0213
资助金额:16.00
项目类别:地区科学基金项目
2

面向金融大数据的半监督聚类集成挖掘关键技术研究

批准号:61572225
批准年份:2015
负责人:王丽敏
学科分类:F0214
资助金额:66.00
项目类别:面上项目
3

面向企业流程行为大数据的半监督聚类关键技术研究

批准号:61702213
批准年份:2017
负责人:王楠
学科分类:F06
资助金额:28.00
项目类别:青年科学基金项目
4

半监督聚类集成的关键技术研究

批准号:61003142
批准年份:2010
负责人:王红军
学科分类:F0607
资助金额:18.00
项目类别:青年科学基金项目