大数据环境下面向社交网络的图匹配查询研究

基本信息
批准号:61402383
项目类别:青年科学基金项目
资助金额:25.00
负责人:王欣
学科分类:
依托单位:西南交通大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:单承戈,苗苗,余增,刘胜久,冯彦乔,肖婧,杨浩
关键词:
社交网络分析图匹配大数据
结项摘要

Nowadays, the rise of social networking service as a new medium of information dissemination has endowed many social networks with enormous commercial value; in the meanwhile, the graph structure of social networks makes graph pattern matching a key technique for social network analysis, e.g., identifying social communities and social positions, finding experts according to social relationships and so on. However, social networks bring graph pattern matching new challenges. As real-life social networks are typically large, it is often prohibitively expensive to conduct graph pattern matching over such large graphs, e.g., NP-complete for subgraph isomorphism, and quadratic time for graph simulation. In response to these challenges, we study the graph pattern matching problem based on real-life applications, and develop techniques which are particularly applicable for large, frequently updated and distributively stored social networks, under a unified logical framework. More specifically, (1) we will revise graph pattern matching defined in terms of graph simulation, by supporting designated output nodes; with the revise, we require the query results including only matches of the output nodes and develop algorithms to find diversified top-k matches; in the meanwhile, we will study resource-bounded query answering via a dynamic scheme that reduces big G to a much smaller graph G' and achieves high query accuracy by using G' instead of G; (2) we also study the problem of compressing graphs into hierarchical structures and develop efficient maintenance techniques for compressed graphs; with these, we will explore solutions to speed up graph pattern matching computation by using materialized views and compressed graphs for subgraph isomorphism and graph simulation, respectively; (3) we next develop effective algorithms to cope with distributed social networks. The algorithms will possess low site visit times, response time and data shipment, and better still, can be evaluated more efficiently by parallel computation; and (4) we will also experimentally verify the efficiency, effectiveness and scalability of all our centralized and distributed algorithms; moreover, all the techniques will be integrated to one prototype system. In short, our study is to establish a complete and systematic theory for graph pattern matching, and will be of momentous theoretical significance and practical value to the analysis of big social data.

社交网络已成为新的信息传播载体,具有极高的商业应用价值;与此同时,图结构特点使得图匹配查询成为社交网络分析的关键技术,如:社交圈子发现、角色分析、专家推荐等。然而,庞大的社交网络和昂贵的图匹配计算,制约了图匹配查询的应用。面对上述挑战,本课题在统一的逻辑框架下,从应用需求出发,针对社交网络数据规模大,查询结果复杂,数据更新频繁,分布式存储等特点,系统性地开展图匹配查询研究。主要创新点包括:1)在top-k多样性计算和有限资源近似计算两个方向探索近似图匹配查询;2)探索层级图压缩及压缩图增量维护技术,实现通过视图、压缩图优化图匹配查询;3)克服分布式计算的复杂性并发挥并行计算的优势,探索有效的分布式图匹配查询技术;4)实验验证上述技术的有效性并进行整合,完善原型系统。本课题的研究有利于建立系统完整的面向“大数据”的图匹配查询技术,对“大数据”环境下社交网络分析具有重要的理论意义和应用价值。

项目摘要

图结构匹配是一个经典的研究问题,在多个领域内有着广泛的应用。近年来,随着社交网络的兴起,图结构匹配进一步地成为社交网络分析的关键技术之一,被应用于社交圈子发现、角色分析、目标推荐等。然而,由于社交网络数据量十分庞大,且图结构匹配问题的计算复杂度非常高,例如,子图同构是NP完全问题,不存在多项式时间复杂度的算法;图仿真算法的时间复杂度也是输入图G的平方,因此在大规模图数据上进行图结构匹配运算有着很高的开销,难以满足实际应用需求。为此,如何有效地提高图结构匹配运算的效率是当前社交网络分析研究的热点。本课题着眼于这一现实问题,针对社交网络数据“规模大”,“查询结果复杂”,“分布式存储”等特点,系统性地开展图匹配查询研究。课题组经过三年多的努力,在多样化图结构匹配,基于视图的图结构匹配,分布式图结构匹配,有限资源图结构匹配等问题上进行了深入探索,取得了一系列的研究成果,具体包括:探索了top-k多样化查询技术,设计了具有“提前终止”性能的算法,使得查询更有针对性,且计算更加高效;设计了基于视图的查询技术,大大提高了图结构匹配运算的效率;探索了分布式环境下图结构匹配的问题,开发了可并行运行的分布式算法,极大地提高了运算效率;提出了“有限资源查询计算”的框架,设计了有限资源查询算法,实现了在有限资源环境下高效率的查询计算。以上这些成果发表在了国际高水平的期刊和学术会议,如:TKDE (CCF A类)1篇,VLDB (CCF A类)1篇,EDBT(CCF B类) 1篇, DASFAA(CCF B类)1篇,DEXA(CCF C类) 1篇,产生了一定的学术影响力。不仅如此,上述成果还得到了企业,如华为,长虹等的应用,帮助他们取得了良好的经济效益;同时也申请国内外发明专利6项,其中美国发明专利1项(已获授权),国内发明专利5项。同时在本项目研究成果的基础上,课题组负责人作为主要参与人获批国家自然科学基金重大项目1项,作为主持人获批软件开发环境国家重点实验室开放课题1项及多项纵横向科研项目。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
4

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

王欣的其他基金

批准号:81372353
批准年份:2013
资助金额:65.00
项目类别:面上项目
批准号:30970108
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:51702108
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:31600389
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:51806015
批准年份:2018
资助金额:27.00
项目类别:青年科学基金项目
批准号:81801745
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:11604277
批准年份:2016
资助金额:22.00
项目类别:青年科学基金项目
批准号:61772420
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:61205116
批准年份:2012
资助金额:28.00
项目类别:青年科学基金项目
批准号:20503018
批准年份:2005
资助金额:25.00
项目类别:青年科学基金项目
批准号:30671044
批准年份:2006
资助金额:32.00
项目类别:面上项目
批准号:69172001
批准年份:1991
资助金额:2.50
项目类别:面上项目
批准号:11104031
批准年份:2011
资助金额:30.00
项目类别:青年科学基金项目
批准号:21102076
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:21677176
批准年份:2016
资助金额:64.00
项目类别:面上项目
批准号:41301339
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:60172022
批准年份:2001
资助金额:16.00
项目类别:面上项目
批准号:21877005
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:30500534
批准年份:2005
资助金额:25.00
项目类别:青年科学基金项目
批准号:31770339
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:U1632148
批准年份:2016
资助金额:50.00
项目类别:联合基金项目
批准号:81902509
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:81270598
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:31271469
批准年份:2012
资助金额:90.00
项目类别:面上项目
批准号:31000493
批准年份:2010
资助金额:19.00
项目类别:青年科学基金项目
批准号:31370156
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:20772009
批准年份:2007
资助金额:28.00
项目类别:面上项目
批准号:41271091
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:61603308
批准年份:2016
资助金额:22.00
项目类别:青年科学基金项目
批准号:81300615
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:21767022
批准年份:2017
资助金额:39.00
项目类别:地区科学基金项目
批准号:11874312
批准年份:2018
资助金额:63.00
项目类别:面上项目
批准号:51804096
批准年份:2018
资助金额:20.00
项目类别:青年科学基金项目
批准号:81473486
批准年份:2014
资助金额:73.00
项目类别:面上项目
批准号:81472472
批准年份:2014
资助金额:55.00
项目类别:面上项目
批准号:51802339
批准年份:2018
资助金额:27.00
项目类别:青年科学基金项目
批准号:81403145
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:51802246
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:40801025
批准年份:2008
资助金额:26.00
项目类别:青年科学基金项目
批准号:21106036
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:81272425
批准年份:2012
资助金额:16.00
项目类别:面上项目
批准号:61275031
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:60872119
批准年份:2008
资助金额:26.00
项目类别:面上项目
批准号:81102106
批准年份:2011
资助金额:21.00
项目类别:青年科学基金项目
批准号:41302006
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:51909022
批准年份:2019
资助金额:23.50
项目类别:青年科学基金项目
批准号:81802678
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:31201365
批准年份:2012
资助金额:20.00
项目类别:青年科学基金项目
批准号:31300227
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:81150035
批准年份:2011
资助金额:10.00
项目类别:专项基金项目
批准号:81201411
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:61673166
批准年份:2016
资助金额:61.00
项目类别:面上项目
批准号:31400724
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:60879022
批准年份:2008
资助金额:20.00
项目类别:联合基金项目
批准号:30471825
批准年份:2004
资助金额:21.00
项目类别:面上项目
批准号:41771075
批准年份:2017
资助金额:70.00
项目类别:面上项目
批准号:31870106
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:61875011
批准年份:2018
资助金额:61.00
项目类别:面上项目
批准号:71804202
批准年份:2018
资助金额:19.50
项目类别:青年科学基金项目
批准号:39670240
批准年份:1996
资助金额:10.00
项目类别:面上项目
批准号:11505146
批准年份:2015
资助金额:23.00
项目类别:青年科学基金项目
批准号:41405079
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:81770210
批准年份:2017
资助金额:57.00
项目类别:面上项目

相似国自然基金

1

基于Spark的大图数据最优子模式匹配查询方法研究

批准号:61502258
批准年份:2015
负责人:彭云
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目
2

面向大规模图数据的高效结构查询技术研究

批准号:61672235
批准年份:2016
负责人:林学民
学科分类:F0202
资助金额:67.00
项目类别:面上项目
3

面向安全图数据外包服务的可查询加密机制研究

批准号:61872041
批准年份:2018
负责人:祝烈煌
学科分类:F0205
资助金额:67.00
项目类别:面上项目
4

移动社交网络中面向多维隐私保护的安全查询方法研究

批准号:61802076
批准年份:2018
负责人:彭滔
学科分类:F0205
资助金额:25.00
项目类别:青年科学基金项目