大规模图数据集成关键技术研究

基本信息
批准号:61572040
项目类别:面上项目
资助金额:67.00
负责人:高军
学科分类:
依托单位:北京大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:杨冬青,欧高炎,周畅,罗雄才,孙徐湛,韩蕾,刘宇琼
关键词:
图算法图数据库图查询图挖掘
结项摘要

Big graphs merged in different application domains are complementary to each other. The graph integration will enrich profiles of individual data items, and effectively support applications on the integrated big graphs, like product/information recommendation, customer evaluation, and so on. Facing the challenges including the uncertainty, massive data, and privacy protection in big graph integration, this project conducts research from the viewpoints of the key techniques and prototype...The key techniques studied in this project first include the generalized graph integration techniques. The project plans to propose a transfer learning based iterative inferring method for hidden attributes, a probabilistic graph integration approach incorporated with user feedbacks, and a privacy aware group query with high precision. Second, this project studies the optimization strategies suitable in the distributed graph processing framework, and attempts to design a local sub-graph aware method to build initial integration mappings, a three-stage message propagation approach to graph integration, and an extension to distributed graph processing framework to support both online queries and offline analysis. Third, the project will study graph integration in specified domains. Specifically, the project will devise an approach to knowledge graph integration via the minimized meta-search, and a social network integration method based on user feedbacks collected from the recommendation system...This project will develop a graph integration prototype based on Giraph, an open source implementation of Pregel in Google, to test the effectiveness of our methods in the field of social network and knowledge network.

不同应用领域中涌现的大图数据存在互补,大图数据集成将丰富个体数据特征,有效支持信息推荐、客户评估等诸多应用。面对大图数据集成和服务中不确定性、海量数据、隐私保护等挑战,本课题从关键技术和原型系统两个层面展开研究。.在关键技术层面,本课题将研究大图数据的通用集成方法,拟提出基于迁移学习的隐含属性迭代推测方法、基于用户反馈的多特征概率集成方法、隐私保护感知的高精度群体查询策略;本课题将研究分布式环境中大图数据集成的优化策略,拟提出感知局部内容+结构的初始映射构建方法、基于三阶段消息扩展的分布式大图集成方法、同时支持在线查询和离线分析的分布式图数据处理框架的扩展机制;本课题将研究面向应用领域的大图数据集成,拟提出面向最少元搜索的知识网络集成方法、基于推荐反馈的社交网络集成方法等。.在原型系统层面,本课题拟利用现有的分布式大图计算框架Giraph,研制面向社交网络和知识网络的大图数据集成原型系统。

项目摘要

不同应用领域中涌现的大图数据存在互补,大图数据集成将丰富个体数据特征,有效支持信息推荐、客户评估等诸多应用。面对大图数据集成和服务中不确定性、海量数据、隐私保护等挑战,本课题从关键技术和原型系统两个层面展开研究。在关键技术层面,本课题研究了大图数据的通用集成方法,提出了基于迁移学习的隐含属性迭代推测方法、基于用户反馈的多特征概率集成方法、隐私保护感知的高精度群体查询策略;本课题研究了分布式环境中大图数据集成的优化策略,提出了感知局部内容+结构的初始映射构建方法、基于三阶段消息扩展的分布式大图集成方法、同时支持在线查询和离线分析的分布式图数据处理框架的扩展机制;本课题研究了面向应用领域的大图数据集成,提出了面向最少元搜索的知识网络集成方法、基于推荐反馈的社交网络集成方法等。在原型系统层面,本课题利用现有的分布式大图计算框架Giraph,研制了面向社交网络和知识网络的大图数据集成原型系统。.课题执行期间,课题组将研究的关键技术成果应用于实际系统,并根据实际应用的反馈优化研究路线。应用中我们发现,单纯结构信息不足以支持用户应用,融合内容、结构、时间、空间等特征才能实现有效的图数据分析。课题组以异构信息网络为数据模型,设计图神经网络融合多源异构信息,支持商品推荐、异常发现等应用。.课题执行期间,发表CCF A类会议或者期刊论文9篇(包括VLDB J、TKDE, ICDE、AAAI、IJCAI等),B类会议(包括CIKM)论文一篇,申请2项专利,课题组研究生毕业3名,成果应用于阿里和国家政务相关的场景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
2

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
5

一种加权距离连续K中心选址问题求解方法

一种加权距离连续K中心选址问题求解方法

DOI:
发表时间:2020

高军的其他基金

批准号:81472279
批准年份:2014
资助金额:70.00
项目类别:面上项目
批准号:21873034
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:61471389
批准年份:2014
资助金额:83.00
项目类别:面上项目
批准号:21373124
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:31500891
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:61272156
批准年份:2012
资助金额:82.00
项目类别:面上项目
批准号:51278370
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:60503037
批准年份:2005
资助金额:24.00
项目类别:青年科学基金项目
批准号:60873062
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:61303099
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:11805230
批准年份:2018
资助金额:23.00
项目类别:青年科学基金项目
批准号:31760654
批准年份:2017
资助金额:38.00
项目类别:地区科学基金项目
批准号:39600172
批准年份:1996
资助金额:9.00
项目类别:青年科学基金项目
批准号:81272663
批准年份:2012
资助金额:60.00
项目类别:面上项目
批准号:31360539
批准年份:2013
资助金额:53.00
项目类别:地区科学基金项目
批准号:41601140
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:61073018
批准年份:2010
资助金额:33.00
项目类别:面上项目
批准号:11802297
批准年份:2018
资助金额:20.00
项目类别:青年科学基金项目
批准号:50908163
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:21878178
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:51778440
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:51578387
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:31060298
批准年份:2010
资助金额:25.00
项目类别:地区科学基金项目

相似国自然基金

1

大规模图数据正则路径查询关键技术研究

批准号:60873062
批准年份:2008
负责人:高军
学科分类:F0202
资助金额:32.00
项目类别:面上项目
2

面向大规模时态图数据的社区搜索关键技术研究

批准号:61772346
批准年份:2017
负责人:李荣华
学科分类:F0202
资助金额:61.00
项目类别:面上项目
3

面向大规模图数据的凝聚子图搜索技术研究

批准号:61902184
批准年份:2019
负责人:袁龙
学科分类:F0202
资助金额:27.00
项目类别:青年科学基金项目
4

大规模图数据中可达性索引技术研究

批准号:61602427
批准年份:2016
负责人:富丽贞
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目