基于群智的开放式数据集成与分析技术研究

基本信息

批准号：61370060

项目类别：面上项目

资助金额：77.00

负责人：王宁

学科分类：

依托单位：北京交通大学

批准年份：2013

结题年份：2017

起止时间：2014-01-01 - 2017-12-31

项目状态：已结题

项目参与者：徐保民,Yi Chen,王涛,顾静秋,韩萌,李杰,宋玉玲,黄敏,任红伟

关键词：

关联表数据集成查询优化众包关键字查询

结项摘要

Following the Open Data trend, governments and public agencies have started making their data available on the Web, which makes Web a repository with huge amount of data. How to utilize these public resources for data analysis is a new challenge in data integration field. In this project, we study the technology for open data integration and analysis based on collective intelligence, which can enable open-world queries using open data on the web and also enable data analysis tasks that could not be done only based on data in local database. The main contents of our research are as follows. (1) A semantic integration method which combines machine algorithms and human intelligence is proposed for object identification and semantic disambiguation. The crowd is asked to verify the hypotheses generated by the various extraction algorithms in order to build a high-quality semantic index for open data. (2) A framework that captures the relatedness between tables is proposed, which can classify the relatedness between tables, and rank the related tables. (3) The relational data model is extended in order to uniformly express data from either local database or open data sources and also tolerate inconsistencies in data from various sources. Furthermore, new technologies for query rewriting and optimization are studied. (4) A platform for open data integration and analysis based on collective intelligence will be developed so that the effectiveness and efficiency of open data integration and analysis can be validated by actual open data on the Web.

随着开放数据运动的推进，政府及各种机构已将大量的公共数据发布到网上，Web逐渐成为一个巨大的蕴藏丰富资源的仓库，如何利用公共资源完成数据分析，成为数据集成领域新的挑战。本项目研究基于群智的开放式数据集成和分析技术，利用互联网上大众积累的开放数据实现"open-world"查询，帮助用户完成仅凭本地数据不能完成的分析任务。研究内容包括：（1）研究基于众包的语义集成和索引构建方法，利用大众智慧与机器算法的结合消除语义模糊，改善语义集成的质量，构建高质量的语义索引；（2）针对开放数据的特点，深度挖掘表之间的关联关系，建立关联关系分类、关联度定义和评分的理论模型和算法；（3）扩展关系模型，使其能统一表达局部和开放数据，以及处理开放数据的不一致性，并在此基础上探索新的查询重写和优化技术；（4）实现一个基于群智的面向互联网开放数据的集成和分析平台，通过真实的开放数据验证其有效性和效率。

项目摘要

本课题的研究目标是基于群智的开放式数据集成和分析技术，利用互联网上大众积累的开放数据实现“open-world”查询，帮助用户完成仅凭本地数据不能完成的分析任务。课题组成员围绕着既定的研究目标，经过四年的研究工作，取得了一系列的研究成果。代表性的研究内容包括：（1）研究基于众包的网络表格语义恢复和质量提升方法，提出利用大众智慧与机器算法的结合消除语义模糊，改善语义集成的质量；（2）研究大数据环境下数据的可用性,提出大数据下的实体解析方法以及表之间快照关系的发现算法，进一步提升开放式集成的质量；（3）研究开放式数据集成技术，提出不确定模式映射的方法、基于用户兴趣的模式摘要、紧凑索引的构建以及网络表格的一致性扩展查询技术，根据已知信息去扩展与实体列相关的其他属性列信息，实现开放式集成；（4）实现一个基于群智的面向互联网开放数据的语义标注和集成平台。.在本课题的资助下，项目组成员取得了如下的研究成果：（1）在国内外重要学术期刊上发表论文20篇，其中SCI检索期刊论文9篇，EI检索期刊论文5篇；（2）在领域内知名国内国际会议上共发表学术会议论文4篇，其中1篇获得最佳演示系统奖；（3）共申请发明专利5项，其中2项获得授权，获得软件著作权4项；（4）项目执行期间，项目组2名教师成功晋升教授，1名青年教师成功晋升副教授，培养博士研究生3名，硕士研究生9名。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：

发表时间：2021

DOI：10.1360/SSM-2020-0035

发表时间：2020

王宁的其他基金

批准号：21706128

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：21506111

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：71774021

批准年份：2017

资助金额：48.00

项目类别：面上项目

批准号：61804096

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：41272028

批准年份：2012

资助金额：85.00

项目类别：面上项目

批准号：31872346

批准年份：2018

资助金额：59.00

项目类别：面上项目

批准号：41201367

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：21807048

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：81200475

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：61605148

批准年份：2016

资助金额：24.00

项目类别：青年科学基金项目

批准号：69774023

批准年份：1997

资助金额：8.00

项目类别：面上项目

批准号：51607153

批准年份：2016

资助金额：19.00

项目类别：青年科学基金项目

批准号：50902007

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：81573425

批准年份：2015

资助金额：53.00

项目类别：面上项目

批准号：40802010

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：81202047

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：81100828

批准年份：2011

资助金额：14.00

项目类别：青年科学基金项目

批准号：61771431

批准年份：2017

资助金额：66.00

项目类别：面上项目

批准号：81100679

批准年份：2011

资助金额：22.00

项目类别：青年科学基金项目

批准号：10875031

批准年份：2008

资助金额：30.00

项目类别：面上项目

批准号：10347142

批准年份：2003

资助金额：2.00

项目类别：专项基金项目

批准号：51875067

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：31701450

批准年份：2017

资助金额：23.00

项目类别：青年科学基金项目

批准号：60874072

批准年份：2008

资助金额：29.00

项目类别：面上项目

批准号：41601261

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61761016

批准年份：2017

资助金额：38.00

项目类别：地区科学基金项目

批准号：81502130

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：51903247

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：81703449

批准年份：2017

资助金额：20.10

项目类别：青年科学基金项目

批准号：51009017

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：21101057

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：30860054

批准年份：2008

资助金额：21.00

项目类别：地区科学基金项目

批准号：41603009

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61902365

批准年份：2019

资助金额：27.00

项目类别：青年科学基金项目

批准号：21575009

批准年份：2015

资助金额：65.00

项目类别：面上项目

批准号：21173017

批准年份：2011

资助金额：61.00

项目类别：面上项目

批准号：51708518

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：30771525

批准年份：2007

资助金额：8.00

项目类别：面上项目

批准号：30801019

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：31360510

批准年份：2013

资助金额：51.00

项目类别：地区科学基金项目

批准号：81202096

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：51272011

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：81901350

批准年份：2019

资助金额：20.50

项目类别：青年科学基金项目

批准号：11904219

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：71602109

批准年份：2016

资助金额：19.00

项目类别：青年科学基金项目

批准号：U1867212

批准年份：2018

资助金额：260.00

项目类别：联合基金项目

批准号：31671140

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：51868021

批准年份：2018

资助金额：41.00

项目类别：地区科学基金项目

批准号：21301163

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：41301049

批准年份：2013

资助金额：28.00

项目类别：青年科学基金项目

批准号：41403011

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：51272037

批准年份：2012

资助金额：83.00

项目类别：面上项目

批准号：21773184

批准年份：2017

资助金额：65.00

项目类别：面上项目

批准号：71373034

批准年份：2013

资助金额：56.00

项目类别：面上项目

批准号：41501290

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：81804171

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：71702141

批准年份：2017

资助金额：18.00

项目类别：青年科学基金项目

批准号：51405159

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：31240015

批准年份：2012

资助金额：15.00

项目类别：专项基金项目

批准号：51379002

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：81401808

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：81773733

批准年份：2017

资助金额：54.00

项目类别：面上项目

批准号：61201402

批准年份：2012

资助金额：24.00

项目类别：青年科学基金项目

批准号：81702677

批准年份：2017

资助金额：19.00

项目类别：青年科学基金项目

批准号：U1504703

批准年份：2015

资助金额：27.00

项目类别：联合基金项目

批准号：71401016

批准年份：2014

资助金额：22.00

项目类别：青年科学基金项目

批准号：81772795

批准年份：2017

资助金额：55.00

项目类别：面上项目

批准号：21204097

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：40673059

批准年份：2006

资助金额：35.00

项目类别：面上项目

批准号：51775152

批准年份：2017

资助金额：58.00

项目类别：面上项目

批准号：81302808

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：11275052

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：21407097

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：61573311

批准年份：2015

资助金额：64.00

项目类别：面上项目

批准号：51505047

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：51873020

批准年份：2018

资助金额：59.00

项目类别：面上项目

批准号：31401633

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：61401402

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：49902004

批准年份：1999

资助金额：14.00

项目类别：青年科学基金项目

批准号：19474028

批准年份：1994

资助金额：6.50

项目类别：面上项目

批准号：11604338

批准年份：2016

资助金额：24.00

项目类别：青年科学基金项目

批准号：21104077

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：21875274

批准年份：2018

资助金额：65.00

项目类别：面上项目

批准号：51201085

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：30972086

批准年份：2009

资助金额：31.00

项目类别：面上项目

批准号：81360510

批准年份：2013

资助金额：49.00

项目类别：地区科学基金项目

批准号：51707134

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：50802013

批准年份：2008

资助金额：19.00

项目类别：青年科学基金项目

批准号：31801312

批准年份：2018

资助金额：24.00

项目类别：青年科学基金项目

批准号：68671033

批准年份：1986

资助金额：3.00

项目类别：面上项目

批准号：31372299

批准年份：2013

资助金额：82.00

项目类别：面上项目

批准号：81601716

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：31100825

批准年份：2011

资助金额：22.00

项目类别：青年科学基金项目

批准号：31572392

批准年份：2015

资助金额：66.00

项目类别：面上项目

批准号：11674294

批准年份：2016

资助金额：69.00

项目类别：面上项目

批准号：31660123

批准年份：2016

资助金额：38.00

项目类别：地区科学基金项目

相似国自然基金

群智感知中基于社会行为分析的机会式数据收集机制研究

批准号：61472193

批准年份：2014

负责人：徐佳

学科分类：F0208

资助金额：83.00

项目类别：面上项目

面向数据复用的群智感知质量-成本优化技术研究

批准号：61872010

批准年份：2018

负责人：王江涛

学科分类：F0208

资助金额：51.00

项目类别：面上项目

基于移动群智感知的物联网大数据挖掘与应用

批准号：71531001

批准年份：2015

负责人：吴俊杰

学科分类：G0112

资助金额：294.00

项目类别：重点项目

面向群智感知的高可靠数据收集与筛选关键技术研究

批准号：61672369

批准年份：2016

负责人：孙玉娥

学科分类：F0208

资助金额：64.00

项目类别：面上项目

基于群智的开放式数据集成与分析技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

智能煤矿建设路线与工程实践

二维FM系统的同时故障检测与控制

药食兼用真菌蛹虫草的液体发酵培养条件优化

现代优化理论与应用

王宁的其他基金

柔性锂离子电池负极材料的制备及性能研究

二氧化铈担载镍纳米催化剂的等离子体制备及其在甲烷干重整中的晶面效应研究

基于知识元的突发事件案例知识挖掘方法研究

热电致冷器电热转换效率调控机理及能量收集协同制冷研究

青藏高原地区新生代鱼类的演化及其对高原隆升和水系变迁的响应

KLF7在鸡脂肪细胞中的作用及机制研究

基于高光谱热红外数据的大气廓线、地表温度和比辐射率一体化反演研究

Alg蛋白相关脂肪醇寡糖的合成及其分子识别机制的研究

未成熟卵母细胞体外培养对F2代小鼠脑组织基因表达影响、作用机理及隔代效应研究

可调控三相光催化微流反应器的开发及其特性研究

神经非模型控制理论及应用研究

微电网分布式电能质量治理系统多指标全局优化运行策略研究

锰氧化物复杂纳米结构的有序组装及其结构-性能关联性研究

转录因子Meis1调控心肌梗死后心律失常的机制——Meis1与离子通道重构

新生代裂腹鱼亚科鱼类的演化和青藏高原隆升

CCND1基因rs9344位点多态性影响汉族女性宫颈癌易感性的机制研究

抑郁对诱发痛与自发痛分离效应的神经机制研究

5G大规模MIMO在非理想系统约束下保密传输技术研究

糖尿病性视网膜病变中解偶联蛋白-2差异表达的功能学研究

重离子熔合与超重核合成机制探索

丰中子核熔合反应的动力学研究

压水堆蒸汽发生器传热管结构状态监测关键技术研究

大豆盐碱胁迫响应基因GmLEA1的功能鉴定及其调控作用机制研究

基于生物计算的优化调度理论及在流程工业中的应用研究

秸秆还田条件下水稻根际土壤反硝化作用及其功能微生物演替机制研究

基于磁场调控Ni纳米薄带增强空穴收集的钙钛矿太阳电池研究

利用iMIC细胞体外重建肠癌发生发展过程的实验研究

两亲性聚砜嵌段共聚物的分子设计、形态控制及其在纳滤膜中的应用

基于铝离子脂质卷构建的微针疫苗佐剂-传递系统

面向复杂船舶领域的动态自组织模糊建模及综合

铁铁氢化酶活性中心模型配合物与葫芦脲超分子自组装研究

克隆整合对两种外来入侵植物入侵性的影响

河南郑州地区商代先民和动物食物结构及生存环境的多稳定同位素分析

基于本地化差分隐私的高效用频繁模式挖掘技术研究

三维石墨烯-多元金属纳米晶介孔有序电化学传感界面的受控组装及应用

低铂双金属纳米粒子的可控组装及其电催化特性研究

基于钻井台阵强震动记录的场地土体动力特性识别方法研究

鸡脂肪细胞分化负调控转录因子的高通量分离与功能验证

肠道TLRs表达与胰岛素抵抗的机制研究

多杜鹃寄生系统中几种杜鹃属（Cuculus）鸟类的宿主专一类群（gentes）分化及种群遗传结构

CHEK2 Y390C突变对DNA双链断裂损伤中不同p53状态乳腺癌细胞增殖和凋亡的影响

多元锰基复合氧化物的受控组装及其氧还原应用研究

蛋白激酶D1通过磷酸化多巴胺D2受体促进可卡因成瘾发展的作用与机制研究

制备与光纤通讯波段匹配的1550nm纠缠源的实验研究

环状航线中集装箱选择和配积载问题联合优化研究

近垒重离子诱发裂变反应机制研究

疼痛对时间知觉的调制作用及其神经机制研究

考虑土-桩-桥墩耦合效应的超大直径空心桩动力特性研究

MAX相材料在LiCl-KCl熔盐中的抗腐蚀及电化学性能研究

欧亚温带草原东缘生态样带的昆虫多样性

珊瑚14C对海气交换作用的记录：基于三亚珊瑚，海水DIC和大气14C研究

基于表面无序工程的自敏化地毯式氧化钛光阳极及电荷传递机理研究

环糊精调控量子点与分子催化剂自组装光催化产氢研究

基于知识元的突发事件演化推演方法研究

黄土丘陵沟壑区植物间正相互作用对坡面植被格局的影响

基于“HPA轴”途径探索直接灸“足三里”改善CTX大鼠骨髓抑制的生物学机制

反馈寻求行为对创新绩效影响的机理研究

氢介质环境下高温管道蠕变损伤机理及预测模型研究

菟丝子寄生下游击型克隆植物的行为和生理生态适应机制

水面无人艇无风险操纵运动控制研究

I型胶原-PRP支架促进肌腱干细胞功能性分化作用的研究

circRNA调控心肌梗死后心肌细胞焦亡的分子网络及干预研究

海量星球表面数据的多尺度合成方法研究

Chemerin过表达通过TGF-β/Smad信号通路及中性粒细胞类型转化促进舌鳞癌演进的研究

基于模式识别的多阶段制造过程质量诊断

多维状态监测数据条件下的设备剩余寿命预测方法研究

CHEK2缺陷诱导三阴性乳腺癌对PARP1抑制剂耐药及其相关机制

原位制备无机纳米晶/共轭聚合物杂化材料及其光伏性质研究

河流-森林湿地系统中代表性生物林蛙体内汞的富集规律以及迁移循环模式研究

面向微纳加工应用的硅藻仿生表面自组装黏附机制与力学性能研究