近年来不确定数据管理成为数据库领域的研究热点,人们已经提出各种模型及相应的查询语言、存储方法和查询处理,但是如何利用概率图模型对数据相关性的良好刻画,来实现不确定数据的有效管理的工作还比较少。本研究拟用概率图模型建模方法对不确定数据的管理进行研究,从理论上探索概率图模型对不确定数据的表示、不确定数据上查询的复杂性及基于概率推断的近似算法、高效的不确定数据上复杂聚集查询处理算法、基于概率图模型不确定数据挖掘算法,探索如何使用关系数据库中查询优化技术来实现高效的概率推断算法,并开发集成这些研究工作的原型系统。本项目所研究的内容属于不确定数据管理的核心技术,研究所提供的理论和方法将在一定程度上促进该领域的理论进展和商业不确定数据管理系统的开发,研究还将提供实用的技术,研制具有我国独立知识产权的不确定数据管理技术。
近年来,随着传感器、RFID 和信息抽取等技术的出现,以及人们对数据采集和处理技术理解的不断深入,如何使用不确定数据(uncertain data)对现实世界进行建模以及相应的数据管理问题得到了广泛的关注。在许多现实应用中,如Web 信息抽取、环境监测、物流管理、军事、金融、电信等领域,数据的不确定性普遍存在,不确定数据的管理技术将扮演重要角色。课题组用概率图模型建模方法对不确定数据的管理进行研究,从理论上探索图模型对不确定数据的表示。具体地,我们对不确定数据相似性查询(高维不确定数据相似性查询的快速处理、不确定数据流ER-topk查询等)、概率XML数据的管理(概率XML数据上的关键字过滤、基于贝叶斯网络的关键字过滤等)、不确定数据世系管理、不确定数据挖掘算法(非冗余多样性模式的挖掘、半监督PU学习、数据不确定性或噪声的去除等)、不确定数据的访问控制与隐私保护等进行了深入研究。这些理论结果在从淘宝等抓取的真实数据上进行了详细的实验,检验了我们所提出方法的有效性和效率。在该基金项目的支持下,课题组三年来在国内外高水平学术会议和期刊上已发表或录用论文12篇。本项目所研究的内容属于不确定数据管理的核心技术,研究所提供的理论和方法将在一定程度上促进该领域的理论进展和商业不确定数据管理系统的开发。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
条件概率图数据管理关键技术研究
基于概率图模型的复杂行为识别
基于概率图模型的图像分割方法研究
基于动态不确定因果图的概率安全评价新方法研究