随着Web应用的迅速发展,关系数据库与信息检索交叉研究引起广泛关注。关系数据库信息检索是从数据库角度出发研究利用信息检索技术增强关系数据库的信息检索能力, 目前其检索效果和效率往往难以令人满意。不同于当前以"关系数据库上元组级别的信息检索"为主的研究,本项目提出"关系数据库上对象级别的信息检索"研究,克服关系数据库模式"面向存储"和"数据库规范化设计把完整的实体信息分散到多表多元组中不利于信息检索"这两个主要缺点,以对象观点看待关系数据,构建面向用户的、易于理解的关系数据对象模型,研究对象级别检索算法、相关性排序算法和检索结果展现机制,开发原型验证系统。本项目以有效提高数据库信息检索效果为主要研究目标,兼顾检索效率改进,对完善和发展数据库信息检索理论方法和技术、促进数据库和信息检索技术融合、加速数据库信息资源有效开发和利用具有重要意义和良好的应用前景。
首先综述相关研究现状,然后从数据建模、检索算法、结果相关性排序和结果展现等方面进行全面研究,完成项目研究任务和计划。下面概述主要研究成果。.综述系统地研究了对象级别的数据库信息检索(DBOIR)的研究背景和现状,分析几种具有对象观点的关系数据库信息检索方法,探讨DBOIR的基本思想,给出对象级别的几个概念,提出主要研究内容,设计研究框架,明确未来研究方向。该成果发表在《计算机科学》期刊上。.提出一种关系数据库对象级别数据模型的构建方法。其基本思想是:把关系数据库模式分为四类:主、从、连接和代码等四种关系。根据关系聚类结果,构建对象级别模式图,生成对象级别数据图。对象图中每个对象是由若干连接元组构成的。生成对象图的节点数和边数都比元组级别数据图有大规模的减少。该成果发表在FCST国际学术会议上。.设计一个对象级别的关系数据库信息检索方法——DBORank。该方法从数据库和信息检索两个角度出发设计一种灵活有效的评分机制,既考虑对象级别数据图的链接结构,还考虑图中对象结点的内部结构,边的类型和权值,对象内容相关性等因素,提高了算法的检索效果, 同时从迭代算法和Top-K排序算法两方面优化DBORank算法的检索效率。该成果发表在《计算机科学与探索》上。.设计基于嵌入图数据库的对象级别检索算法——ObjectMatch,其创新点是:提出高效抽取与同步关系数据为图数据的策略:改进对象级别建模方法;设计嵌入图数据库的对象级别关键词检索算法。该成果发表在《计算机工程与设计》上。.提出一种对象级别检索结果相关性排序算法,其创新点包括:基于信息熵为属性分配权值;衡量属性值与关键词关系紧密程度;元组内容相似性计算;对象内部边计算。该成果发表在《计算机科学》期刊上。提出一种关系数据库对象级别检索结果的聚类方法,包括五步:预处理;基于结构的聚类;基于内容的聚类;生成聚类结果集;聚类结果标签生成。该成果将发表在《计算机应用与软件》期刊上。.此外,我们从RDF图、贝叶斯网络、MapReduce等方面探索数据图检索新算法。从模糊逻辑和本体、概率等方面扩展研究如何增强数据库语义检索能力。.总的来说,研究成果发表SCI检索论文1篇、EI检索论文4篇、中文核心期刊论文12篇、其他论文2篇。该项目直接培养毕业研究生14名,目前在读研究生4名。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
货币政策与汇率制度对国际收支的影响研究
信息物理融合的Web对象可视检索技术研究
网格环境下数据库信息检索新技术研究
基于受限网络的移动对象数据库关键技术研究
面向室内空间的移动对象数据库关键技术研究