Information quality has become an important issue in many application areas. Automatically detecting and correcting information errors has proven to be an effective way to improve information quality in most information systems. Existing technologies are mostly rule-based and require adequate well-structured data in a database. They are unable to find perfect information quality rules and compelling correcting results when, as is often the case, the available data is insufficient. Introducing web information to help information error detection and correction is an effective way to overcome the shortcomings of existing techniques. This proposal focuses on the web-based technologies for automatic information error detection and correction. We will propose a unified web-based information expansion model to automatically extract additional information from the WEB for relational data, based on which we will present a set of effective information error detection and correction algorithms and a set of web-based reliability evaluation models for our proposed techniques. In order to evaluate the effectiveness of our technologies, we will build a demo system. We hope our research can help people find a new way to enhance the quality of information in their areas.
信息质量已经成为诸多应用领域面临的一个重要问题,自动检测和修复信息系统中的信息错误是改善信息质量的有效手段。现有的基于规则的信息错误自动检测与修复技术过分依赖数据库中的信息,在相关信息信息量不足时无法确保能够发现有效的信息质量规则和进行准确的信息错误修复。利用WEB进行信息扩展以助于信息错误自动检测与修复可以克服上述不足。本项目将重点关注基于WEB信息的关系型信息错误自动检测与修复技术。拟构建基于WEB信息的信息扩展模型自动扩展关系型信息的信息量,在此基础上提出有效适用的信息错误自动检测与修复算法,基于WEB信息构建合理的评估模型对信息错误自动检测与修复算法的可靠性进行评估。为全面验证所提出的模型及方法的有效性,本项目将设计和开发一个信息错误自动检测与修复原型系统。我们期望本项目的研究能为改善关系数据库信息质量提供一种新的途径。
信息质量已经成为诸多应用领域面临的一个重要问题,自动检测和修复信息系统中的信息错误是改善信息质量的有效手段。现有的基于规则的信息错误自动检测与修复技术过分依赖数据库中的信息,在相关信息信息量不足时无法确保能够发现有效的信息质量规则和进行准确的信息错误修复。利用WEB进行信息扩展以助于信息错误自动检测与修复可以克服上述不足。本项目重点关注基于WEB信息的关系型信息错误自动检测与修复技术,研究内容包括:基于WEB信息的信息扩展模型、信息错误自动检测与修复算法,基于WEB信息的信息错误自动检测与修复算法的可靠性评估模型。本项目重点开展了WEB信息的信息完整性错误自动修复算法、属性值同一性判定问题、基于WEB信息的一致性规则挖掘方法、一致性错误的修复算法、时效性判定算法的研究,并且在开展上述研究的过程中融合了基于WEB信息的信息自动扩展模型、精确性判定(控制)、一致性错误修复的可靠性判定模型的研究。在上述领域均取得了一定的进展,在国内外知名学术刊物和学术会议发表学术论文25篇,录用2篇。发表论文中包括CCF A类会议ICDE 2篇、CCF A类会议WWW 1篇、《Information Sciences》等SCI期刊7篇、《计算机学报》3篇、《软件学报》4篇。另外,在CCF A类期刊《IEEE Transactions on Knowledge and Data Engineering》和SCI 期刊《Frontiers of Computer Science》期刊录用2篇。1篇论文获得了国际会议“Best Presentation Award”。组织了1次小型研讨会,邀请了多名海内外优秀青年学者到访交流。申报国家技术发明权利2项、软件著作权2项。毕业博士生2名、硕士生5名。本项目所提出的方法具有对待检测与修复的信息本身依赖少、信息质量规则更灵活、适用性更广、信息修复相对更准确等优势,可以与其他类别的技术结合用于提升政务信息、社保、医药、物流等领域的信息质量。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
肉苁蓉种子质量评价及药材初加工研究
基于全模式全聚焦方法的裂纹超声成像定量检测
中外学术论文与期刊的宏观差距分析及改进建议
基于图卷积网络的归纳式微博谣言检测新方法
基于用户选择与判断的Web信息搜索技术研究
基于测试信息的交互式错误定位技术研究
WEB信息融合粒化与聚合技术研究
基于Web的图像检索与信息挖掘研究