Nowadays, network techniques bring a wide spectrum of maximizing sharing and coping data. Data copy detection problems become more and more important. Data copy detection plays important roles on not only piracy prevention but also improving quality of information retrieval from the Web. The existing copy detection techniques, however, only focus on data sources using the same data model and ignore the important features of multiple data sources, such as heterogeneous data model, complex copy relationships, uncertain copy directions, and large scale data. These features make the problem more complex and challenge. The proposal aims to discover the internal affects of copying diction among multiple heterogeneous data models, and providing important theory evidences and detection approaches for real applications. The primary research contents include key techniques on copying detection, which are data matching strategies across heterogeneous data models, similarity functions for copying from heterogeneous data sources, multiple dimensional copy direction determination approaches, and detection optimization algorithms for large scale data. The project will design, implement, and evaluate the proposed algorithms. We try to have a breakthrough to get better database theory and techniques, and develop a base for real applications.
网络技术在使得数据共享便捷的同时,也使得数据复制更加容易,由此引发的数据复制检测问题变得越来越不容忽视。数据复制检测对于软件设计、防止盗版、改善信息检索质量等方面具有至关重要的作用。现有的数据复制检测技术主要是面向同一类型的数据,忽视了多源数据的异构性、复制关系的复杂性、复制方向的不确定性、及复制数据的大规模性等特点。这些特点使复制检测技术变得更加复杂,更具有挑战性。本项目申请旨在揭示多源环境中异构数据之间复制的内在联系,为实现更加适合实际应用的跨模型多源数据复制检测技术提供重要的理论依据和检测方法。主要研究内容包括:支持跨模型的数据映射策略、支持跨模型复制的相似性度量方法、多维度复制方向判定、支持大规模数据的检测优化算法等。设计、实现和评价相关的算法,争取在相关理论和技术上取得一定的突破, 为今后的实际应用推广奠定坚实的基础。
网络技术在使得数据共享便捷的同时,也使得数据复制更加容易,由此引发的数据复制检测问题变得越来越不容忽视。数据复制检测对于软件设计、防止盗版、改善信息检索质量等方面具有至关重要的作用。现有的数据复制检测技术主要是面向同一类型的数据,忽视了多源数据的异构性、复制关系的复杂性、复制方向的不确定性、及复制数据的大规模性等特点。课题在研究这些多源异构的数据之间复制关系和内容比对方面做了大量的工作。并且,针对多源数据的异构性、复制关系的复杂性、复制方向的不确定性、及复制数据的大规模性等特点,展开相关性的研究过工作。主要研究内容包括:支持跨模型的数据映射策略、支持跨模型复制的相似性度量方法、多维度复制方向判定、支持大规模数据的检测优化算法等。设计、实现和评价相关的算法,在相关理论和技术上取得一定的突破, 为今后的实际应用推广奠定坚实的基础。.本课题组针对上述目标进行了相关的研究工作,在支持跨模型的数据映射策略、支持跨模型复制的相似性度量方法、多维度复制方向判定方法和支持大规模数据的检测优化算法等方面取得了多项研究成果。在国际、国内学术会议和期刊发表论文50余篇,培养博士生2名,硕士生18名。先后派30余人次参加国际会议。获得1次国际会议优秀学生论文奖,获得中国专利1项,申请并被受理中国专利2项。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于多模态信息特征融合的犯罪预测算法研究
面向云工作流安全的任务调度方法
基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制
基于全模式全聚焦方法的裂纹超声成像定量检测
基于PLC-IP3-Ca2+/NO-cGMP-PKG信号通路的半夏泻心汤防治糖尿病胃轻瘫的机理研究
分子伴侣Calnexin/Calreticulin和Erp57在流感病毒HA蛋白成熟过程中的作用研究
多源数据挖掘的关键技术研究
多源遥感数据支持的无资料地区积雪模型参数化研究
跨语言文本复制检测研究
基于多模态数据与多耦合模型的肺动脉高压无创检测关键技术研究