文本复制取证是为判断一个文本的内容是否抄袭、剽窃或复制于另外一个或多个文本提供证据,是打击抄袭、剽窃、盗版等侵权行为的有效手段,是数字取证的一个重要分支,是近年才发展起来的一个新兴的重要研究领域。基于内容的文本复制取证是文本复制取证的发展方向。本课题拟对多语言共存文本的复制取证中涉及到的文本指纹提取、文本指纹索引与压缩、复制取证策略等关键内容进行深入研究,力图减少多语言共存文本复制取证的存储开销、加快取证的速度、提高取证的精度。课题的主要研究内容包括:基于N-gram的文本指纹提取方法、N-gram项的指纹权重计算方法、基于N-gram的指纹索引与压缩方法、文本复制取证优化策略和文本复制取证原型系统的建立等。通过课题的研究,将在基于N-gram的文本指纹提取、适用于多语言共存文本的文本复制取证等方面完善自然语言文本复制取证的基本理论和方法,为推动自然语言文本取证的发展提供技术支撑。
文本复制取证是为判断一个文本的内容是否抄袭、剽窃或复制于另外一个或多个文本提供证据,是打击抄袭、剽窃、盗版等侵权行为的有效手段,是数字取证的一个重要分支,是近年才发展起来的一个新兴的重要研究领域。基于内容的文本复制取证是文本复制取证的发展方向。本课题对多语言共存文本的复制取证中涉及到的文本指纹提取、文本指纹索引与压缩、复制取证策略等关键内容进行了深入的研究。通过课题的研究,课题组成员提出了多种文本复制取证的方法与关键技术,发表了学术论文17篇,其中被SCI收录7篇、EI收录15篇,培养博士生5名,硕士生3名。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
Identification of the starting reaction position in the hydrogenation of (N-ethyl)carbazole over Raney-Ni
One-step prepared prussian blue/porous carbon composite derives highly efficient Fe-N-C catalyst for oxygen reduction
固溶时效深冷复合处理对ZCuAl_(10)Fe_3Mn_2合金微观组织和热疲劳性能的影响
Ultrafine Fe/Fe_3C decorated on Fe-N_x-C as bifunctional oxygen electrocatalysts for efficient Zn-air batteries
基于可比语料的多语言文本聚类研究
多语言智能文本处理中基于主题语义空间的文本表示研究
基于云计算的文本复制检测研究
基于多语言微博文本的新疆热点事件检测关键技术研究