基于软件多版本演化的克隆家系提取研究

基本信息

批准号：61462071

项目类别：地区科学基金项目

资助金额：44.00

负责人：张丽萍

学科分类：

依托单位：内蒙古师范大学

批准年份：2014

结题年份：2018

起止时间：2015-01-01 - 2018-12-31

项目状态：已结题

项目参与者：刘东升,王春晖,范鹏程,侯敏,尹丽丽,涂颖,张瑞霞,张久杰

关键词：

克隆群映射克隆家系克隆演化模式克隆代码

结项摘要

Clone detection, management and understanding are significant researches in software engineering. They have wide requirements and applications in many fields, such as software maintenance, evolution, architecture, reuse, licensing, anti-plagiarism and so on.For the key problem clone genealogies extraction, we carry out further studies on clone detection, clone group mapping, clone evolution pattern recognition, and clone genealogy extraction based on available results. By choosing the proper granularity of clones, present an optimized algorithm implement the efficient clone detection and reduces the time and space complexity of existing algorithm, map clone groups between adjacent versions of software accurately based on clone detection results, identify the origin of a code clone by its content and position, and then determine evolution pattern between clone groups, extract clone genealogies by combine clone lineages originated from the same clone group, and realize its visualization. At last, an experimental system is obtained, which is portable, language-independent, and visual, for automatically extract clone genealogies. The achievements will provide reference of code clones evolution analysis, thus provide powerful support to the management and maintenance of code clones.

克隆代码检测、管理和理解是软件工程的重要研究内容，其在软件维护、演化、架构、复用及软件授权、反剽窃等众多领域有广泛的需求与应用。基于已有研究成果,针对"克隆家系提取"这一关键问题，围绕"检测克隆代码"、"建立克隆群映射"、"识别克隆演化模式"、"提取克隆家系"四个具体核心问题深入开展研究。通过选取适当克隆代码粒度，提出改进算法实现高效检测克隆代码，并达到降低现有算法时空复杂度的目的；基于克隆检测结果，准确映射历时演化文件版本间的克隆群；从克隆片段的内容和位置两个方面来确定克隆片段的起源，从而确定克隆群之间的演化模式；把具有共同祖先的直系克隆提取出来组成克隆家系，并对其实现可视化。最终，设计开发一个与程序设计语言无关的、可移植的、可视化的克隆家系提取实验系统。预期成果将为克隆代码的演化分析提供参考，从而为克隆代码的管理和维护提供有力的支持。

项目摘要

在软件工程领域中，克隆代码检测、分析和管理是其重要的研究内容，在软件维护、演化、架构、复用及软件授权、反剽窃等众多领域有着广泛的需求与应用。本项目针对“克隆家系提取”这一关键问题，从检测克隆代码、建立克隆群映射、识别克隆演化模式、提取克隆家系四个方面进行研究。主要包括如下内容：通过选取适当克隆代码粒度，开发了一款基于Token编辑距离的克隆检测工具以实现高效检测克隆代码，该检测工具的匹配过程更加严格，进一步提高了查全率与查准率；基于克隆检测结果，提出了基于LDA和DBSCAN的软件多版本克隆群映射方法，准确映射历时演化文件多版本间的克隆群；结合克隆群内克隆片段数量以及内容的变化方式将克隆群分为静态、新增、去除、相同、分离、合并、一致和不一致等八种短期演化模式，使克隆的演化过程更加清晰全面；串联所有版本中的克隆映射关系和演化模式构建克隆家系，将获得的克隆家系结果存储在XML文件中，便于后续研究中的提取使用。运用多种方法进行克隆映射和演化模式的识别，解决了克隆映射粒度较粗和演化模式识别繁琐等问题，构建了多版本的克隆家系。“克隆家系”的研究是本项目的核心，也是项目申请的主要内容。随着项目的推进，在克隆家系的基础上，项目组还分析了克隆代码不同演化模式的Bugs倾向性研究，并利用软件的演化历史，对需要重构的克隆代码进行识别与推荐。这些扩展研究不仅丰富了“克隆家系”的研究内容，还对克隆家系的研究结果进一步应用与实践。围绕本项目研究内容，项目组成员发表论文14篇，申请软件著作权5项，实现克隆群映射系统和克隆家系提取系统各一个，超额完成了项目计划任务书中预订的各项任务。项目的完成对有克隆代码的深入研究有重要理论意义，为克隆代码的演化分析提供参考，为克隆代码的管理和维护提供有力的支持，这些研究工作对学界和产业界的相关工作都具有非常重要的研究价值和现实意义。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.12005/orms.2019.0029

发表时间：2019

DOI：10.3877/cma.j.issn.1674-6880.2020.02.006

发表时间：2020

DOI：10.19287/j.cnki.1005-2402.2019.09.028

发表时间：2019

DOI：

发表时间：2015

DOI：10.16409/j.cnki.2095-039x.2021.03.012

发表时间：2021

张丽萍的其他基金

批准号：20472092

批准年份：2004

资助金额：23.00

项目类别：面上项目

批准号：30973732

批准年份：2009

资助金额：32.00

项目类别：面上项目

批准号：31471586

批准年份：2014

资助金额：80.00

项目类别：面上项目

批准号：29972042

批准年份：1999

资助金额：13.00

项目类别：面上项目

批准号：41471221

批准年份：2014

资助金额：82.00

项目类别：面上项目

批准号：40271071

批准年份：2002

资助金额：30.00

项目类别：面上项目

批准号：20672122

批准年份：2006

资助金额：32.00

项目类别：面上项目

批准号：81673911

批准年份：2016

资助金额：61.00

项目类别：面上项目

批准号：30660231

批准年份：2006

资助金额：21.00

项目类别：地区科学基金项目

批准号：30671371

批准年份：2006

资助金额：8.00

项目类别：面上项目

批准号：30460161

批准年份：2004

资助金额：18.00

项目类别：地区科学基金项目

批准号：20973189

批准年份：2009

资助金额：35.00

项目类别：面上项目

批准号：20073051

批准年份：2000

资助金额：16.00

项目类别：面上项目

批准号：11402224

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：41877065

批准年份：2018

资助金额：61.00

项目类别：面上项目

批准号：41606193

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：40802086

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：30960134

批准年份：2009

资助金额：25.00

项目类别：地区科学基金项目

相似国自然基金

基于多版本技术的自适应编译优化方法研究

批准号：60873057

批准年份：2008

负责人：吴承勇

学科分类：F0202

资助金额：31.00

项目类别：面上项目

基于分片复用的多版本容器镜像加载方法研究

批准号：61602454

批准年份：2016

负责人：徐继伟

学科分类：F0204

资助金额：20.00

项目类别：青年科学基金项目

基于人声检测及分离的多版本流行音乐检索关键技术研究

批准号：61171128

批准年份：2011

负责人：李伟

学科分类：F0117

资助金额：60.00

项目类别：面上项目

网构软件多策略信任演化博弈机制研究

批准号：61272186

批准年份：2012

负责人：印桂生

学科分类：F0201

资助金额：80.00

项目类别：面上项目

基于软件多版本演化的克隆家系提取研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于直觉模糊二元语义交互式群决策的技术创新项目选择

老年2型糖尿病合并胃轻瘫患者的肠道菌群分析

基于物联码的工业产品信息追溯方法研究

辽宁东部晚古生代本溪组煤系地层鳞木的发现及其意义

拟果蝇钠离子通道基因克隆及其生物信息学分析

张丽萍的其他基金

光敏氧化肟生成羰基化合物反应的研究

加味温胆汤调控抑郁模型大鼠海马神经可塑性的胞内信号转导机制

从巨噬细胞TLR1/2信号传导通路探讨绿豆肽免疫调节机制

利用纳米反应器控制烯烃光敏氧化反应的方向

风化花岗岩侵蚀坡地表层流水流动态及携氮磷流失特征研究

西北煤矿区不同开发阶段水土流失动态模拟及调控研究

芳烃三羰基锰络合物的光化学反应及其在合成化学中的应用

基于肠道菌群/TRP-KYN通路调控神经可塑性探讨加味温胆汤干预抑郁症情绪、胃肠动力障碍的作用机制

解郁1号调节神经－内分泌－免疫功能的抗抑郁作用机理研究

外来入侵烟粉虱对新烟碱类杀虫剂抗药性的遗传分化及分子监测技术研究

草果知母汤对癫痫大鼠海马神经元凋亡及基因表达的影响

基于三重态敏化和三重态湮灭的光子上转换

Nafion-水界面和囊泡双分子层调控的超长寿命电荷分离

脉冲切换系统的复杂动力学特性及其分岔机理研究

坡地壤中流地下侵蚀的动力学过程及携养分流失机理对土壤孔性的响应研究

深海放线菌PTM类化合物生物合成中双功能环化酶PacC的结构生物学研究

煤矸石中多环芳烃迁移规律及环境影响效应研究

新疆维、哈两民族人群原发性高血压与αENaC基因多态性的关联研究

相似国自然基金