Software defects prediction is the focus of the empirical software engineering field recently. It is significant to the optimization of quality assurance activities. The key problem is how to find appropriate data from existing labeled software projects efficiently, and how the predictive model which adapt to the practice can be built in data-driven software defects prediction. This project presents a research on multi-source data driven software defects prediction. It aims to solve the key problems: (1) Research the method of hierarchical multi-source data driven software defects data selection,as well as filter and describe the characteristic on project data layer and software module instances layer to solve the problem of effective data selection. (2) Based on the different error cost, design and implement the adaptive model learning algorithm to improve the adaptability and flexibility of software defects prediction models in practice. (3) Establish a standard and universal multi-source software data sharing database on the premise of raise privacy processing algorithms for software data, which provides the basis for the multi-source data selection and model construction. This project presents a new method to solve the key issue in data-driven software defects prediction from both versatility and practicality perspective. In the meantime, it provides new idea and theory for the development of software defects prediction theory and application.
软件缺陷预测是目前实证软件工程领域的研究热点,对提高软件测试效率和保证软件可靠性具有重要意义。在数据驱动的软件缺陷预测中,如何高效地实现从已有缺陷标注的软件项目中选择合适的数据以及如何构建适应实践需求的预测模型是目前亟待解决的关键问题。本项目提出多源数据驱动的软件缺陷预测方法研究,拟解决:(1)提出分层的多源软件缺陷数据选择方法,分别在项目数据层和软件模块实例层实现其特征描述和筛选,解决数据的精准高效选择问题;(2)基于软件模块缺陷错误预测的代价不同,提出需求适应的模型学习算法,提高缺陷预测模型在实践应用中的适应性和灵活性;(3)从多源软件缺陷数据使用和共享中遇到的关键技术入手,提出软件数据隐私处理算法及共享库模型,为实现多源数据的选择和模型构建提供基础。课题从通用性和实用性角度提出了解决数据驱动软件缺陷预测中关键问题的新方法,为软件缺陷预测理论和应用的发展提供新的思路和理论依据。
在软件缺陷预测中,基于多源数据实现目标软件的缺陷预测是目前该领域研究的前沿技术。为了获得更加有效的预测结果,课题组对其中涉及到的多源数据过滤、预测模型构建以及多版本数据选择等关键技术进行了探索和完善,从通用性和实用性角度归结出多源数据驱动的软件缺陷预测方法。主要研究工作包括以下几个方面:.(1)通过提炼软件缺陷预测的研究背景和流程框架,对近年内相关的研究成果进行了分类总结和比较,完成了数据驱动的软件缺陷预测研究综述,其结论可以为软件缺陷预测的进一步研究提供技术基础。.(2)在多源数据驱动的缺陷预测中,如何处理多源项目与目标项目之间的数据漂移决定着模型的性能。提出一种面向多源数据的分级过滤算法,解决了模型数据的精准高效选择问题,为多源数据驱动的模型构建提供了基础。.(3)通过分析预测模型对错误分类的不同代价,提出一种代价感知的软件缺陷预测模型方法。该方法在保证预测性能的前提下,具有更好的稳定性和灵活性,更符合软件工程的实践需求。.(4)提出了跨版本的软件缺陷预测方法,通过实证研究手段对跨版本的演化属性和多版本数据选择方法进行验证,进而给出了实践可行的跨版本预测模型数据选择和共享方案。.(5)课题组还将研究成果进行扩展,重点关注了软件可靠性评估方法以及轻量级软件故障定位等方法的研究。课题研究范围涉及到从“宏观”系统可靠性评估到“中观”软件缺陷预测,再到“微观”软件故障定位等系列方法的研究。相关研究成果可以为软件缺陷预测的理论研究和应用提供新的思路和依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
农超对接模式中利益分配问题研究
粗颗粒土的静止土压力系数非线性分析与计算方法
基于LASSO-SVMR模型城市生活需水量的预测
多源数据驱动的交通事故时空影响范围连续预测方法研究
面向深海AUV的多源数据驱动定位方法研究
基于多源数据整合的药物组合预测方法研究
面向气路故障的多源数据驱动航空发动机剩余寿命智能预测方法研究