软件缺陷预测的度量元有效性及建模算法研究

基本信息

批准号：61602534

项目类别：青年科学基金项目

资助金额：20.00

负责人：杨晓杏

学科分类：

依托单位：中山大学

批准年份：2016

结题年份：2019

起止时间：2017-01-01 - 2019-12-31

项目状态：已结题

项目参与者：轩辕哲,董崇武,谢伟,贾殷,吕亚云

关键词：

静态分析软件度量元特征选择机器学习算法软件缺陷预测

结项摘要

With more and more attention paid to software quality, metric-based software defect prediction has become a research hotspot in the field of software engineering. Software defect prediction employs software metrics to construct prediction models, in order to predict defect information of new software modules. The predicted defect information can both reflect the quality of software modules and help to allocate software testing resources. .Currently, there exist some problems in software defect prediction. For example, only a few metrics are efficient for constructing models and the constructed models are much worse than the ideal models. In order to solve these problems, we research on the effectiveness of metrics and model construction algorithms. Firstly, we are aiming at finding new software metrics related to defect prediction, by analyzing the relationship between metrics and defects, in order to provide data which can better distinguish defect-prone modules and defect-free modules. Secondly, we research and provide a goal-driven metric selection method based on the effectiveness and redundancy, in order to select metrics which better fit the application of models. Finally, we research on the model construction algorithms with limited available testing resources. We propose a multi-objective approach to construct software defect prediction models with classification task under the condition of limited available testing resources. We also make some improvements on the previous learning-to-rank approach, in order to construct better software defect prediction models with ranking task. The research of this project will promote the solutions of a series of key problems of software defect prediction, and lay a solid foundation for the application and popularization of defect prediction models in the practical software engineering.

随着软件质量备受关注，基于度量元的软件缺陷预测成为软件工程领域的研究热点，它利用软件模块的各种特征构造模型，预测新模块的缺陷信息。目前软件缺陷预测存在有效度量元较少、构造的模型与理想模型差距较大等问题。为解决这些问题，本课题拟针对度量元的有效性及建模算法进行研究。首先，针对软件缺陷预测有效度量元不足的现状，分析软件模块的各种因素对缺陷的影响，将尚未用于预测但对缺陷影响较大的因素作为新度量元，提供更能区分缺陷的数据。其次，结合模型的应用目的，提出基于有效性及冗余度的目标驱动度量元选择方法。最后，研究可用测试资源有限时的建模算法，提出可用测试资源有限的情况下分类任务缺陷预测的多目标算法，并针对现有缺陷预测排序学习算法的不足提出改进方案，提高预测模型的性能，并给出相应的资源分配策略。本项目的研究将推动解决软件缺陷预测的一系列关键问题，为缺陷预测模型在实际软件工程的应用和推广打下坚实的基础。

项目摘要

基于度量元的软件缺陷预测利用软件模块的度量元信息构造预测模型，用于预测新模块的缺陷信息，这些缺陷信息不但能反映软件模块的质量，还能用于指导测试资源的分配，因此具有较好的应用前景。目前，软件缺陷预测相关的公开数据集有较多的噪音度量元，构造的预测模型与理想模型还有较大差距。因此，本课题针对度量元的有效性及建模算法进行研究。首先，针对排序任务软件缺陷预测度量元分析较为缺乏的现状，分析公开数据集的度量元有效性以及分析度量元对排序任务缺陷预测的影响，并结合模型的应用目的，提出基于有效性及冗余度的目标驱动度量元选择方法；其次，研究可用测试资源有限时的建模算法，提出可用测试资源有限的情况分类任务缺陷预测的多目标算法，并比较分类任务软件缺陷预测的多目标算法与单目标算法；最后，针对现有缺陷预测排序学习算法的不足提出改进方案，提高预测模型的性能。.具体而言，本课题主要完成了以下成果：1）提出一种目标驱动的度量元选择方法，并分析跨版本数据集的度量元有效性，找出较为有效的一些度量元；2）使用效果、代价以及二者的折中作为优化目标，更合理地比较分类任务软件缺陷预测的多目标学习算法和单目标学习算法，从而指导实际情况的算法选择；3）提出使用岭回归和lasso回归方法构造软件缺陷预测回归模型，从而更好地解决软件缺陷预测数据集中的多重共线性问题；4）提出基于排序学习方法的集成算法，从而改进现有软件缺陷预测的排序学习算法，提高预测模型的排序性能；5）提出构造软件缺陷预测模型的多目标学习算法，不但可以得到一组在排序性能、预测精度上各有优势的多样化的预测模型，以供不同的应用场景使用，并且这些模型的复杂度更低。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.13336/j.1003-6520.hve.20200528028

发表时间：2021

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

杨晓杏的其他基金

相似国自然基金

基于规则化Boosting算法和度量元选取技术的软件缺陷倾向预测模型

批准号：61300069

批准年份：2013

负责人：王世海

学科分类：F0605

资助金额：23.00

项目类别：青年科学基金项目

基于软件缺陷预测的软件可信性度量方法研究

批准号：90718024

批准年份：2007

负责人：宋擒豹

学科分类：F0203

资助金额：50.00

项目类别：重大研究计划

代码度量的缺陷预测能力的全面元分析

批准号：61300051

批准年份：2013

负责人：卢红敏

学科分类：F0203

资助金额：23.00

项目类别：青年科学基金项目

面向演化的软件缺陷预测方法研究

批准号：61902161

批准年份：2019

负责人：于巧

学科分类：F0203

资助金额：24.00

项目类别：青年科学基金项目

软件缺陷预测的度量元有效性及建模算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

带有滑动摩擦摆支座的500 kV变压器地震响应

新型树启发式搜索算法的机器人路径规划

杨晓杏的其他基金

相似国自然基金