Software defect prediction (SDP) has important application value in software test and software quality assurance, in which cross-project defect prediction (CPDP) has been a popular research direction in SDP. For unlabeled data, how to efficiently build CPDP models is an important research topic. Particularly, the modeling of the negative transfer and different data distributions in CPDP has become key scientific problems. Firstly, this topic proposes a method to analyze and compare the CPDP models, which aims to provide the support for the evaluation of the prediction ability of model. Then, with the ensemble learning technique in artificial intelligence, a source project selection ensemble based data-selection framework is built to solve the problem of negative transfer in the source project. Finally, with the transfer learning technique, a cost-sensitive kernel transfer learning based unified framework for homogeneous and heterogeneous CPDP is constructed to solve the problem of different data distributions between the source and target projects. Moreover, the unified framework also considers the class imbalance and linear inseparability characteristics of the defect data. This research will be provide theoretical basis and technical support for CPDP, and improve the quality and reliability of software products, which has great theoretical significance and practical potentiality.
软件缺陷预测在软件测试和软件质量保证中有重要应用价值,其中跨项目缺陷预测已成为软件缺陷预测研究的热点方向。面向无标注数据,如何构建高效的跨项目缺陷预测模型是该方向研究重要课题。特别是,跨项目缺陷预测中的负迁移和数据分布不一致建模已成为关键科学问题。本项目首先探索一种分析比较跨项目缺陷预测模型的方法,为模型预测能力的评价提供支持;采用人工智能中的集成学习技术,建立基于源项目选择集成的数据选取框架,用于解决源项目数据的负迁移问题;采用迁移学习技术,同时考虑缺陷数据的类不平衡与线性不可分特点,构建基于代价敏感核迁移学习的同构和异构跨项目缺陷预测统一框架,用于解决源与目标项目的数据分布不一致问题。本项目的研究将为跨项目缺陷预测提供理论基础和技术支撑,提高软件产品的质量与可靠性,具有重要的理论意义和广阔的应用前景。
软件缺陷预测在软件测试和软件质量保证中有重要应用价值,其中跨项目缺陷预测已成为软件缺陷预测研究的热点方向。本项目对跨项目缺陷预测进行深入研究,主要解决源项目数据的负迁移问题以及源与目标项目数据之间的分布不一致问题,特别是在异构度量情况下,进行异构跨项目缺陷预测的研究。具体地,.针对跨项目缺陷预测模型的缺陷预测能力问题,深入分析比较异构跨项目缺陷预测模型的缺陷预测能力,并且分析比较同构与异构跨项目缺陷预测模型的缺陷预测能力。.针对源项目数据的负迁移问题,在软件模块粒度上采用近邻算法设计了一种基于代表性实例选择的方法;在软件项目粒度上采用最大均值差异算法通过测量源与目标项目数据之间的距离设计了一种基于最大均值差异的源项目选择方法。.针对源与目标项目数据之间的分布不一致建模问题,在同构度量的情况下,采用域自适应学习技术,提出了一种基于核判别子空间对齐的跨项目缺陷预测方法;结合数据选择与采样技术,提出了一种基于数据选择与采样的域规划跨项目缺陷预测方法;组合特征选择和域自适应学习技术,提出了一种基于相关性度量选择与相关对齐的跨项目缺陷预测方法。.在异构度量的情况下,采用基于异构域自适应学习的迁移学习技术,提出了一种基于数据采样和核流形鉴别对齐的异构跨项目缺陷预测方法。通过组合异构的源数据和少量的目标项目数据,该方法可以从标注的源数据和无标注的目标数据中学到鉴别的迁移信息,有利于提升缺陷预测性能。.面向软件缺陷预测的实际需求,本项目采用数据选择、采样、迁移学习等技术,立足现有模型,研究基于无标注数据的跨项目缺陷预测新方法,用于保障软件产品的质量与可靠性,为跨项目缺陷预测技术在工程实践中的发展与应用提供理论基础与方法支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
跨社交网络用户对齐技术综述
基于LASSO-SVMR模型城市生活需水量的预测
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于主动迁移学习的软件缺陷预测模型与方法研究
基于深度学习和迁移学习的东盟跨语言查询扩展研究
跨项目缺陷预测中软件度量及源项目选择方法研究
基于代码语义结构特征自动学习的软件缺陷预测研究