As the interdiscipline of data mining and software engineering, mining bug repositories is a leading field in the current research of computer science. In mining bug repositories, software tasks are converted into the problem of data mining to improve software quality. However, existing work on mining bug repositories simply maps bugs or developers into instances or labels. Such mapping has omitted the inherent difference of experience between developers or the differences of importance between bugs, therefore significantly restricted the solutions of software tasks. In this project, we issue a series of research problems on the priority mining in bug repositories, which aims to mine, analyze, and apply the experience of developers or the importance of bugs (in this project, priority refers to the experience of developers or the importance of bugs). These research problems can be divided into three levels, namely 1) the level of model building - how to build algorithms models for mining developer priority or bug priority to adapt to the large-scale data processing and the noise tolerance, 2) the level of model analysis - whether the developer priority or bug priority can keep stable with the time evolution and the changes of software granularity, 3) the level of model application - how to apply developer priority or bug priority to solve various typical tasks, which are related to bug handling. The project can effectively enhance the current work on mining bug repositories and improve the software tasks in bug repositories.
作为数据挖掘与软件工程的交叉领域,bug仓库挖掘是国际学术界的前沿研究领域。它通过将软件任务转化为数据挖掘问题,为提高软件质量提供了新的途径。已有的研究成果通常将bug仓库的主体(bug或开发者)简单映射为数据实例或者标签,而未考虑开发者的经验程度或bug的重要程度差异,严重影响了相关的软件任务的求解效果。本项目围绕如何挖掘、分析及应用bug仓库中的开发者的经验程度和bug的重要程度(报告中,经验程度或者重要程度被泛称为优先级),凝练出一系列科学问题:1)模型建立层面,如何建立适应大规模数据和抗噪音的模型,以挖掘开发者或bug的优先级;2)模型分析层面,如何分析优先级随时间,软件部件粒度演化的性质;3)模型应用层面,如何利用优先级解决与bug处理相关的各种典型任务。结合已有的研究基础,项目组拟定了切实可行的研究方案。该项目有望显著拓展bug仓库挖掘的研究范畴,改进基于bug仓库的软件任务。
作为数据挖掘与软件工程的交叉领域,bug仓库挖掘是国际学术界的前沿研究领域。它通过将软件任务转化为数据挖掘问题,为提高软件质量提供了新的途径。已有的研究成果通 常将bug仓库的主体(bug或开发者)简单映射为数据实例或者标签,而未考虑开发者的经 验程度或bug的重要程度差异,严重影响了相关的软件任务的求解效果。本项目围绕如何 挖掘、分析及应用bug仓库中的开发者的经验程度和bug的重要程度(报告中,经验程度或 者重要程度被泛称为优先级),凝练出一系列科学问题:1)模型建立层面,如何建立适应 大规模数据和抗噪音的模型,以挖掘开发者或bug的优先级;2)模型分析层面,如何分析 优先级随时间,软件部件粒度演化的性质;3)模型应用层面,如何利用优先级解决与bug 处理相关的各种典型任务。结合已有的研究基础,项目组拟定了切实可行的研究方案。该 项目有望显著拓展bug仓库挖掘的研究范畴,改进基于bug仓库的软件任务。本课题严格按照课题申请书和计划书要求,分别对3个科学问题进行了深入研究,圆满完成了预定的研究任务。在本课题支持下,在 IEEE Transactions on Knowledge and Data Engineering,IEEE Transactions on Services Computing,ACM Transactions on Internet Technology等期刊和 ICSE 等本领域著名会议上发表论文 10篇。研究成果获得国内外研究专家及学者的肯定。在本课题的资助下,课题组负责人江贺教授获得2015年获得九三学社辽宁省十大杰出中青年科技人才称号,2016年获得第二届东软-NASAC青年软件创新奖,2017年度优秀青年基金。本课题一共支持了8位博士生,14位硕士生,其中2位博士生毕业,4位硕士生毕业。同时,课题组8人次参加国内相关会议。在课题的支持下,研究团队的科研水平显著提高, 在国内外影响力明显提升。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于脉搏波的中医体质自动辨识系统研究初探
基于数据挖掘治疗过敏性紫癜肾炎用药规律探讨
Haynes282合金中不同元素含量对析出相析出行为的影响
融合多种支持度定义的频繁情节挖掘算法
2009-2018 年期间尼泊尔地区 OLR 异常信号数据挖掘 数据集
面向Bug报告的软件故障重现方法研究
数据驱动的软件过程挖掘研究
仓库害虫大环内酯集合信息素合成和应用研究
软件系统关键模块结构挖掘及其演化分析方法研究