Crowd software engineering has becoming a new software development mode in cloud era, which rapidly constructs large scale software with complex functions and technological innovation using crowd efforts and swarm intelligence. However, it faces challenges from Software engineering big data: hundreds of thousands of developers, over ten millions of lines of code, huge amounts of requirements, design models, test cases, defects, changes, plan and tasks, discuss records, email messages and etc. Therefore, information awareness and knowledge discovery from these distributed, heterogeneous and massive data becomes a difficult problem. The project will introduce Semantic Web into software engineering, interlink and integrate these software artefacts, and explore linked data driven semantic query and mining methods and technologies. The project focuses on (1) Establish the ontology based software engineering linked data model, and propose ontology annotation and RDF data generation method for software engineering linked data; (2) Construct the linked data driven unified framework for software engineering data semantic query and mining, and realize efficient query on massive linked data; (3) Explore the novel technologies and algorithms of software product quality prediction using data link features, pertinent artifacts recommendation using association analysis,and crowd development collaboration pattern discovery using data link graph mining. Therefore, software intelligent will be realized to support crowd software development life cycle.
群体软件工程正成为云时代软件开发新模式,它利用群体开发力量和群体智能技术,快速构造规模庞大、功能复杂、技术创新的软件。然而群体协同开发面临大规模数据的挑战:几十万名开发人员、千万行代码、大量的需求、设计模型、测试用例、缺陷、变更、任务、讨论记录和邮件等等,如何从这些分布异构的大规模数据中高效地知晓信息和发现知识成为难题。本项目将语义网引入软件工程领域,把这些多源异构数据进行细粒度语义关联,研究关联数据驱动的软件工程数据挖掘的新方法和新技术,重点研究:①建立基于本体的软件工程关联数据模型,提出本体标注和RDF生成方法,实现关联数据的自动构建;②建立软件工程关联数据挖掘框架,实现大规模关联数据的存储和查询;③在此基础上探索基于数据关联特征的软件产品质量预测、基于关联分析的关联修改推荐和基于数据关联图挖掘的群体开发协同模式发现技术和算法;以实现覆盖群体软件开发全生命周期的软件智能。
群体软件工程正成为云时代软件开发新模式,它利用群体开发力量和群体智能技术,快速构造规模庞大、功能复杂、技术创新的软件。然而群体协同开发面临大规模数据的挑战:几十万名开发人员、千万行代码、上千版本版次、大量的需求、设计模型、测试用例、缺陷、变更、任务、讨论记录和邮件等等,如何从这些分布异构的大规模数据中高效地知晓信息和发现知识,从而在软件全生命周期中支持大规模复杂软件的智能开发?本项目将语义网引入软件工程领域,把这些多源异构数据进行细粒度语义关联,研究提出了关联数据驱动的软件工程数据挖掘的方法和技术,主要成果包括:①建立了基于本体的软件工程关联数据模型,提出了概念与实体识别、关联关系发现、本体标注和RDF生成方法,实现了大规模软件关联数据的自动构建;②建立了基于关联数据的软件工程数据挖掘框架,实现了大规模关联数据的高效存储和语义查询;③提出了一系列关联数据驱动的软件分析、搜索、预测与推荐的模型与算法,包括跨项目跨团队的缺陷预测、软件工作量的早期估算、面向多制品的变更影响分析、程序员自动画像、人员-任务的智能推荐、项目与代码的语义搜索。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
基于分形维数和支持向量机的串联电弧故障诊断方法
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
面向电信海量数据的群体关系数据挖掘研究
面向时空轨迹数据异常和关联模式的挖掘模型
以决定为基础、面向开发与维护过程的软件工程方法
面向健康管理数据的关联型知识深度挖掘方法研究