面向群体协同开发的软件工程关联数据挖掘

基本信息
批准号:61472242
项目类别:面上项目
资助金额:76.00
负责人:沈备军
学科分类:
依托单位:上海交通大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:陈昊鹏,唐新怀,于海波,陈雨亭,任锐,林子熠,张宇,李碧雯,朱剑钢
关键词:
数据挖掘群体软件工程关联数据本体标注
结项摘要

Crowd software engineering has becoming a new software development mode in cloud era, which rapidly constructs large scale software with complex functions and technological innovation using crowd efforts and swarm intelligence. However, it faces challenges from Software engineering big data: hundreds of thousands of developers, over ten millions of lines of code, huge amounts of requirements, design models, test cases, defects, changes, plan and tasks, discuss records, email messages and etc. Therefore, information awareness and knowledge discovery from these distributed, heterogeneous and massive data becomes a difficult problem. The project will introduce Semantic Web into software engineering, interlink and integrate these software artefacts, and explore linked data driven semantic query and mining methods and technologies. The project focuses on (1) Establish the ontology based software engineering linked data model, and propose ontology annotation and RDF data generation method for software engineering linked data; (2) Construct the linked data driven unified framework for software engineering data semantic query and mining, and realize efficient query on massive linked data; (3) Explore the novel technologies and algorithms of software product quality prediction using data link features, pertinent artifacts recommendation using association analysis,and crowd development collaboration pattern discovery using data link graph mining. Therefore, software intelligent will be realized to support crowd software development life cycle.

群体软件工程正成为云时代软件开发新模式,它利用群体开发力量和群体智能技术,快速构造规模庞大、功能复杂、技术创新的软件。然而群体协同开发面临大规模数据的挑战:几十万名开发人员、千万行代码、大量的需求、设计模型、测试用例、缺陷、变更、任务、讨论记录和邮件等等,如何从这些分布异构的大规模数据中高效地知晓信息和发现知识成为难题。本项目将语义网引入软件工程领域,把这些多源异构数据进行细粒度语义关联,研究关联数据驱动的软件工程数据挖掘的新方法和新技术,重点研究:①建立基于本体的软件工程关联数据模型,提出本体标注和RDF生成方法,实现关联数据的自动构建;②建立软件工程关联数据挖掘框架,实现大规模关联数据的存储和查询;③在此基础上探索基于数据关联特征的软件产品质量预测、基于关联分析的关联修改推荐和基于数据关联图挖掘的群体开发协同模式发现技术和算法;以实现覆盖群体软件开发全生命周期的软件智能。

项目摘要

群体软件工程正成为云时代软件开发新模式,它利用群体开发力量和群体智能技术,快速构造规模庞大、功能复杂、技术创新的软件。然而群体协同开发面临大规模数据的挑战:几十万名开发人员、千万行代码、上千版本版次、大量的需求、设计模型、测试用例、缺陷、变更、任务、讨论记录和邮件等等,如何从这些分布异构的大规模数据中高效地知晓信息和发现知识,从而在软件全生命周期中支持大规模复杂软件的智能开发?本项目将语义网引入软件工程领域,把这些多源异构数据进行细粒度语义关联,研究提出了关联数据驱动的软件工程数据挖掘的方法和技术,主要成果包括:①建立了基于本体的软件工程关联数据模型,提出了概念与实体识别、关联关系发现、本体标注和RDF生成方法,实现了大规模软件关联数据的自动构建;②建立了基于关联数据的软件工程数据挖掘框架,实现了大规模关联数据的高效存储和语义查询;③提出了一系列关联数据驱动的软件分析、搜索、预测与推荐的模型与算法,包括跨项目跨团队的缺陷预测、软件工作量的早期估算、面向多制品的变更影响分析、程序员自动画像、人员-任务的智能推荐、项目与代码的语义搜索。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

沈备军的其他基金

相似国自然基金

1

面向电信海量数据的群体关系数据挖掘研究

批准号:60402011
批准年份:2004
负责人:吴斌
学科分类:F0113
资助金额:20.00
项目类别:青年科学基金项目
2

面向时空轨迹数据异常和关联模式的挖掘模型

批准号:41171345
批准年份:2011
负责人:裴韬
学科分类:D0114
资助金额:58.00
项目类别:面上项目
3

以决定为基础、面向开发与维护过程的软件工程方法

批准号:69073348
批准年份:1990
负责人:刘连芳
学科分类:F0203
资助金额:3.50
项目类别:面上项目
4

面向健康管理数据的关联型知识深度挖掘方法研究

批准号:61502014
批准年份:2015
负责人:许焱
学科分类:F0607
资助金额:7.00
项目类别:青年科学基金项目