面向群体协同开发的软件工程关联数据挖掘

基本信息

批准号：61472242

项目类别：面上项目

资助金额：76.00

负责人：沈备军

学科分类：

依托单位：上海交通大学

批准年份：2014

结题年份：2018

起止时间：2015-01-01 - 2018-12-31

项目状态：已结题

项目参与者：陈昊鹏,唐新怀,于海波,陈雨亭,任锐,林子熠,张宇,李碧雯,朱剑钢

关键词：

数据挖掘群体软件工程关联数据本体标注

结项摘要

Crowd software engineering has becoming a new software development mode in cloud era, which rapidly constructs large scale software with complex functions and technological innovation using crowd efforts and swarm intelligence. However, it faces challenges from Software engineering big data: hundreds of thousands of developers, over ten millions of lines of code, huge amounts of requirements, design models, test cases, defects, changes, plan and tasks, discuss records, email messages and etc. Therefore, information awareness and knowledge discovery from these distributed, heterogeneous and massive data becomes a difficult problem. The project will introduce Semantic Web into software engineering, interlink and integrate these software artefacts, and explore linked data driven semantic query and mining methods and technologies. The project focuses on (1) Establish the ontology based software engineering linked data model, and propose ontology annotation and RDF data generation method for software engineering linked data; (2) Construct the linked data driven unified framework for software engineering data semantic query and mining, and realize efficient query on massive linked data; (3) Explore the novel technologies and algorithms of software product quality prediction using data link features, pertinent artifacts recommendation using association analysis,and crowd development collaboration pattern discovery using data link graph mining. Therefore, software intelligent will be realized to support crowd software development life cycle.

群体软件工程正成为云时代软件开发新模式，它利用群体开发力量和群体智能技术，快速构造规模庞大、功能复杂、技术创新的软件。然而群体协同开发面临大规模数据的挑战：几十万名开发人员、千万行代码、大量的需求、设计模型、测试用例、缺陷、变更、任务、讨论记录和邮件等等，如何从这些分布异构的大规模数据中高效地知晓信息和发现知识成为难题。本项目将语义网引入软件工程领域，把这些多源异构数据进行细粒度语义关联，研究关联数据驱动的软件工程数据挖掘的新方法和新技术，重点研究:①建立基于本体的软件工程关联数据模型，提出本体标注和RDF生成方法，实现关联数据的自动构建；②建立软件工程关联数据挖掘框架，实现大规模关联数据的存储和查询；③在此基础上探索基于数据关联特征的软件产品质量预测、基于关联分析的关联修改推荐和基于数据关联图挖掘的群体开发协同模式发现技术和算法；以实现覆盖群体软件开发全生命周期的软件智能。

项目摘要

群体软件工程正成为云时代软件开发新模式，它利用群体开发力量和群体智能技术，快速构造规模庞大、功能复杂、技术创新的软件。然而群体协同开发面临大规模数据的挑战：几十万名开发人员、千万行代码、上千版本版次、大量的需求、设计模型、测试用例、缺陷、变更、任务、讨论记录和邮件等等，如何从这些分布异构的大规模数据中高效地知晓信息和发现知识，从而在软件全生命周期中支持大规模复杂软件的智能开发？本项目将语义网引入软件工程领域，把这些多源异构数据进行细粒度语义关联，研究提出了关联数据驱动的软件工程数据挖掘的方法和技术，主要成果包括:①建立了基于本体的软件工程关联数据模型，提出了概念与实体识别、关联关系发现、本体标注和RDF生成方法，实现了大规模软件关联数据的自动构建；②建立了基于关联数据的软件工程数据挖掘框架，实现了大规模关联数据的高效存储和语义查询；③提出了一系列关联数据驱动的软件分析、搜索、预测与推荐的模型与算法，包括跨项目跨团队的缺陷预测、软件工作量的早期估算、面向多制品的变更影响分析、程序员自动画像、人员-任务的智能推荐、项目与代码的语义搜索。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.11707/j.1001-7488.20210410

发表时间：2021

DOI：

发表时间：2017

DOI：

发表时间：2021

DOI：10.13328/j.cnki.j0s.005141

发表时间：2017

沈备军的其他基金

批准号：60373074

批准年份：2003

资助金额：7.00

项目类别：面上项目

相似国自然基金

面向电信海量数据的群体关系数据挖掘研究

批准号：60402011

批准年份：2004

负责人：吴斌

学科分类：F0113

资助金额：20.00

项目类别：青年科学基金项目

面向时空轨迹数据异常和关联模式的挖掘模型

批准号：41171345

批准年份：2011

负责人：裴韬

学科分类：D0114

资助金额：58.00

项目类别：面上项目

以决定为基础、面向开发与维护过程的软件工程方法

批准号：69073348

批准年份：1990

负责人：刘连芳

学科分类：F0203

资助金额：3.50

项目类别：面上项目

面向健康管理数据的关联型知识深度挖掘方法研究

批准号：61502014

批准年份：2015

负责人：许焱

学科分类：F0607

资助金额：7.00

项目类别：青年科学基金项目

面向群体协同开发的软件工程关联数据挖掘

{{i.achievement_title}}

暂无此项成果

其他相关文献

智能煤矿建设路线与工程实践

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

区块链技术:从数据智能到知识自动化

偏正态数据下混合非线性位置回归模型的统计诊断

新型非易失存储环境下事务型数据管理技术研究

沈备军的其他基金

面向中小型软件企业的敏捷过程模型和支撑平台的研究

相似国自然基金