面向软件行为鉴别的事件序列挖掘方法研究

基本信息
批准号:61175123
项目类别:面上项目
资助金额:59.00
负责人:陈黎飞
学科分类:
依托单位:福建师范大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:姜青山,郭躬德,王声瑞,严宣辉,蒋建民,吴海燕,张霄宏,陈思,张健飞
关键词:
事件序列数据挖掘分类挖掘聚类分析软件行为鉴别
结项摘要

当前,计算机病毒、木马等各种恶意软件肆虐,严重危害计算机系统的安全。使用数据挖掘方法对海量软件的行为特征进行自动鉴别以有效检测恶意软件,是保障计算机安全的迫切需要。软件的动态行为须以类属型事件序列描述,本项目旨在面向该型序列的数据挖掘新模型和新算法研究,开发适用于软件行为鉴别的有效方法和工具。主要研究工作包括:(1)面向大规模软件行为事件序列挖掘的数据分析模型,该模型能全面描述软件行为事件序列中复杂的序关系,具刻画模糊长序列模式的能力和应对噪声及事件局部无序关系的鲁棒性;(2)软件行为模式(事件序列簇类模式)的形式化描述及其投影聚类和分类算法;(3)事件序列簇类模式挖掘结果的有效性评价方法,并用于预测新的软件行为类型;(4)基于事件序列挖掘的软件行为鉴别应用系统。项目致力于以创新性的事件序列数据分析模型为基础,创建独具特色的软件行为鉴别新方法,并将对序列挖掘的理论基础研究起推动和借鉴作用。

项目摘要

事件序列(或符号序列、类属型序列)挖掘新模型和新算法研究是数据挖掘领域的前沿课题之一,其应用前景十分广泛。在计算机安全领域,基于数据挖掘和机器学习方法进行恶意软件自动鉴别现已被广泛接受,其核心是提取软件的行为特征并判断其行为的性质(恶意/良性),而软件行为须以事件序列描述。本项目以软件机器指令序列等实际应用中的序列数据为研究对象,对申请书提出的该型数据的数据挖掘模型、聚分类算法以及簇类评价和应用研究等议题进行了广泛、深入的研究,取得了若干成果。首先,在数据挖掘模型和算法研究方面,提出了面向簇类模式挖掘的事件序列新式向量空间模型、变阶马尔科夫模型、隐马尔科夫模型和离散核密度估计模型,并分别基于这些模型,定义了多种序列相似度新度量,研制了有效的聚类和分类算法;其次,提出了新型聚类有效性评价内部准则、聚类算法选择新方法,以及用于新簇类预测的概念漂移检测算法;第三,在应用研究中,提出了检测迷惑恶意代码的软件行为序列提取新方法和恶意软件分类新方法,开发了原型应用系统。项目的研究特色在于有关概率模型方法的一系列研究,提出了基于概率模型解决事件序列簇类模式挖掘及有效性评价等关键问题的新型方案;特别地,项目组首次将核密度估计方法引入到离散型数据的聚类分析和分类挖掘中,建立了一套基于核估计的复杂数据机器学习概率框架,取得了良好的效果。项目组共发表研究论文38篇,其中被SCI收录12篇,EI收录10篇,包括发表在IJCAI、AAAI和IEEE TKDE上的3篇CCF A类学术会议或期刊论文,以及ACM CIKM、Pattern Recognition等CCF B类会议或期刊上的4篇论文;另申请国家发明专利1项,出版专著1部,获得省级自然科学优秀论文奖和国际学术会议最佳论文奖各1项。达到预期研究目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
3

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
4

动物响应亚磁场的生化和分子机制

动物响应亚磁场的生化和分子机制

DOI:10.13488/j.smhx.20190284
发表时间:2019
5

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021

陈黎飞的其他基金

批准号:61672157
批准年份:2016
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

面向顺式调控元件及模块识别的近似序列模式挖掘

批准号:60905029
批准年份:2009
负责人:贾彩燕
学科分类:F0603
资助金额:18.00
项目类别:青年科学基金项目
2

面向海量恶意程序检测的行为序列挖掘方法研究

批准号:61762062
批准年份:2017
负责人:廖晓锋
学科分类:F0607
资助金额:34.00
项目类别:地区科学基金项目
3

基于启发式选择变异和软件行为特征挖掘的软件错误定位方法

批准号:61672191
批准年份:2016
负责人:苏小红
学科分类:F0203
资助金额:62.00
项目类别:面上项目
4

面向可穿戴用户行为识别的增量学习方法研究

批准号:61572471
批准年份:2015
负责人:陈益强
学科分类:F0209
资助金额:64.00
项目类别:面上项目