面向海量高维不平衡样本数据的恶意代码聚类及同源自动分析理论及技术

基本信息
批准号:61472437
项目类别:面上项目
资助金额:82.00
负责人:唐勇
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:肖新光,张怡,张博锋,喻波,康学斌,王维,童志明,乔林波,邢倩倩
关键词:
病毒聚类同源恶意代码高级持续威胁
结项摘要

Malware development has entered the era of APT(Advanced Persistent Thread). Because malware sample data is increasingly showing a massive, high-dimensional and imbalant characteristics, anti-virus vendors' automatic analysis systems are facing more challenge, already can't adapt to the APT era, mainly in two aspects: first, even though samples are captured,it is still difficult to quickly, accurately identify a new malware family; second, the lack of automatical homology analysis results in the difficulty of understanding the evolution of malware family and their relationship. This project aims at solving the above problems and achieving the higher request of deeper malware analysis under the APT era. Centering on the two major demands of new malware family promptly recognition and automatic analysis of homologous and phylogenetic relationship of malware families, by a closely cooperation of the academic research and anti-virus vendors. This project will design a new generation of malware analysis pipeline system suitable for APT era and breakthroughs in some key technologies, including automatic extraction of malware high-dimensional feature vectors, massive high-dimensional imbalant malware samples clustering, automatic analysis method of malware homologency and derivation and its theory model. Through studious researches, we hope to promote the development of malware automatic analysis and anti-malware in theory and engineering technology.

恶意代码发展已经进入APT(高级持续威胁)时代。由于恶意代码样本数据愈发呈现出"海量高维不平衡"特性,反病毒厂商的恶意代码自动分析体系面临着更巨大的挑战,已经表现出不适应APT时代的迹象,主要表现在两个方面:第一,有样本但是难以快速、准确地识别出新的恶意代码家族;第二,缺乏自动化的同源分析手段,难以及时了解恶意代码家族如何演化及其之间的关系。本项目针对上述问题和APT时代对恶意代码深度分析的更高要求,围绕恶意代码家族自动及时识别、恶意代码的同源和演化关系自动分析两大需求,立足于学术研究与反病毒厂商的紧密合作,设计适应APT时代的新一代恶意代码自动分析流水线体系,突破恶意代码高维特征向量自动提取和标准化、面向海量不平衡高维特征向量的恶意代码样本聚类算法、恶意代码同源和演化理论模型及自动化分析方法等关键技术。项目预期成果将推动恶意代码自动分析技术理论和工程技术的发展。

项目摘要

恶意代码发展已经进入APT(高级持续威胁)时代。由于恶意代码样本数据愈发呈现出“海量高维不平衡”特性,反病毒厂商的恶意代码自动分析体系面临着更巨大的挑战,已经表现出不适应APT时代的迹象,主要表现在两个方面:第一,有样本但是难以快速、准确地识别出新的恶意代码家族;第二,缺乏自动化的同源分析手段,难以及时了解恶意代码家族如何演化及其之间的关系。本项目针对上述问题和APT时代对恶意代码深度分析的更高要求,围绕恶意代码家族自动及时识别、恶意代码的同源和演化关系自动分析两大需求,立足于学术研究与反病毒厂商的紧密合作,研究恶意代码高维特征向量自动提取和标准化、面向海量不平衡高维特征向量的恶意代码样本聚类、恶意代码同源和演化理论模型及自动化分析等关键技术。项目主要成果包括:提出了恶意代码同源和演化关系的理论模型,提出了数种对“海量、高维、不平衡”恶意代码样本进行特征提取的方法;提出了跨指令集架构二进制代码同源搜索、基于统计特征的恶意代码分类、恶意代码增量聚类及检索等一系列技术方法。项目发布了“恶意软件分析数据集”,构建并发布了大代码分析平台(BigCodeDiff),支持对海量二进制代码进行细粒度的同源分析。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
2

三级硅基填料的构筑及其对牙科复合树脂性能的影响

三级硅基填料的构筑及其对牙科复合树脂性能的影响

DOI:10.11951/j.issn.1005-0299.20200093
发表时间:2020
3

异质环境中西尼罗河病毒稳态问题解的存在唯一性

异质环境中西尼罗河病毒稳态问题解的存在唯一性

DOI:10.16119/j.cnki.issn1671-6876.2017.04.001
发表时间:2017
4

基于相似日理论和CSO-WGPR的短期光伏发电功率预测

基于相似日理论和CSO-WGPR的短期光伏发电功率预测

DOI:10.13336/j.1003-6520.hve.20201778
发表时间:2021
5

分层地质类材料靶体抗超高速侵彻模型实验

分层地质类材料靶体抗超高速侵彻模型实验

DOI:10.11883/bzycj-2018-0230
发表时间:2019

唐勇的其他基金

批准号:81373735
批准年份:2013
资助金额:75.00
项目类别:面上项目
批准号:61003303
批准年份:2010
资助金额:19.00
项目类别:青年科学基金项目
批准号:20932008
批准年份:2009
资助金额:180.00
项目类别:重点项目
批准号:20472108
批准年份:2004
资助金额:23.00
项目类别:面上项目
批准号:40903027
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:41373024
批准年份:2013
资助金额:85.00
项目类别:面上项目
批准号:81871073
批准年份:2018
资助金额:56.00
项目类别:面上项目
批准号:30970488
批准年份:2009
资助金额:29.00
项目类别:面上项目
批准号:71171056
批准年份:2011
资助金额:42.00
项目类别:面上项目
批准号:41773053
批准年份:2017
资助金额:68.00
项目类别:面上项目
批准号:20172066
批准年份:2001
资助金额:19.00
项目类别:面上项目
批准号:20672131
批准年份:2006
资助金额:40.00
项目类别:面上项目
批准号:30440082
批准年份:2004
资助金额:8.00
项目类别:专项基金项目
批准号:90709032
批准年份:2007
资助金额:34.00
项目类别:重大研究计划
批准号:21432011
批准年份:2014
资助金额:350.00
项目类别:重点项目
批准号:20942401
批准年份:2009
资助金额:4.00
项目类别:专项基金项目
批准号:41476048
批准年份:2014
资助金额:98.00
项目类别:面上项目
批准号:81000529
批准年份:2010
资助金额:21.00
项目类别:青年科学基金项目
批准号:81671259
批准年份:2016
资助金额:52.00
项目类别:面上项目
批准号:51277178
批准年份:2012
资助金额:65.00
项目类别:面上项目
批准号:81171238
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:81560428
批准年份:2015
资助金额:37.00
项目类别:地区科学基金项目
批准号:81700224
批准年份:2017
资助金额:21.00
项目类别:青年科学基金项目
批准号:30572075
批准年份:2005
资助金额:27.00
项目类别:面上项目
批准号:81173320
批准年份:2011
资助金额:57.00
项目类别:面上项目
批准号:81470057
批准年份:2014
资助金额:30.00
项目类别:面上项目
批准号:60970073
批准年份:2009
资助金额:31.00
项目类别:面上项目
批准号:81341068
批准年份:2013
资助金额:10.00
项目类别:专项基金项目
批准号:20332050
批准年份:2003
资助金额:170.00
项目类别:重点项目
批准号:31271288
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:31070411
批准年份:2010
资助金额:31.00
项目类别:面上项目
批准号:21272248
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:81771718
批准年份:2017
资助金额:55.00
项目类别:面上项目
批准号:U1633126
批准年份:2016
资助金额:36.00
项目类别:联合基金项目
批准号:30973155
批准年份:2009
资助金额:34.00
项目类别:面上项目

相似国自然基金

1

高维空间海量数据快速聚类算法关键技术的研究

批准号:60673087
批准年份:2006
负责人:沈钧毅
学科分类:F0201
资助金额:27.00
项目类别:面上项目
2

基于多源信息融合的恶意代码同源及演化特性自动分析技术研究

批准号:61003303
批准年份:2010
负责人:唐勇
学科分类:F0205
资助金额:19.00
项目类别:青年科学基金项目
3

面向高维数据集成降维的半监督聚类方法研究

批准号:61105048
批准年份:2011
负责人:曾洪
学科分类:F0603
资助金额:24.00
项目类别:青年科学基金项目
4

高维时间过程型数据的聚类及变量选择分析

批准号:11301064
批准年份:2013
负责人:黄伟
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目