针对恶意代码概念漂移问题的对抗学习方法研究

基本信息

批准号：61872202

项目类别：面上项目

资助金额：67.00

负责人：王志

学科分类：

依托单位：南开大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：李朝晖,邵蔚,陈喆,秦枚林,朱文焌,田建文,邱克帆

关键词：

概念漂移威胁恶意代码对抗学习恶意软件分析恶意软件检测

结项摘要

Machine learning is widely used in malware detection system as a core component. The machine learning algorithm is designed under the assumption that the underlying data distribution is stable for training and testing which make it vulnerable to well-crafted malware concept drift attacks, such as mimicry attacks, gradient descent attacks, poisoning attacks and so on. Machine learning itself can be the weakest link in a detection system. This project focus on adversarial learning technique to mitigate malware concept drift threat. The research includes: 1. Instead of fixed and empirical threshold, we will use fine-grained statistical p-values to recognize concept drift before model aging; 2. We plan to use multi-model detection method that based on conformal prediction algorithm to analysis malicious concept drift from multi-perspectives; 3. Sliding time windows are introduced to identify and assess concept drift effect on predictive features before model performance degrading, and re-weight features to mitigate model aging.

机器学习模型已被广泛应用在恶意代码的检测系统中。机器学习的前提假设是底层数据的分布规律要具有稳定性。恶意代码的变异和进化速度快，数据分布规律的稳定性差。闪避攻击、毒饵攻击等，使恶意代码底层数据产生概念漂移（Concept Drift），实现躲避或误导机器学习模型的检测。机器学习被认为是恶意代码检测系统中最薄弱的环节。本项目将针对恶意代码变异和进化过程的概念漂移问题，研究动态和协同的对抗学习技术。研究内容包括：1. 改进基于经验的最优阈值预测方法，使用更加细粒度的可信度预测，感知底层数据分布规律的变化；2.基于滑动时间窗的在线学习，跟踪恶意代码的概念漂移过程，预测漂移的趋势，动态更新模型；3. 多种异构恶意代码检测模型的协同学习，基于可信度评估恶意代码概念漂移对不同模型的影响，通过对比发现各种模型的优缺点，取长补短，实现协同防御。

项目摘要

恶意代码的自我快速变异和进化，是目前基于机器学习算法的检测模型的主要威胁。变异和进化使恶意代码底层数据分布产生概念漂移（concept drift）。而机器学习算法的前提假设是训练集和测试集数据的分布规律具有稳定性，概念漂移打破了数据分布规律的稳定性，致使基于机器学习的恶意代码检测模型面临严重的退化风险。本项目的主要研究内容分别为基于可信度的统计学习方法、基于滑动时间窗的在线学习方法和异构模型的协同学习平台。基于可信度的统计学习方法，突破了基于经验的最优阈值判断方法，以更加细粒度的可信度度量和可接受的最大出错概率来实现恶意代码的检测，和对恶意代码数据分布规律变化的感知；基于滑动时间窗的在线学习方法，使恶意代码检测模型能够不断地学习、吸收新知识，保持模型能够持续跟踪恶意代码的概念漂移，并对漂移的趋势做出持续的预测；异构模型的协同学习平台，使从不同角度对恶意代码进行建模的算法，它们的预测结果能够被统计学习，发现预测结果在可信度上的差异，取长补短，实现了交叉学习。.本项目通过在线的基于可信度的对抗学习方法，应对恶意代码的变异、进化过程对机器学习模型产生的概念漂移攻击，提高现有恶意代码检测模型的对抗能力。提出基于p-value的一致性统计学习方法，突破基于预设固定阈值的“0”或者“1”的预测模式，使用更加细粒度的统计学习的可信度，是模型在退化之前，能提前感知到恶意代码数据分布规律的漂移现象；实现基于滑动时间窗和APV算法的恶意代码概念漂移检测，利用对时间敏感的在线学习方法，感知恶意代码底层数据分布规律随时间的变化趋势，检测恶意代码的概念漂移攻击；完成基于SIM和DIFF算法的特征点受攻击影响评估方法，深入评估概念漂移对异构模型间特征点的影响，通过对比发现各种模型的优缺点，通过异构模型的互相学习和特征工程，改进模型，缓解模型退化问题，提高攻击者概念漂移攻击的难度。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.14050/j.cnki.1672-9250.2017.02.014

发表时间：2017

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：10.1360/SSM-2020-0035

发表时间：2020

王志的其他基金

批准号：29976031

批准年份：1999

资助金额：14.00

项目类别：面上项目

批准号：20836006

批准年份：2008

资助金额：200.00

项目类别：重点项目

批准号：21436009

批准年份：2014

资助金额：350.00

项目类别：重点项目

批准号：91534124

批准年份：2015

资助金额：80.00

项目类别：重大研究计划

批准号：11701304

批准年份：2017

资助金额：21.00

项目类别：青年科学基金项目

批准号：51372099

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：51404212

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：51872118

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：50606019

批准年份：2006

资助金额：22.00

项目类别：青年科学基金项目

批准号：51504153

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：41572201

批准年份：2015

资助金额：73.00

项目类别：面上项目

批准号：51142010

批准年份：2011

资助金额：10.00

项目类别：专项基金项目

批准号：50802044

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：59803004

批准年份：1998

资助金额：10.00

项目类别：青年科学基金项目

批准号：11526117

批准年份：2015

资助金额：3.00

项目类别：数学天元基金项目

批准号：31171698

批准年份：2011

资助金额：64.00

项目类别：面上项目

批准号：61604002

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：51002010

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：50976057

批准年份：2009

资助金额：37.00

项目类别：面上项目

批准号：21276176

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：20676095

批准年份：2006

资助金额：30.00

项目类别：面上项目

批准号：11774435

批准年份：2017

资助金额：62.00

项目类别：面上项目

批准号：29506050

批准年份：1995

资助金额：8.50

项目类别：青年科学基金项目

批准号：11304400

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：51374192

批准年份：2013

资助金额：81.00

项目类别：面上项目

批准号：20476075

批准年份：2004

资助金额：23.00

项目类别：面上项目

批准号：50574085

批准年份：2005

资助金额：10.00

项目类别：联合基金项目

批准号：11174155

批准年份：2011

资助金额：65.00

项目类别：面上项目

批准号：61775107

批准年份：2017

资助金额：61.00

项目类别：面上项目

批准号：41372229

批准年份：2013

资助金额：99.00

项目类别：面上项目

批准号：31571925

批准年份：2015

资助金额：60.00

项目类别：面上项目

批准号：51176098

批准年份：2011

资助金额：62.00

项目类别：面上项目

批准号：51576107

批准年份：2015

资助金额：75.00

项目类别：面上项目

批准号：50704030

批准年份：2007

资助金额：20.00

项目类别：青年科学基金项目

批准号：61300242

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：40974024

批准年份：2009

资助金额：45.00

项目类别：面上项目

批准号：91541206

批准年份：2015

资助金额：240.00

项目类别：重大研究计划

批准号：51174187

批准年份：2011

资助金额：62.00

项目类别：面上项目

批准号：40872148

批准年份：2008

资助金额：47.00

项目类别：面上项目

批准号：81571196

批准年份：2015

资助金额：57.00

项目类别：面上项目

批准号：81603308

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

相似国自然基金

空间数据流的概念漂移问题研究

批准号：41571394

批准年份：2015

负责人：李宏伟

学科分类：D0114

资助金额：60.00

项目类别：面上项目

基于特征发现的数据流概念漂移问题研究

批准号：60975034

批准年份：2009

负责人：胡学钢

学科分类：F0603

资助金额：32.00

项目类别：面上项目

基于概念漂移的前景分割与运动分析

批准号：61105001

批准年份：2011

负责人：张翔

学科分类：F0304

资助金额：24.00

项目类别：青年科学基金项目

面向关联关系数据的概念学习方法研究

批准号：61573229

批准年份：2015

负责人：曹付元

学科分类：F0603

资助金额：66.00

项目类别：面上项目

针对恶意代码概念漂移问题的对抗学习方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于综合治理和水文模型的广西县域石漠化小流域区划研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

二维FM系统的同时故障检测与控制

现代优化理论与应用

王志的其他基金

膜与物质的动态作用及其对二者微观结构和性能的影响

用于CO2捕集的CO2/N2分离膜研究

用于脱碳提纯氢气的CO2优先渗透分离膜研究

界面聚合成膜过程介尺度结构形成演化及调控机制

非光滑初始条件下几类随机偏微分方程的渐近性质及相关问题研究

基于热压烧结的Ti/Al2O3复合材料可控制备与性能优化研究

裂隙岩石注浆加固后的疲劳损伤机理研究

基于热压原位合成的Ti3SiC2/Al2O3复合材料可控制备及其高温抗氧化机制

基于详细化学反应动力学的火花点火激发均质压燃发动机着火的建模与机理研究

基于多场耦合的Mg-Zn-Cu-Zr合金热裂及流动行为机理研究

西太平洋俯冲带地震成因与岩浆活动研究

Ti/Al2O3复合材料界面微区结构演变与性能关系

基于光子带隙光纤的可调谐光电子器件

聚苯乙烯/聚乙烯合金的两步交联加工增容增韧机理研究

一类由分数噪声驱动的随机热方程的分析与渐近行为研究

用于果蔬样品中农药残留分析的石墨烯复合材料涂层固相微萃取纤维的制备及其分离机理研究

正交钙钛矿LuFeO3的掺杂改性和多铁性研究

离子束辅助沉积涂层导体缓冲层的取向竞争机制研究

贫氧条件下高辛烷值燃料喷雾混合气形成及其低温燃烧过程的基础研究

海因衍生物改性反渗透膜的制备方法及其可再生耐氯抗生物污染性能研究

膜面不同尺度峰谷结构形成及对膜性能影响的机制与调控

超导Cooper对分裂及非局域纠缠电子对研究

膜过程中流体流动非线性理论及其传递特性

拓扑超导体及其新奇物理性质的研究

电化学解离铝酸钠分解母液协同液相法碳分制备一水软铝石

固定载体促进传递膜载体分布优化理论和技术研究

冶金烧结尾气的NOx抑制技术基础

基于光子晶体光纤的克尔腔孤子的动力学特性与应用研究

少模光纤中孤子动力学特性与时空锁模光纤激光器的研究

龙门山断裂带深部构造及盆山耦合模式研究

用于食品样品中农药残留有效萃取的新型MOF衍生孔状碳材料的制备及吸附机理研究

内燃机新型点火模式- - 微波点火的着火燃烧机理研究

高功率密度汽油机的早燃与超级爆震机理的燃烧基础研究

铝酸钠溶液碳酸化分解过程一水软铝石结晶的调控基础

基于路径信息泄露问题自动逆向构建僵尸网络的协议模型

汶川地震产生机制综合研究

宽温度压力条件下爆震燃烧模态转换规律与调控机理

冶金硅熔析结晶分离B/P/金属等典型杂质技术基础

青藏高原东南部三维速度成像与岩石圈结构

小胶质细胞通过NF-κB/MFG-E8通路介导吞噬脑缺血后应激神经元的机制研究

基于复方配伍机制与液固压缩技术的西黄多元缓释微片的构建与体内过程研究

相似国自然基金