Feature selection is one of key steps in pattern recognition and machine learning, and it is also a knowledge discovery tool. Feature selection has been widely applied into security-related tasks, i.e., intrusion detection. At the same time, the attacked possibility of feature selection is also increasing greatly. So the research on anti-attack ability of feature selection is very important. The project aims to study the adversarial feature selection for evasion attack and preserve the data privacy. The proposed adversarial feature selection method belongs to filter model. Moreover, since the data in security-related applications are large scale and imbalanced, the adversarial feature selection will be combined with modular ensemble idea to obtain the modular adversarial ensemble feature selection method. The proposed ensemble method will be applied into network dynamic forensic to analyze the electronic evidences and find the key variables in abnormal activity, and resist evasion attack. The concrete researches include, (1) Adversarial feature selection method under filter model for evasion attack, (2) Adversarial feature selection method with privacy preservation, (3) Adversarial ensemble feature selection method based on modular ensemble idea, (4) The application of modular adversarial ensemble feature selection method in network dynamic forensic. These researches have theoretic and practical significance for secure pattern recognition and machine learning system design.
作为模式识别和机器学习中的一个关键步骤和知识发现的工具,特征选择已广泛应用于与安全相关的任务,如入侵检测等。与此同时,特征选择遭受攻击的可能性也越来越大。因此,特征选择的抗攻击能力研究也就越发重要。本项目拟针对逃避攻击,研究属于过滤器模型的对抗性特征选择方法,并融入隐私保护。此外,针对与安全相关的应用中普遍存在的大规模不平衡数据,对抗性特征选择还将与模块化集成思想相结合,设计处理大规模不平衡问题的模块化对抗性集成特征选择方法。该方法将应用于网络动态取证,从大规模不平衡电子证据中发现关键异常行为特征,并有效抵御逃避攻击。具体研究内容包括:(1)属于过滤器模型的对抗性特征选择方法研究;(2)融入隐私保护的对抗性特征选择方法研究;(3)模块化对抗性集成特征选择方法研究;(4)模块化对抗性集成特征选择方法在网络动态取证中的应用研究。本项目对设计安全的模式识别和机器学习系统具有重要的理论和实际意义。
随着机器学习技术包括特征选择技术的广泛应用,特别是与安全相关的应用,其自身的可信性性越发重要。本项目重点研究对抗机器学习中的对抗攻击、防御以及相关的拓展。所开展的研究工作包括:1)安全特征选择,包括结合输出干扰和目标干扰的隐私保护的集成特征选择、属于过滤器模型的对抗逃避攻击的特征选择方法、基于对抗训练的特征选择、混合式的K-匿名特征选择算法等;2)对抗攻击,包括基于级联和并行集成思想的对抗样本生成、基于加权干扰的对抗样本生成、最小对抗扰动的机理分析等;3)对抗防御,包括对抗黑盒攻击的基于贪婪强度搜索的混合对抗性训练防御策略研究、基于滑动窗口和固定步长特征消减的对抗防御与基于级联生成式对抗样本的检测和恢复等;4)对抗思想的拓展,包括基于对抗生成网络的图像翻译、基于对抗生成网络的命名实体识别、基于对抗生成网络的日志异常检测、基于对抗迁移的多任务序列标注与基于对抗迁移的跨项目软件缺陷定位等。5)公平性机器学习,提出了一种基于分类间隔的加权方法发现和消除原始数据集中的歧视样本来寻找生成公平数据集的方法。本项目研究成果对信息安全等领域所面临的提升机器学习可信性需求具有重要的理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
基于局部学习的集成特征选择稳定性及其拓展研究
时空轨迹数据挖掘及其隐私保护方法研究
网络重构与调控算法研究及其隐私保护应用
分布式优化算法及其隐私保护策略研究