虚拟化混淆代码逆向分析方法研究

基本信息

批准号：61502469

项目类别：青年科学基金项目

资助金额：20.00

负责人：杨轶

学科分类：

依托单位：中国科学院软件研究所

批准年份：2015

结题年份：2018

起止时间：2016-01-01 - 2018-12-31

项目状态：已结题

项目参与者：黄桦烽,路晔绵,聂眉宁,秦益

关键词：

虚拟化混淆代码混淆代码逆向分析

结项摘要

Virtualization-obfuscation is well known as the most powerful code protection method. In recent years there is an explosive growth of virtualization-obfuscated code in Advanced Persistent Threat(APT) and botnets. Reverse engineering of virtualization-obfuscated code plays a key role of malware analysis and defence. In our research, we focus on the two major problems introduced by virtualization- obfuscated code: “difficult to comprehend and reverse engineer, since they are resistant to both static and dynamic analysis techniques” and “reverse engineering of one instance of a virtualization-obfuscated program does not help us deal with a different program obfuscated using the same obfuscator”. We build models of typical virtualization-obfuscated code sequence, by performing an analysis of their inner logic and relationship between behaviors. We also build models to improve the efficiency and capacity of analyzing internal mechanism of virtual machines in virtualization-obfuscated code, by solving the problem of proposing methods to form a model of multiple characteristics. With models mentioned above, we develop a new method to achieve fine-grained dynamic analysis. By measuring the similarity among instruction sequences and obfuscated code models, we divide instruction samples into several clusters and form a method of deducing unobfuscated code from these clusters, to improve the capacity of analyzing of obfuscated variants. Finally, we will complete the development of proto-type system to evaluate our research, form a complete theoretical and technical framework, and play a part in malware analysis. This project is expected to play a catalytic role in analyzing and defending known or unknown virtualization-obfuscated malware variants and professional malware developed by organized attackers. Moreover, it is also useful to improve the security of our critical information system.

虚拟化混淆是强度极高的恶意代码自我保护方式，近年来在高级持续性威胁（Advanced Persistent Threat,APT）攻击、僵尸网络中应用越来越广泛，突破虚拟化混淆保护是实现相关恶意代码深度分析和防御的关键环节。本项目针对虚拟化混淆带来的逆向分析困难、已知样本分析结果难以支撑未知样本分析等问题，研究混淆代码序列语义提取与描述、运行过程多特征融合建模、基于模型的动态分析与基于代码序列语义等价判定的原始代码逆向推导方法等，重点提高动态运行过程分析能力、代码核心语义等价判定能力，形成一套动态分析和原始指令恢复方法，进而形成对于未知样本的逆向分析能力。基于项目理论研究成果研发原型系统，形成完整的理论和技术框架，在验证方法正确性的同时为实际工作提供支撑。该研究对于提高虚拟化混淆恶意代码分析，以及有组织研发的专业恶意代码的分析和防御能力，防范对我国重要信息系统的攻击，具有重要的现实意义。

项目摘要

项目从虚拟化混淆代码语义提取与描述方法、虚拟机运行过程建模方法、虚拟机识别与关键运行阶段分析方法、虚拟化混淆代码原始指令恢复方法四个方面展开研究。.1）虚拟化混淆代码语义提取与描述方法研究方面，提出了一套基于中间语言表示的混淆代码语义描述方法，该方法基于LLVM中间语言实现，将虚拟化混淆代码的实际执行功能码表示为中间语言的形式，基于中间语言提取代码变量个数、操作的寄存器、使用的内存等信息，并将抽取相关信息的语义，在语义状态下开展功能码的等价性判定。.2）虚拟机运行过程建模方面提出了一种基于代码执行循环识别和内存状态识别的虚拟化混淆代码运行过程模型。该方法通过提取代码执行过程记录，并针对执行过程中的内存状态建立状态转换模型，表示为DFA的形式。针对离线记录展开分析，通过回环判定方法识别其中的循环，通过对循环代码所在内存状态和位置的判定，分析并确定虚拟化混淆代码的实现基于动态生成代码还是预置的功能码。.3）虚拟机识别与关键运行阶段分析方法研究。本项目提出了一种基于代码相似性和内存状态的关键阶段分析方法。虚拟机分为进入虚拟机、跳出虚拟机、虚拟机代码执行三个部分。我们针对三种类型的虚拟机运行阶段分别建立了模型，根据取指、译码、执行阶段进行划分，通过代码匹配或控制流转移识别的方式提取关键代码。.4）虚拟化混淆代码原始指令恢复方法研究方面，提出了一种基于中间语言等价判定的原始指令恢复方法，通过将实际执行的代码去混淆、抽象提取之后形成中间语言描述的指令序列，并根据指令序列之间的等价关系，判定指令序列的等价性，进而根据已知序列与原始指令的对应关系，将等价指令序列逆向推导为原始指令。.在项目的支持下发表国际会议论文4篇，其中CCF A类论文3篇，CCF B类论文1篇。申请专利6项，申请软件著作权2项，获得北京市科技进步二等奖1项，通信学会科技进步一等奖1项。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：

DOI：10.14050/j.cnki.1672-9250.2017.02.014

发表时间：2017

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.7498/aps.70.20202116

发表时间：2021

杨轶的其他基金

批准号：U1836117

批准年份：2018

资助金额：66.00

项目类别：联合基金项目

批准号：81802264

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：81200226

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：81902557

批准年份：2019

资助金额：20.00

项目类别：青年科学基金项目

批准号：81770335

批准年份：2017

资助金额：55.00

项目类别：面上项目

相似国自然基金

复杂恶意代码逆向分析方法研究

批准号：60703076

批准年份：2007

负责人：苏璞睿

学科分类：F0205

资助金额：19.00

项目类别：青年科学基金项目

二进制代码路径混淆方法研究

批准号：61272423

批准年份：2012

负责人：贾春福

学科分类：F0205

资助金额：80.00

项目类别：面上项目

白盒攻击环境下安全关键代码保护的广义混淆变换方法研究

批准号：61202382

批准年份：2012

负责人：史扬

学科分类：F0206

资助金额：20.00

项目类别：青年科学基金项目

动静协同的恶意代码智能分析方法研究

批准号：U1836105

批准年份：2018

负责人：常晓林

学科分类：F0202

资助金额：66.00

项目类别：联合基金项目

虚拟化混淆代码逆向分析方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于综合治理和水文模型的广西县域石漠化小流域区划研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

非牛顿流体剪切稀化特性的分子动力学模拟

杨轶的其他基金

网络流量中漏洞利用程序的识别和分类

支链氨基酸代谢影响肺癌免疫检查点阻断治疗疗效的机制探索

汉防己甲素抑制腹主动脉瘤及其机制的实验研究

AR/ITGB5/PTEN信号轴促进前列腺癌细胞上皮间充质转换的机制研究

在心肌细胞以钙调蛋白的N端和C端白对兰尼碱受体结构和功能的研究，以及相关心衰和心律失常的影响

相似国自然基金