In this project, we will research compression methods of convolutional neural networks for image classification. Recent convolutional neural network based classification algorithms have surpassed human eye on ImageNet dataset, and may march into mobile phone, mobile devices et al. Now an obstacle is heavy computation and storage requirement from convolutional neural network itself. In this project, we will research compression methods of convolutional neural network deeply and systematically in terms of practical algorithm application situations, such as download, storage, running, developing et al. The research content contains 4 parts, from data compression, computation compression on trained convolutional neural network to improvement methods for performance damage from compression, and compression and training methods of untrained convolutional neural network for algorithm development. The key technique through the 4 parts is 3D orthogonal transformation based dimensionality reduction and quantization methods. Using 3D orthogonal transformation, for examples, 3D DCT, 3D PCA, will not only remove the correlation between parameters, but also obtain the index of coefficient significance, so we can not only remove the redundant coefficients, but also draw the optimal varying R(D) graph of data R - distortion D, and the R(K) graph of data R – number K of categories, to direct dimensionality reduction and quantization in order to gain the optimal compression ratio.
本项目拟开展“针对图像分类的卷积神经网络的压缩方法研究”。现有的卷积神经网络分类算法在ImageNet图像库上的分类精度已经超过了人眼,向手机等移动设备推广应用是其重要的发展方向之一。目前面临的阻碍之一是,卷积神经网络自身的沉重的计算和存储负担。本项目将针对具体的算法下载、存储、运行、研发等应用问题,系统、深入地研究解决方法。研究内容包括四个部分,从训练后的卷积神经网络的存储量压缩、计算量压缩研究,到压缩后的性能损伤修补研究,最后是训练前的卷积神经网络的压缩与训练方法研究。贯穿这四部分的核心是,基于三维正交变换的降维、量化方法和变换域的卷积计算方法。通过三维正交变换,不仅去除参数之间的相关性,而且获得变换后系数的重要性排序,从而不仅可以去除冗余系数,而且获得优化的数据量-性能的R(D)变化曲线,数据量-类别数量的R(K)曲线,指导降维、量化和网络组合方法,获得优化的压缩比。
本项目总共发表学术论文29篇,其中26篇为CCF A类论文,在国际顶级期刊IEEE T-PAMI(影响因子:24.3)发表论文2篇和IEEE T-NNLS(影响因子14.3)上发表论文2篇。在国际顶级会议NeurIPS、CVPR、ICML上发表论文19篇。较大幅度地超过了申请书中预期的16篇论文,其中CCF A类12篇的论文指标。.而且,论文产生了较大的学术影响,单篇论文的最高被引数是645,即,IPT算法论文,发表在CVPR 2021。共有5篇论文的被引数超过百次,这29篇论文的总被引数是2000余次。.另外在发明专利方面,与华为的科研人员加强了合作,更加接近了应用需求,而且利用华为的超大服务器,开展深度学习的超大运算,才能取得上述的CCF A类论文翻番的成果。基于我们的科研成果,偏应用的发明专利由华为申请了近十项,例如,博士生唐业辉作为第一发明人,申请了2项发明专利,分别是202110221926.3,一种卷积神经网络的剪枝处理方法、数据处理方法及设备;与202011006089.4,神经网络剪枝方法。.综上所述,本项目较好地完成了研究目标,无论是在论文数量上,还是质量上,均取得了较大超额的研究成果,产生了较为显著的学术影响。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
内点最大化与冗余点控制的小型无人机遥感图像配准
基于图卷积网络的归纳式微博谣言检测新方法
多源数据驱动CNN-GRU模型的公交客流量分类预测
平行图像:图像生成的一个新型理论框架
面向Landsat图像的深度卷积神经网络地表覆盖分类方法研究
基于卷积神经网络和双层优化建模的复杂图像分类研究
基于深度卷积神经网络构建场景部件的场景图像分类研究
压缩深度卷积神经网络及其在目标检测与图像取证中的应用研究