Due to the continuous development of video coding techniques, the computational complexity of video coding algorithms is rapidly increasing, especially in high resolution applications. Thus, how to efficiently implement a high performance video encoding system becomes an important issue. In this paper, we focus on the techniques for parallel design and efficient implementation of video encoding, and try to achieve both high encoding speed and high coding efficiency. To reach this goal, two key units in the video encoder which are in-loop deblocking filter and motion estimation, and parallel video encoding structures are carefully studied. Firstly, software pipeline solutions to in-loop deblocking filter are presented. Several techniques such as two-pass pipelines, mask operation, pair processing and two-level internal memory organization are adopted to solve the problem that highly adaptive conditional branches inevitably appear in the inner most loops of the algorithm. Then, a high-density software pipeline scheme for large search range and variable block size motion estimation is proposed, which can bring a great running time reduction without decreasing the search points. In the scheme, large search-range motion estimation is optimized by accelerating the global search, and the temporary replacement strategy is used to remove the correlations in variable block-size motion estimation. Finally, the parallel video encoding structure is studied from the aspects of the macroblock structure features, acceleration factor, and communication frequency. And the effectiveness of macroblock-level parallel encoding is further discussed to show how the coding flow, parallel structure, picture difference and platform factors affect the parallel video encoder.
视频编码技术不断发展进步,编码算法复杂度随之大幅度增加,使得高性能视频编码器的设计实现成为重要的研究问题。本项目围绕视频编码并行设计与高效实现这一主题展开,即要提高编码速度,又要保证压缩效率。为此本项目对视频编码中的两个关键部件- - 环路滤波和运动估计模块进行深入研究,并从多处理单元协同工作的角度对并行编码结构进行探讨。针对环路滤波模块,通过二次流水技术、掩码操作、对处理方式操作和二级片内存储结构设计,解决大量自适应条件跳转不可避免地出现在算法内层循环中的问题,实现软件流水方案。针对运动估计模块,通过加速全局采样搜索并引入临时替代策略,在不减少搜索点数量的情况下实现大范围、变块大小运动估计的高密集度软件流水设计。针对并行编码结构,分析细粒度宏块级并行编码方式的结构特点、加速系数、数据通信频率,并通过建立效力估计模型,研究编码流程、并行结构、图像内容差异以及平台因素对宏块级并行编码效力的影响。
本项目围绕视频编码并行设计与高效实现这一主题展开,即要提高编码速度,又要保证压缩效率。为此对视频编码中的关键部件:环路滤波和帧间编码进行深入研究,并从多处理单元协同工作的角度对并行编码结构进行探讨。对于环路滤波模块,通过二次流水技术、掩码操作、对处理方式操作和二级片内存储结构设计,解决大量自适应条件跳转不可避免地出现在算法内层循环中的问题,实现软件流水方案。对于帧间编码部分,从子像素插值、运动估计的高效实现、自适应方向性搜索、快速模式决策四个方面进行了研究。针对子像素插值,从宏观角度进行任务划分和并行调度,从微观角度设计软件流水,从而实现了子像素插值模块的高效并行设计;针对运动估计模块,通过加速全局采样搜索并引入临时替代策略,在不减少搜索点数量的情况下实现大范围、变块大小运动估计的高密集度软件流水设计;针对自适应搜索,提出了一种自适应搜索模板方案,根据运动方向和运动强度自适应选择模板的尺寸、形状和方向,增加了搜索的准确性;针对模式决策,提出了一种基于时空相关性的快速模式决策方案,能够有效降低帧间编码的复杂度。对于并行编码结构,分析了细粒度宏块级并行编码方式的结构特点、加速系数、数据通信频率,并通过建立效力估计模型,研究编码流程、并行结构、图像内容差异以及平台因素对宏块级并行编码效力的影响。.我们已经顺利完成了对该项目中制定的所有研究内容的研究,达到了预期的研究成果,在重要期刊、会议上发表论文8篇,申请专利2项,培养研究生3人,出境参加国际学术会议2次。我们不仅完成了该项目所要求的研究内容,而且在此基础上进行了广泛深入的研究,为开展下一步工作打下了坚实的基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
采用深度学习的铣刀磨损状态预测模型
基于结构滤波器的伺服系统谐振抑制
简化的滤波器查找表与神经网络联合预失真方法
下调SNHG16对胃癌细胞HGC-27细胞周期的影响
高效视频编码中的关键技术研究
面向多核DSP的实时视频并行编码关键技术研究
面向众核处理器的高并行度视频编码关键技术研究
面向云计算环境的高效视频编码多粒度优化关键技术研究