H.264帧间编码快速算法研究与实现
VIP免费
摘 要
H.264 作为目前最新的视频编码标准,以其优异的压缩性能和良好的网络适
应性,越来越多地被使用在各种应用场合。相比其它视频编码标准,H.264 的优越
性表现突出,但同时编码复杂度也相应提高很多,其中的运动估计与编码模式选
择部分是耗时较多的模块,提高这两个模块的编码速度对于编码器总体速度的提
升有很大帮助。
本文主要针对帧间编码的运动估计与模式选择模块进行了研究。运动估计部
分,对 H.264 测试模型 JM 中的整像素运动估计搜索算法 UMHexagonS 及EPZS
进行了详细的分析,归纳出两种算法的优缺点,然后针对 UMHexagonS 算法的复
杂搜索模板及搜索步骤提出改进的基于方向的菱形-T 形搜索算法:根据当前搜索
起点与上一步搜索起点的相对位置关系决定下一步搜索的模板及方向。分析了分
数像素运动估计的必要性,并提出了基于 CBFPS 的改进算法,将 16×8 及8×16 块
加入改进的快速搜索算法中,并且对 16×16 块也采用了复杂度较小的快速算法。
实验结果显示,相比 JM 中采用的算法,改进的整像素及分数像素快速算法在保
证图像质量及编码比特率上升不太明显的情况下,运动估计速度分别大约提高了
40%与18%。
帧间编码模式选择部分,详细分析了 H.264 中的全模式选择算法及其它几种
快速模式选择算法,然后基于各种视频序列的先验模式分布统计提出改进的快速
模式选择算法。改进算法在对各种编码模式进行率失真计算前采用零块判断与提
前终止策略,首先判断可能性较大的模式,跳过不必要的不可能或可能性极小的
模式。通过实验与 JM 中采用的算法进行比较,改进算法同样在保证图像质量及比
特率的同时提高了大约 36%的编码速度。
关键词:H.264 帧间编码 运动估计 模式选择
ABSTRACT
As the latest video coding standard, H.264, with its superior compression
performance and excellent network adaptability, is increasingly being used in a variety
of applications. Compared to other video coding standard, while having great
performances, the encoding complexity of H.264 has been increased a lot, where the
models of motion estimation and coding mode selection are more time-consuming.
Therefore, to improve the encoding speed of these two modules will much help to speed
the encoder.
In this paper, the inter-frame motion estimation and mode selection modules have
been studied. After researching the interger motion estimation search algorithm
UMHexagonS and EPZS in JM of H.264, and summarizing their advantages and
disadvantages, a improved fast algorithm, Direction Based Diamond-T Search
(DBDTS), is proposed to reduce the complex templets of UMHexagonS: according to
the relative position between center searching point and the one of previous searching
step, the searching template and direction of next step can be selected adaptively. Based
on detailed analysis of the necessity of fractional-pixel motion estimation, a novel
algorithm is proposed based on CBFPS: Join the 16×8 and 8×16 blocks to the improved
Quickly-Search algorithm, and the 16×16 macroblock can use the fast algrithom which
has smaller complexity. Experimental results show that, compared with algorithm in
JM, the proposed interger-pel and fraction-pel motion estimation algorithms efficiently
reduce the time of motion estimation (by about 40% and 18 %) with minimal loss in
bitrate and reconstructed quality.
Inter-frame mode decision part, after detailed analysis of the full mode decision
algorithm in H.264, and several other fast mode decision algorithms, an improved fast
mode decision algorithm is proposed based on statistics of modes. In improved
algorithm, before the processing of rate-distortion, early terminal strategy is used to skip
those unnecessary impossible modes, and to select these possible modes. The proposed
mode decision algorithm speeds up about 36% in ensuring the same image quality and a
littile bit rate increasing.
Key Word: H.264, inter-frame coding, motion estimation, mode
decision
目 录
摘 要
ABSTRACT
第一章 绪 论.....................................................................................................................1
§1.1 引言...................................................................................................................1
§1.2 研究目的及意义...............................................................................................1
§1.3 研究背景...........................................................................................................2
§1.3.1 视频压缩编码标准的特点....................................................................3
§1.3.2 两大视频压缩编码标准体系的比较....................................................3
§1.4 主要工作及内容安排.......................................................................................4
第二章 H.264 视频编码标准介绍...................................................................................5
§2.1 引言...................................................................................................................5
§2.2 H.264 视频编码标准概述................................................................................5
§2.2.1 H.264 标准的特点.................................................................................6
§2.2.2 H.264 标准框架.....................................................................................7
§2.3 H.264 视频编码标准关键技术........................................................................9
§2.3.1 帧内预测编码........................................................................................9
§2.3.2 帧间预测编码......................................................................................10
§2.3.3 整数变换和量化..................................................................................11
§2.3.4 熵编码..................................................................................................15
§2.3.5 码率控制..............................................................................................16
§2.4 H.264 帧间编码算法特点..............................................................................17
§2.4.1 树状结构运动补偿..............................................................................18
§2.4.2 高精度运动补偿及内插......................................................................19
§2.4.3 多参考帧预测......................................................................................20
§2.5 本章小结.........................................................................................................21
第三章 整像素运动估计研究........................................................................................23
§3.1 引言.................................................................................................................23
§3.1.1 基于块的运动估计匹配准则..............................................................24
§3.2 基于块的快速运动估计搜索算法.................................................................25
§3.2.1 传统搜索算法分析..............................................................................25
§3.2.2 基于块的快速搜索算法......................................................................26
§3.3 JM 中整像素运动估计算法...........................................................................27
§3.3.1 UMHexagonS 算法..............................................................................28
§3.3.2 EPZS 算法............................................................................................30
§3.4 基于方向预测的菱形-T 形搜索(DBDTS)算法.............................................32
§3.4.1 DBDTS 搜索模板................................................................................32
§3.4.2 DBDTS 搜索步骤................................................................................33
§3.5 实验结果与分析.............................................................................................34
§3.5.1 实验结果..............................................................................................34
§3.5.2 性能分析..............................................................................................38
§3.6 结论.................................................................................................................39
第四章 分数像素运动估计研究....................................................................................41
§4.1 引言.................................................................................................................41
§4.2 分数像素运动估计快速算法.........................................................................41
§4.2.1 逐级分数像素全搜索算法..................................................................42
§4.2.2 基于抛物面预测的分数像素搜索(PPFPS)算法................................43
§4.2.3 偏向中心的分数像素搜索(CBFPS)算法...........................................45
§4.3 改进的快速分数像素搜索算法.....................................................................47
§4.3.1 起点预测..............................................................................................47
§4.3.2 提前终止策略......................................................................................48
§4.3.3 快速搜索算法描述..............................................................................49
§4.4 实验结果与分析.............................................................................................56
§4..4.1 实验条件及测试标准.........................................................................56
§4.4.2 实验结果..............................................................................................57
§4.5 本章小结.........................................................................................................61
第五章 帧间模式选择算法研究....................................................................................63
§5.1 引言.................................................................................................................63
§5.2 H.264 基于率失真优化的全模式选择算法..................................................64
§5.2.1 视频编码的率失真优化理论..............................................................64
§5.2.2 拉格朗日率失真优化算法..................................................................64
§5.2.3 编码模式的率失真优化......................................................................65
§5.3 快速帧间模式选择算法.................................................................................66
§5.3.1 快速帧间模式选择算法基本思路......................................................66
§5.3.2 基于先验统计的快速模式选择..........................................................67
§5.3.3 基于 DCT 变换的空域快速模式选择算法........................................67
§5.3.4 基于 MBD(宏块差值)的时域快速模式选择算法........................................68
§5.4 改进的快速模式选择算法.............................................................................69
§5.4.1 帧间编码模式分布统计......................................................................69
§5.4.2 基于 DCT 变换的 SKIP 模式早期判断..............................................72
§5.4.3 帧间模式提前终止过程......................................................................74
§5.4.4 算法步骤..............................................................................................75
§5.5 算法性能测试.................................................................................................76
§5.5.1 实验结果..............................................................................................76
§5.5.2 性能分析..............................................................................................78
§5.6 本章小结.........................................................................................................79
第六章 结论与展望........................................................................................................81
参考文献.........................................................................................................................83
在读期间公开发表的论文和承担科研项目及取得成果.............................................87
致 谢.............................................................................................................................89
第一章 绪论
第一章 绪 论
§1.1 引言
随着科学技术的进步,特别是近十几年来多媒体技术的飞速发展,人们传递
表达信息的形式已经从语音、文字逐步转变成为图像与视频这样的视觉信息。视频
是多媒体信息中一个非常重要的组成部分。与文字和听觉信息相比,视觉信息具
有以下优点:确切性,同样的内容由听觉和视觉两种不同方式获取的信息其效果
是不同的,后者显然比前者更容易确认,不易发生误解;直观性,同样内容的信
息通过图像获取比声音或文字更为形象直观,印象深刻,易于理解;高效性,由
于视觉器官具有较高的图案识别能力,人们可在很短时间内,通过视觉能接受到
比声音信息更丰富,超出文字描述能力的信息;应用广泛,利用视觉得到的信息
易于满足多种应用要求,如广播电视、视频存储、宽带视频、实时通信、分组网络的
多媒体业务等。
H.264 作为当前视频编码的最新国际标准,正逐步为人们普遍接受,正在被
各方应用所采纳。H.264 标准获得了比 H.263 更好的压缩性能:加强了对各种信道
的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应
用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需
求。
§1.2 研究目的及意义
在相同的重建图像质量下,H.264 比H.263 节约50%左右的码率。但 H.264 获
得优越性能是以计算复杂度增加为代价的,编码复杂度大约相当于 H.263 的3倍,
解码复杂度大约相当于 H.263 的2倍。其中,H.264 标准中帧间压缩编码技术采用
多参考帧预测与可变块尺寸运动估计,运动矢量估计从1/2 精度提高到了1/4 精度,
这就必然要包含对大量视频数据的处理,是编解码器实现的瓶颈,如何在现有的
硬件处理速度和存储器传输带宽下,实时完成视频编解码,正是视频编解码帧间
技术硬件实现所要解决的问题。
H.264 编码算法中,运动矢量的搜索是运算量最大的模块,包括整像素搜索
与分数像素搜索两部分。近几年来,整像素运动搜索快速算法领域已经取得较多
研究成果,但要适应 H.264 标准的实时应用还需要改进很多;而整像素快速算法
的不断发展也使得分数像素运动搜索算法的研究必不可少。另外,H.264 标准中帧
间编码模式的选择算法在很大程度上影响着编码器的速度,帧间预测的每个宏块
(16×16 像素)可以按4种方式进行划分,而其中的 8×8 子宏块又可以进一步划
分成更小的子块,每个子宏块或子块都要进行运动估计(ME)与运动补偿
(MC),这样,能够在不降低编码质量的情况下快速确定各宏块的预测分割将
大大降低帧间预测的复杂度。
本文以 H.264 帧间编码算法为研究对象,针对影响帧间编码速度比较大的运
动矢量搜索与帧间编码模式选择算法,提出改进的快速算法,并以 JM(Joint
Model)为测试模型,验证算法的有效性。
1
H.264 帧间编码快速算法研究与实现
§1.3 研究背景
多媒体信息技术的飞速发展,使人们获取和处理信息更为容易快捷,然而信
息量的爆炸性增长也使得现有的信道资源出现瓶颈,因此各种多媒体音视频信息
的压缩编码技术则成为解决信息有效传输的关键,建立统一的多媒体压缩编码国
际标准已成为工业界的一个极为迫切的需求。与此同时,自50 年代起,数据压缩
理论开始发展,到了80 年代后期,基本形成了以预测编码、变换编码和统计编码
三大经典编码技术为核心的音视频压缩编码技术体系,并已经达到实用化阶段。
正是在这样的前提下,经过国际标准化组织(ISO)及国际电信联盟(ITU)等几
大标准化组织的推动,先后形成了针对不同应用目的的多个系列的音视频压缩编
码国际标准,其中最具代表性的是 ITU-T 推出的 H.26X 系列视频编码标准,包括
H.261,H.262,H.263,H.263+,H.263++和H.264,ISO/IEC 推出的 MPEG 系列
音视频压缩编码标准,包括 MPEG -1,MPEG -2 和MPEG -4,如表1-1 所示[1]。
表1-1 ITU和ISO-IEC制定的多媒体压缩编码标准
标准名称 发布机构发布时间 主要用途
H.261 ITU-T 1990 ISDN 视频会议、可视电话
MPEG-1 ISO/IEC 1993 CD-ROM、消费视频、视频记录
MPEG-
2(H.262) ISO/IEC 1995 SDTV、HDTV、DVD、视频广播
H.263 ITU-T 1996 可视电话、移动可视电话、网络视频
H.263+ ITU-T 1998 可视电话、移动可视电话、网络视频
H.263++ ITU-T 2002 可视电话、移动可视电话、网络视频
MPEG-4 ISO-IEC 2000 Internet、交互视频、视频内容管理
H.264 ITU-T 2003 网络视频、无线移动视频
§1.3.1 视频压缩编码标准的特点
无论是 ITU-T 的H.26X 系列标准还是ISO/IEC 的MPEG 系列标准,作为面向
多媒体信息产业的两个越来越被人们接受的标准体系,与其它产业的国际标准相
比较,有以下几方面特点:
1)标准的演绎性。相对于传统产业中具有评价性目标的标准体系,以上两个
标准体系则往往超前于市场的需求,充分利用当时最先进的技术手段,给予技术
发展充裕的自由度,并与相关产业集团紧密联系,使得技术标准能够引领相关产
品的发展。
2)标准的通用性。传统产业的标准往往与特定的应用领域紧密相关,多媒体
音视频编码标准则具有扩展性,例如 H.264 标准中采用档次和级(profile/level)
的参考模型,适用于各种不同要求的场合。
2
第一章 绪论
3)标准的开放性。以上两种编码标准通常有三部分组成:压缩编码系统的体
系结构,完整的视频压缩码流数据结构语法规则和通用解码器算法描述。但标准
中并未对视频编解码系统中具体的实现方法做特殊的规定。
§1.3.2 两大视频压缩编码标准体系的比较
作为最具权威的多媒体视频压缩编码标准体系,H.26X 系列和 MPEG 系列所
涉及的原理技术及基本框架都大体相同,但由于ITU 和ISO 两大标准化组织的组
织背景、发展目标及应用范围等方面的不同,使得两大标准化组织基于不同的目
的相对独立地制定标准。虽然双方在制定标准的过程中也进行了多次合作,但无
论是在相关调整的体系结构还是应用系统目标以及具体技术发展环节上,都存在
一定差异。
MPEG 系列标准在体系结构上更系统化,其标准涵盖了整个多媒体系统的各
层子系统,更便于形成完整的应用体系;在应用模式上更具开放性和延伸性;在
具体技术方面,更注重应用层面上各种功能的增加。
H.26X 系列标准在体系结构上更具有针对性,致力于数字视频压缩编码及网
络适配环节,而将系统层和音频压缩层放在其它标准中处理;在应用系统目标上
围绕各种典型网络所构成的信道,力图在有限信道资源条件下实现数字视频信息
的高效传输;在具体技术发展环节方面充分挖掘数字视频系统中的技术潜力,从
而进一步提高视频压缩的性能。
§1.4 主要工作及内容安排
多块运动估计及 1/4 像素运动估计的加入,使得H.264 的帧间预测复杂度大
大提高,占用整个系统的编码时间的比例也大大提高。本文研究的重点放在加快
H.264 帧间预测编码的速度上,具体研究以下内容:
1)整像素运动估计算法;
2)分数像素快速运动估计算法;
3)帧间预测模式选择算法。
论文内容安排如下:
第一章介绍研究的背景及视频编码标准的概况。
第二章介绍 H.264 视频编码标准的特点及相关关键技术。
第三、四、五章为本文对帧间编码关键技术的研究改进,分别讨论了整数及分
数像素快速运动估计算法和帧间编码模式快速选择算法。
最后对本文进行总结和展望。
3
第二章 H.264 视频编码标准介绍
第二章 H.264 视频编码标准介绍
§2.1 引言
沿用以往视频编码标准结构,H.264 仍采用混合编码的框架结构,加入当前
视频编解码的最新技术,形成了具有极好编码效率和网络适应性的新一代标准。
本章首先介绍 H.264 的特点及编解码框架,然后分析标准采纳的关键技术,最后
详细分析帧间编码的算法特点。
§2.2 H.264 视频编码标准概述
2003 年3月,由ITU-T 和ISO/IEC 共同推出的新视频编码国际标准正式被批
准,官方名称分别为 ITU-T H.264[2]和ISO/IEC MPEG.4 Partl0 或ISO/IEC MPEG-
4/AVC[3]。
作为新一代视频压缩编码标准,在 H.264 发展的初期,VCEG(video coding
experts group, ITU-T 下属的视频编码专家组)从实时性和图像质量等方面为其发展
制定了以下要求[4]:
1)码率与图像质量
在相同图像质量的情况下,H.264 标准能够节省一半的带宽。
2)延时的限制
由于H.264 强调在实时环境的应用,因此必须拥有低延迟的模式以适应于实
时会话服务。同时,也应该能很好地工作在没有时延限制的应用中。
3)复杂度
出于复杂度考虑,H.264 从编码器处理和质量方面规定了 Baseline、Main
Profile 和X Profile 三个类以及多个不同等级,以适应不同的应用范围。
4)差错控制
由于被大量地用于实时环境下,H.264 提供基于包传输网络中处理包丢失所
需的工具,以及在易误码的无线网络中处理比特误码工具,并且能够在包丢失和
移动信道崩溃的情况下进行差错恢复。
5)语法定义
为了实现简单有序的码流语法解决方案,H.264 实现了更为简单的语法。同时
确保解码端与编码端不会产生失配现象。
6)网络友好性
H.264 在系统层提出了一个新的概念,将整体视频编码数据按照视频编码层
(video coding layer, VCL)和网络抽象层(network abstraction layer, NAL)两个
层面进行概念性分割,以此将视频压缩和网络传输功能进行有效的分割,使得
H.264 标准能较好地适用于移动通信互联网,也能为视频流的运营提供服务。
5
摘要:
展开>>
收起<<
摘要H.264作为目前最新的视频编码标准,以其优异的压缩性能和良好的网络适应性,越来越多地被使用在各种应用场合。相比其它视频编码标准,H.264的优越性表现突出,但同时编码复杂度也相应提高很多,其中的运动估计与编码模式选择部分是耗时较多的模块,提高这两个模块的编码速度对于编码器总体速度的提升有很大帮助。本文主要针对帧间编码的运动估计与模式选择模块进行了研究。运动估计部分,对H.264测试模型JM中的整像素运动估计搜索算法UMHexagonS及EPZS进行了详细的分析,归纳出两种算法的优缺点,然后针对UMHexagonS算法的复杂搜索模板及搜索步骤提出改进的基于方向的菱形-T形搜索算法:根据当前...
相关推荐
-
Boussinesq方程的Darboux变换及其精确解VIP免费
2024-11-07 8 -
专练01(填空题-基础)(50题)2021高考数学考点必杀500题(上海专用)(原卷版)VIP免费
2024-11-07 5 -
专练01(填空题-基础)(50题)2021高考数学考点必杀500题(上海专用)(解析版)VIP免费
2024-11-07 6 -
专练02(填空题-提升)(50题)2021高考数学考点必杀500题(上海专用)(解析版)VIP免费
2024-11-07 7 -
专练02(填空题-提升)(50题)2021高考数学考点必杀500题(上海专用)(原卷版)VIP免费
2024-11-07 7 -
专练03(填空题-压轴)(30题)2021高考数学考点必杀500题(上海专用)(解析版)VIP免费
2024-11-07 9 -
专练03(填空题-压轴)(30题)2021高考数学考点必杀500题(上海专用)(原卷版)VIP免费
2024-11-07 11 -
专练04(单选题-基础)(50题)2021高考数学考点必杀500题(上海专用)(解析版)VIP免费
2024-11-07 5 -
专练04(单选题-基础)(50题)2021高考数学考点必杀500题(上海专用)(原卷版)VIP免费
2024-11-07 9 -
专练05(单选题-提升)(50题)2021高考数学考点必杀500题(上海专用)(解析版)VIP免费
2024-11-07 6
作者:陈辉
分类:高等教育资料
价格:15积分
属性:84 页
大小:11.74MB
格式:DOC
时间:2024-11-19

