视频压缩略图像类型
此条目没有列出任何参考或来源。 (2021年2月17日) |
在典型的视频压缩设计中,可以看到三种主要的图像类型有:节点图像(Intra pictures)、预测图像(Predicted pictures)和前后预测图像(Bi-predictive pictures或Bi-directional pictures)。以上三者也常称作I帧(I frames)、P帧(P frames)和B帧(B frames)。在较旧的资料中,使用的是“双向”(bi-directional),而非“前后预测”(bi-predictive)。
在视频压缩格式中,如ITU-T VCEG和ISO/IEC MPEG视频标准,通常指编码图像之间的差异处。例如,在一个场景中,有个人走过一个固定的背景,只有移动范围才需要描述(使用运动补偿、影像资料或二者的结合,取决于何者以较少的位元充分的表现出图像)。场景的部分没有改变,而无须再次发送资料。
帧类型
严格来说,图像(picture)是比帧(frame)更为广泛的术语,因为图像可以指帧(frame)或区域(field)。帧是某一瞬间所截取下的影像,而区域是影像每一行线的集合。如果视频是以交错扫描来发送的话,通常会采用各别区域对图像编码,而不会对完整帧进行编码。尽管有时实际指的是更为广泛的“图像”(picture),通俗口语也常使用“帧”(frame)来指“图像”。
图像通常会被切割成几个宏区块(macroblock),而且可以宏区块为基准来选择特定的预测类型,而非整个图像都使用同样的类型:
- I图像(Intra-coded pictures)只可含有节点宏区块,就像传统的将一张张图片作压缩。
- P图像(Predictive pictures)可含有节点宏区块或预测宏区块,相对于之前的帧(frame),编码器不用记录下P-frame中没有改变的pixel。
- B图像(Bi-predictive pictures)可含有节点、预测和前后预测宏区块
此外,较新的视频编解码标准H.264,其图像可分割成更小的范围,称为切片(slice),并以此取代宏区块的作用。编码器可对特定的切片选择预测类型。H.264还建议:
- SI-帧/片(转换I);促进编码流之间的转换;含有SI宏区块(特殊类型的节点编码宏区块)。
- SP-帧/片(转换P);促进编码流之间的转换;含有P和/或I宏区块。
- 多帧运动估计(multi-frame motion estimation,可多达32参考帧)
多帧运动估计可提升相同压缩率下的质量,且SI-格、SP-格(定义为延伸profile)可增强对错误的承受能力。如此一来,较聪明的解码器就能够恢复受损的DVD流。
节点图像
- 图像的编解码不涉及自己以外的任何图像。
- 可由编码器建立随机存取点(使解码器可在其它图像点上适当的进行解码)。
- 当要呈现不同的影像细节时,也会产生I图像。
- 与其它图像类型相比,节点图像通常需要更多位元进行编码。
I图像(I-帧)常用于随机存取,并作为其它图像的解码参考。每半秒一次的节点更新周期主要应用于数码电视广播和DVD媒体。在某些环境下可使用较长的更新周期,如视频会议系统很少发送I图像。
预测图像
- 需要先前图像以进行解码。
- 可包含影像资料、运动向量移位和组合。
- 可按解码顺序参考前一图像。
- 较旧的标准(如MPEG-2),在解码期间,仅使用一个先前解码图像作为参考,且显示顺序要在P图像之前。
- H.264在解码期间,可使用多个先前解码图像作为参考,且可具有任意的显示顺序关系。
- 通常只需要比I图像还要少的位元进行编码。
前后预测图像
- 需要先前图像以进行解码。
- 可包含影像资料、运动向量移位和组合。
- 包含一些针对运动范围的预测模式(如,宏区块或较小的区域),以两个不同的先前解码参考范围获取平均预测。
- 较旧的标准(如MPEG-2)不使用B图像作为其它图像的预测参考。B图像可用于较低质量的编码,因为丢失的细节将不会损害到随后图像的预测质量。
- H.264可使用B图像作为其它图像解码的参考(由编码器判断)。
- 较旧的标准(如MPEG-2)使用两个先前解码的图像作为参考,并要求其中一个图像的显示顺序要在B图像之前,且另一个在之后。
- H.264可使用一个、两个或两个以上的先前解码图像作为参考,且可具有任意的显示顺序关系。
- 通常只需要比I或P图像还要少的位元进行编码。
参见
外部链接
- 介绍短帧类型
- 使用SP和SI帧的视频流[永久失效链接]
- 视频压缩和China AVS的介绍
- 数码视频技术,H.263、H.263+、MPEG-2