我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 帧内压缩 >

音视频学习从零到整--H264编码原理

归档日期:08-15       文本归类:帧内压缩      文章编辑:爱尚语录

  什么是空域数据,就是这幅图里数据在宽高空间内包含了很多颜色,光亮.人的肉眼很难察觉的数据. 对于这些数据,我们可以认作冗余.直接压缩掉的.

  在我们之前举例说明过,摄像头在一段时间内所捕捉的数据没有较大的变化,我们针对这一时间内的相同的数据压缩掉.这叫时域数据压缩.

  整数离散余弦变换(DCT),将空间上的相关性变为频域上无关的数据然后进行量化.

  这个比较抽象.这个跟数学是紧密联系在一起的.如果对傅里叶变换理解的比较好的.对这个会理解的比较快.如果对傅里叶变换不了解的.可能有稍许困难.傅里叶变换可以把一个复杂波形图变换成许多的正弦波.只是他们之间的频率不一样.以及振幅也不一样.如果它们在频率上没有一致性那么我们就可以对他进行压缩处理.

  将一个图片左上角用宏块描述,就是宏块是8*8的元素.取出的颜色,像右边的去描述.描述颜色.将一个图片全部用宏块描述就如下图.

  基本的图片的宏块划分就完成了.那是不是每个宏块都是8*8了?并不是的.还有子块划分.

  在这个大的宏块里,可以再细化. 我们可以看到在这个大的宏块里,我们更加细化了. 比如我们中间这个全部都是蓝色的这个宏块,就可以用一个色块,更加简单描述就行了.

  我们对比旁边的MPEG2和H.264.就会发现MPEG2存储时还说比较完整.占用的空间相对于比较多.而H.264还是减少了很多空间.像重复的颜色他们就用非常简单的色块描述了.

  例如,一个台球从一个位置移动到另外一个组. 可以发现它的桌面背景是一样的.只是球体位置发生了变换.这个我们就可以把这一组帧划分为一组.

  将图逐行扫描,扫描到第三行.发现了台球. 然后围绕它的周围查找.发现了有类似的图块.

  然后就把他们放在同一张图中.也就是说台球刚开始从位置1.到第二张图移动到位置2.这之间有一个运动矢量.矢量会包含运动的方向和距离.将所有的图都两两比较.最后就形成了右边这张图.就是右图中红色部分.每一个红色的箭头标注都是一个运动矢量.很多帧就会形成一个连续的运动估算.那么这个估算之后,我们要达到什么结果了?

  最终将连续的运动估算 换算成下图所表现的.我们就是对齐进行压缩.所有帧的背景都是一样的.变换在哪里了?变换就是它的运动矢量还有台球的数据. 实际经过我们一运算后.它留下的就只是运动矢量数据+残差值的数据. 经过这样的一个计算.帧间压缩数据我们就可以看到实际我们只需要存储一点点数据.而不像以前要将几十帧的所有图片数据保存下来.这就达到了压缩的效果. 这个过程就叫做帧间压缩技术的原理.

  帧内压缩是针对于I帧的.因为它解决的是空间的数据冗余.而帧间压缩是解决的时间数据冗余.我们刚刚说明的是帧间压缩技术.将大量在时间轨迹上相同的数据压缩掉.只留下运算估量和残差值.

  如下图,首先要经过计算,选择用那种模式.对每一个宏块采用不同的模式运算.

  当每个宏块都选定了模式之后.就形成了下图的这样的效果.每个宏块都选择一个帧内预测的模式.帧内预测一共有9种模式.

  让每个宏块挑选好模式之后,我们就可以使用块预测模式.预测完了之后,它就得到一个张预测图.

  计算的预测图和原图是有差别的. 原图比较圆润.预测图相对而言比较粗糙. 现在有两幅图.这时就做2张图的差计算.

  底下的图就是我们的原图.通过预测与原图的差得出一个结果.这个灰色图就是残差值.

  拿到参差值之后,我们就进行压缩. 压缩时保存,残差数据和每个宏块选择的模式信息数据. 那么有了这2个数据之后.当我们解码时,首先通过宏块的模式信息计算出预测图.然后将预测图与我们的残差值进行累积.就能还原成原图像. 那这个过程就是帧内压缩技术的原理过程.

  左上角有数据分布,右下角数据为空.从而达到数据量减少的作用.那它是如果做到的了? 这个如果计算是需要非常深的数学功底.如果感兴趣的可以在网络上搜索一下.

  VLC实际上是MPEG2使用的技术.而H264使用的是CABAC.也就是上下文适应技术.除了使用哈夫曼短码高频,长码高频的方式还加上了上下文适应的技术.根据上下文就可以加大压缩比.

  而CABAC压缩,会随着压缩的数据增大,上下文信息全面.压缩比随之增大.数据块从大块降低成小数据块.

  文章图片来源于网络,如未能核实来源或转发内容图片有瑕疵,请及时私信本人进行修改或者删除.

  在目前,无论在各个行只要和视频相关的,我们都可以看见H264相关的身影,H264作为目前使用最广泛的视频压缩标准,随着 x264/openh264以及ffmpeg等开源库的推出,大多数使用者无需再对H264的细节做过多的研究。但是,为了在别的开发者面前更好的装逼,有必要了解...

  ### YUV颜色空间 视频是由一帧一帧的数据连接而成,而一帧视频数据其实就是一张图片。 yuv是一种图片储存格式,跟RGB格式类似。 RGB格式的图片很好理解,计算机中的大多数图片,都是以RGB格式存储的。 yuv中,y表示亮度,单独只有y数据就可以形成一张图片,只不过这...

  前言 H264视频压缩算法现在无疑是所有视频压缩技术中使用最广泛,最流行的。随着 x264/openh264以及ffmpeg等开源库的推出,大多数使用者无需再对H264的细节做过多的研究,这大降低了人们使用H264的成本。 但为了用好H264,我们还是要对H264的基本原理...

  本文参考毕厚杰老师《新一代视频压缩编码标准-----H.264/AVC》一书以及雷霄骅博客《视音频编解码技术零基础学习方法》整理。 1.概念部分: H.264编码: 视频编解码技术有两套标准,国际电联(ITU-T)的标准H.261、H.263、H.263+等;还有ISO...

  Day8/21 53-考拉NANA-佛山 【书籍名称】《断舍离》 【作者】山下英子 【阅前思考】 何谓断舍离? 断舍离与我们有什么关联? 该如何做断舍离? 【阅读感受】 1、断绝那些想要进入自己家但不需要的东西,舍弃家里到处泛滥的破烂,脱离对物品的执念,让自己活得自在,游刃...

  宝宝出生之后其实就是需要为其取个好名字,而不父母在起名字的时候关注的是宝宝取名需要注意的事项,不管是生辰八字起名,还是周易起名,都还是需要注意宝宝的五行喜忌,宝宝的喜用神,看八字的平衡,或弱或旺,起名字的时候补益若的一方,让两派的力量达到平衡,也就是八字达到平衡。 首先,在...

  我喜欢气球的那句话:一个人走得快,但一群人可以走得更远。 今年九月开始,我加入了爱生命家庭关怀中心的第三届志工计划,从此,和一群频率相同的小伙伴一起,踏上了人生的神奇之旅。 生命到了一个阶段,如果能暂停向外的追寻,转而学习向内探索,了解、照顾自己和爱自己,这个生命就会趋于圆...

  星语的声音渐渐低了下来。 一闪怔在原地,她反复得“咀嚼”着星语的歌词意境。显然地,星语是在用歌声宣泄着自己的不堪经历。 “啪啪啪……” “好!” 齐昭的掌声和叫喊声打破了原野本来的平静。一闪回过头看着齐昭,都怪自己刚才想的太出神了,都没有来得及去阻止齐昭。这下子星语一定也被...

  我在向前走的时候,猛一下我似乎是看到了你的经过; 然后我开始聚精会神,开始频频回头, 张望着,期盼着, 等待着你的再次经过; 终于你过来了, 我看了一眼,又急忙回过头, 面无表情,心中起伏, 回过头后,我又真的像是自然的回头一看, 然后碰到你的目光,你似乎是笑着, 而我似乎...

本文链接:http://theferrari348.com/zhengnayasuo/527.html