我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 帧内压缩 >

通常由于视频是连续播放的帧图像序列 在同一帧内以及帧与帧之间

归档日期:07-21       文本归类:帧内压缩      文章编辑:爱尚语录

  通常由于视频是连续播放的帧图像序列 在同一帧内以及帧与帧之间包含 很大的统计冗余度和主观冗余度。视频编码的最终目标是 通过挖掘统计冗余度 和丰观冗余度 来降低存储和传送视频信息所需的比特率。为了在保证图像质量 基本不降低的基础上 又能够获得高的压缩比 编码把图像序列区分为三 前向预测编码帧类不同的帧

  通常由于视频是连续播放的帧图像序列 在同一帧内以及帧与帧之间包含 很大的统计冗余度和主观冗余度。视频编码的最终目标是 通过挖掘统计冗余度 和丰观冗余度 来降低存储和传送视频信息所需的比特率。为了在保证图像质量 基本不降低的基础上 又能够获得高的压缩比 编码把图像序列区分为三 前向预测编码帧类不同的帧 帧内编码帧 帧和双向预测编码帧 帧。不同帧的编码算法有所不同 具体如下 帧内编码帧编码算法帧压缩采用帧内编码方式 即不参照任何其他的帧图像 只利用单帧图像 内的空间相关性 不利用时间相关性 因而压缩比只能达到 而不产生任何可 觉察的模糊现象 是生成后续的帧和帧所需的运动估计的参考帧。视频接 收初始化时必须使用帧作为基准图像 同时帧也为节目的切换和插入提供了 可能 因而也是最为重要。视频编码的第一帧必须为帧编码 编码中帧图像 是周期性出现在图像序列中的 出现频率可有编码器的参数定义。 前向预测编码帧编码算法帧采用预测编码 是利用相距最近的前一个帧或帧进行运动估计所得 出的编码图像。由于有效地去除了时间冗余 因而它具有较高的压缩率和较好的 图像质量。由于帧的参考帧总在当前帧之前 所以也被称为前向预测帧。帧 内可以包含帧内编码的部分 即帧中的每一个宏块可以是前向预测编码 也可北京邮电人学硕十研究生学位论文 基丁足球视频场景切换检索的研究 以是帧内编码。 前向预测 帧内编码前向预测编码 帧的参考帧双向预测编码帧编码算法 帧采用帧间预测编码方式在编码时同时利用前面的和后面的帧图像或 帧图像作为参考帧进行运动估计 由于使用了两个参考帧 其预测更为准确 其压缩效率最高 可以达到 其文件尺寸一般为帧压缩尺寸的 帧玉缩尺寸的一半。但是计算复杂度也相应增加 同时需要更多的额外存储空间。 由于在解码器中帧只能在它的参考帧帧或帧被解码之后才能被解码 所以发送的图像序列要被编码器重新排列 使之符合解码器所要求的解码顺序。 帧也可以包含帧内编码的部分 即帧内每一个宏块可以是前向预测编码 向预测编码双向预测编码以及帧内编码。 前向预测 双向预测帧内编码 前向预测编码 后向预测编码 帧的参考帧总的来说 帧只能采用帧内编码 帧除能采用帧内编码外 还能采用前 向预测编码以过去的帧或帧作为参考帧 帧则能采用帧内编码、前向 预测编码、后向预测编码和双向预测编码。具体如表一所示。 北京邮电大学硕上研究生学位论文 基于足球视频场景切换检索的研究 各类帧可选择的编码方式帧图像类型 帧内编码 前向预测编码 后向预测编码 双向预测编码 关键技术离散余弦变换 离散余弦变换 简称变换是一种空间变 化。在采用变换消除空间冗余 考虑以 的块为单位进 生成的系数数据块。变换最大的特点是对于一般的图像都 能够将像块的能量集中在少数低频系数上 即生成 系数中 上角的少量低频系数数值较大其余系数的数值很小。这样就能只编码和传输少 数系数而不严重影响图像质量。 量化器 量化针对变化系数进行 即以特定的量化步长去除系数。 系数中 低频系数对视觉感应的重要性较高 因此量化步长较小 高频系数对视 觉感应的重要性较低 所以量化步长较大。通常 变化块中的大多数高频 系数量化后为零。 扫描方式 采用的扫描方式为扫描和交替扫描。其中 扫描时最 常用的一中扫描方式。扫描后二维的系数矩阵就转化为一维序列的表达方 运动估计运动估计用于帧问编码方式时 通过参考帧图像产生对被压缩图像的估计。 运动估计的准确程度对帧问编码的压缩效果非常重要。运动估计以宏块为单位进 计算被压缩图像与参考图像的对应位置上的宏块间的位置偏移。这种位置偏移用运动矢量 来描述。运动矢量有正有负。正表示运动的方向 是向右或向上 负表示运动的方向是向左或向下。 运动估计时 帧和帧图像所使用的参考帧图像是不同的。帧图像使用 前面最近解码的帧或帧作为参考帧 成为前向预测 而帧图像使用前后 两帧作为参考帧 成为双向预测。其中一个参考帧在显示顺序上先于被编码帧前 北京邮电大学硕上研究生学位论文 基于足球视频场景切换枪索的研究 向预测 另一帧在显示顺序上晚于被编码帧后向预测。 运动补偿 利用运动估计算出的运动矢量 将参考帧图像中的宏块移至水平和垂直方向 上的相对应位置 即可生成对被压缩图像的预测。在绝大多数的自然场景中运动 都是有序的。 视频编码过程 视频编码层实现数字视频压缩编码的核心任务 其原理是经典的基于 变换的混合编码方案。图 给出了单层视频编码器的算法流程图。在 编码器端 输入图像首先根据帧编码模式来进行相应处理。 帧内编码帧帧 编码图像分块后直接进行变化 随后使用量化矩 进行量化处理以缩小数值的动态区域。由于量化后 的数据是二维矩阵的形式 所以还需将二维数据扫描成一维数据 最后再进行可 变长编码 生成编码比特流送入缓冲器。 帧间预测编码帧帧或帧 视频信号经过运动估计和运动补偿后 运动矢量和参考帧生成当前帧的预测图像而后将当前帧与预测图像的残差图像 进行变换、量化、扫描和编码 生成编码比特流送入缓冲器。 图编码器原理框图视频解码过程 视频解码过程如图所示。压缩数据要经过变长码解码、反 扫描、反量化、反变换和运动补偿五个步骤完成对视频数据的解码过程。 不同的帧图像的解压具体步骤不同 因此 在接收到信道传输的压缩码流后首先 北京邮电大学硕士研究生学位论文 基于足球视频场景切换检索的研究 进行帧模式判断。 若为帧内编码帧帧 则解码步骤为变长码解码 随后经过反扫 将一维数据转换成二维的举证随后进行反量化操作 然后经过反变 换将频域信号变换回原始的空间域。 若为帧间预测编码帧帧或帧 则解码步要略微复杂。首先要经过变 长码解码、反扫描、反量化和反处理 得到残差图像数据 然后根据运动 矢量和参考帧图像相加生成重建帧图像 最后再将残差图像数据与重建 帧图像相加得到原始视频图像。 图解码器原理框图图显示了的解码过程。由此图可知 由于反部分的运算量 极大 即使使用快速算法 仍要花费大量时间。所以 视频解码是 个运算量大且耗时的过程。故 不对压缩视频进行解码或只进行部分解码 利用 视频的压缩域特征来分析视频能够降低计算量、节约计算时间。 运动视频定义 视频流层次模型采用由上而下建立的类似目录的结构。一般而言可将其具 体的分为层 视频、场面、场景和帧图像。北京邮电大学硕上研究生学位论文 基于足球视频场景切换检索的研究场面 场面 场面 场面’’’’ 场景场景 场景 场景 图运动视频构造如图 所示 一个视频是由多个场面组成。场面是指语义上相关、时间 上相邻的场景组合。例如 足球视频中有射门场面、得分场面、罚球场面等等。 场景通常是指用同一摄像机进行连续不间断拍摄的一段视频内容。在一个场 景中相邻的帧图像具有非常好的连续性 即在某些方面具有相同的特征或数学特 切换点是场景与场景问的边界点。它是由于摄像机在拍摄过程中时间或空间上发生变化造成的场景切换。场景切换就是本文要研究的重点。 小结 本章对于 视频压缩标准进行了简要的说明介绍。首先介绍了 的视频结构 主要包括六个层次 视频序列层、图像组层、图像层、片组层、 宏块层和块层。其次介绍了的一些基本概念 、宏块以及运动矢 量。再次对于帧、帧和帧编码方式及过程进行详细的描述。然后详细地说 明了的编码和解码过程。最后 对运动视频的结构做了详细的说明 指出本文研究的重点场景切换的检索。 引言 场景切换检测是基于内容的视频检索技术中重要的一步 其检测

本文链接:http://theferrari348.com/zhengnayasuo/423.html