基于matlab的图像压缩处理技术的研究与实现毕业设计内容摘要:

差的图像 2 分 对观看较有影响 非常差的图像 1 分 非常严重的质量变坏,基本不能观看 主观评价和客观评价之间有一定联系,但不能完全 等同,由于客观评价比较便,很有说服力,故在一般的图像压缩研究中被采用。 主观评价很直观,符合人眼的视效果,比较实际,但是打分尺度很难把握,不可避免有人为因素。 图像压缩 技术 标准 信息技术的突出特点是互操作性和全球联网。 随着全球范围内的信息传输和交换越来越重要,统一的技术标准成为实现全球范围信息传输和交换的关键。 统一的国际标准是不同国家地区和厂商的产品能够相互兼容和协调的基础。 近些年来,图像编码技术得到了迅速的发展和广泛的应用,并且日臻成熟,其标志就是几个关于图像编码的国际标准的制定,有关图像压缩编码已 有的国际标准 ( 或建议 ) 有 、 JPEG、 JPEG20 MPEGl、 MPEG MPEG4 等,涉及到二值图像传真、静225510 lgPSNR MSN 长沙学院 毕业设计 (论文 ) 6 态图像传输、可视电话、会议电视、 VCD、 DVD、常规数字电视、高清晰度电视、多媒体可视通信、多媒体视频点播与传输等广泛应用领域。 这些标准图像编码算法融合了各种性能优良的传统图像编码方法,是对传统编码技术的总结,代表了目前图像编码的发展水平。 各种图像编码的标准实际上都是博采各种方法之所长的优化组合的混合编码系统。 有关图像编码的若干国际标准 ( 建议 ) 的名称、主要目标和内容 以及应用范围如下 [4]: (1) 建议 建议是 CCITT 于 1990 年 7 月通过的有关图像 ( 视频 ) 压缩编码的第一个国际标准化建议,其全称为“ p 64kbit/s(p=1~30)视听业务的视频编解码器 ”。 的主要对象是 m 64kbit/s 和 n 354kbit/s 两类码率。 其应用目标是可视电话和会议电视,其对图像质量的要求不很高。 (2) JPEG 标准 JPEG 是 ISO 和 CCITT 于 1986 年成立的联合图像专家组 ( Joint Photgoparhic Expert Group) 的简称。 1992 年作为静止图像压缩算法的国际标准正式推出。 它适用于不同类型不同分辨率要求的彩色和黑白静止图像,有多种编码模式和数据格式。 主要应用于彩色产值、静止图像、可视通讯、印刷出版、新闻图片、医学和卫星图像的传输、检索和存储。 (3) JPEG2020 标准 JPEG2020 是 21 世纪的压缩标准,它把 JPEG 的四种模式 ( 顺序模式、渐进模式 、无损模式和分层模式 ) 集成在一个标准中,在编码端以最大的压缩质量和最大的图像分辨率压缩图像,在解码端可以从码流中以任意的图像质量和分辨率解压图像。 JPEG2020的主要特征如下: ⅰ .高压缩率 : 由于采用离散小波变换,图像可以转换成一系列“小波”,压缩比可比 JPEG 提高 10%~30%,而且压缩后的图像显得更加细腻平滑。 ⅱ .JPEG2020 提供无损和有损两种压缩方式。 ⅲ .渐进传输 : 采用 JPEG2020 格式的图像支持渐进传输。 所谓渐进传输就是先传输图像轮廓数据,然后再逐步传输其他数据来不断提高图像质量。 ⅳ .感兴趣区域压缩:可以指定图片上感兴趣的区域 ( Region of Interest) ,然后在压缩时对这些区域指定压缩质量,或在恢复时指定某些区域的解压缩要求。 ⅴ .码流的随机访问和处 理 : 这一特征允许用户随机定义感兴趣区域,使得这一区域的图像质量高于其它区域。 ⅵ .容错性。 ⅶ .开放的框架结构。 长沙学院 毕业设计 (论文 ) 7 ⅷ .基于内容的描述。 JPEG2020 的应用领域包括互联网、彩色传真、打印、扫描、数字摄像、遥感、移动通信、医疗图像和电子商务等。 (4) MPEG1 标准 MPEG 是活动图像专家组 Moving Pictuer Experts Group 的简称。 MPEGl 的全称是ISO/IEC CDIl72, Coding of Moving Picture and Assoeiated Audio for digital storage media at up to ,中文译为“用于数字存储媒体、码率约为 音的编码”。 它是 MPEG 专家组的第一阶段成果, 1993 年正式通过为国际标准。 MPEG1包括系统、视频、音频以及测试和软件实现等。 MPEG1 主要面向数字存储媒体,应用于多媒体计算机、教育与训练、演示与咨询服务、创作与娱乐、电子出版物、数字视听系统 VCD 以及 VOD、交互式电视 ITV 等领域。 (5) MPEG2 标准 MPEG2 标准的全称是 ISO/IEC DIS13818, Generie Coding of Moving Pictures and Assoeiated Audio Information,中文名为“活动图像及其伴音信息的通用编码 ( 标准 )”,1993 年 11 月正式推出。 MPEG2 包括系统、视频、音频和测试,与 MPEG1 后向兼容。 MPEG2 的视频编码部分码率为 4~10Mbit/s,图形质量接近演播室质量。 MPEG2 在技术、功能、语法结构、选择项、可分级性和应用范围等方面比 MPEG 有重大改进和发展。 因此成为一种从多媒体计算机到 家用消费数字音像电子产品、从宽带数字通信到数字视频广播以及 HDTV 的“通用”共性关键技术。 MPEG2 从技术上促进了计算机、广播电视、数字通信三大领域的交汇融合,并发挥出了巨大的作用。 (6) 建议 全称是 ITUT Remendation , Video Coding of Low Bitrate Communation。 它是 “ Terminal for Low Bitrate Multimedia Communation”的主要组成部分。 其面向低码率多媒体通信, 原来的目标为在 PSTN 上运行低于 64Kbit/s 以下码率的新的视频压缩标准。 由于低码率下实现多媒体通信在技术上更为困难和复杂,因此 采用了多种先进技术以降低码率,提供各种业务,后来又推出了 +和 ++。 (7) MPEG4 和 MPEG7 MPEG4 的目标是交互式的多媒体应用。 其特点有 : ⅰ .基于内容的交互性 : 基于内容的多媒体数据访问、基于内容的码流操作和编辑。 ⅱ .高效的压缩算法。 ⅲ .自然的与合成的图像编码及其混合编码。 长沙学院 毕业设计 (论文 ) 8 ⅳ .通用的可接入性 : 包括恶劣环境下强大的抗差错能力,基 于内容的可分级。 图像压缩 的分类 图像 压缩的效果好与不好,关键要看三样指标:一是压缩比要大,二是压缩算法简单、速度快,三是恢复效果好。 数字图像数据量的压缩按照应用不同可分为两大类:无损压缩和有损压缩。 无损、冗余压缩:可逆,压缩比较高,信息保持型数据压缩。 有损、熵压缩:不可逆,压缩比较低,又分为保真度型数据压缩和特征保持型数据压缩。 图像编码也可以按照编码所在数据域主要分为空间域编码和变换域编码两大类,此外还有模型编码、矢量量化编码和神经网络编码等众多方法。 下面简要介绍几种压缩编码方法 [5]: (1) 预测编码:根据离散信号之间存在着一定并联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差值(预测误差)进行编码。 对预测的要求是必须较为准确。 预测编码消除的是空间冗余和时间冗余。 属于这类编码的主要有 DPCM、 ADPCM 等。 (2) 变换编码:先对信号进行某种函数变换,从一种信号(空间)变换到另一种信号(空间),然后再对变换后的信号进行采样编码。 变换编码可以消除空间冗余和时间冗余。 属于变换编码的有 KL 变换、 DFT 变换、 DCT 变换、 WHT 变换等。 (3) 统计编码:主要用于 对相互独立、无相关性的消息序列构成的无记忆信源进行压缩。 它根据消息出现概率的分布特性而进行的压缩编码,宗旨是在消息和码字之间找到明确的一一对应关系,以便在恢复时再现出来。 统计编码消除的是信息熵冗余。 属于这类编码的有 Huffman 编码、 ShannonFano 编码、算术编码等。 (4) 模型编码:利用模型的方法,对需传输的图像进行参数估测。 它消除的是结构冗余和知识冗余。 属于这类编码方法的如分形编码等。 (5) 其他编码:如行程编码,计算信源符号出现的行程长度,然后将行程长度转换成代码; LempelZel 和 Welsh 编码,查找冗余字符串和将此字符串用较短的符号标记替代的技术,从而达到数据压缩的目的,其压缩率很高。 图 给出了按数据域划分归类的主要压缩方法 [6]。 长沙学院 毕业设计 (论文 ) 9 图 图像压缩方法的分类 图像压缩 处理技术基本理论 图像压缩 的 基本原理 图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。 大类,前 者在解码时可以精确地恢复原图像,没有任何损失;后者在解码时只能近似原图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。 压缩技术分为无损压缩和有损压缩两图像,不能无失真地恢复原图像。 假设有一个无记忆的信源 , 它产生的消息为 {ai}, 1≤i≤N, 其出现的概率是已知的 ,记为 P(ai)。 则其信息量定义为 : () 图像压缩方法 空域编码 KL 编码编码 PCM、 DPCM 编码 矢量量化编码 Delta 编码 子带编码 块截断编码 行程编码 自适应变换域编码 基于模型编码 其他编码 变换域编码 帧间编码 小波变换编码 神经网络编码 等值线编码 其他变换域编码 分形编码 2( ) log ( )iiI a P a 长沙学院 毕业设计 (论文 ) 10 由此可见 一个消息出现的可能性越小,其信息量就越多,其出现对信息的贡献量越大,反之亦然 [7]。 信源的平均信息量称为 “熵 ”( entropy),可以表示为: () 对上式取以 2 为底的对数时,单位为比特( bits): () 根据香农( Shannon)无噪声编码定理,对于熵为 H 的信号源,对其进行无失真编码所可能达到的最低比特数为,这里为一任意小的正数,因此可能达到的最大压缩比为: () 其中 B 是原始图像的平均比特率 [7]。 在图像压缩中,压缩比是一个重要的衡量指标。 可以定义压缩比为: () 图像压缩的基本模型 图像编码包括两个阶段,前一个阶段就是利用预测模型或正交模型对图像信号进行变换;后一个阶段是利用已变换信号的统计特性,对其分配适当的代码来进行编码传输。 编码器与解码器的结构分别如图 ,图 所示。 图 编 码器结构 图 解码器结构 在发送端,输入的原始图像首先经过 DCT 变换后,其低频分量都集中在左上角,高频分量分布在右下角( DCT 变换实际上是空间域的低通滤波器)。 由于该低频分量包含了图像的主要信息,而高频分量与之相比就不那么重要了,所以可以忽略高频分量,原始图 像数据 DCT 变换 量化器 Huffman 编码编码 压缩图 像数据 压缩图 像数据 Huffman 译码 量化器 (逆) 逆 DCT 变换 重建图 像数据        11 l o gNNi i i iiiH P a I P a P a P a    21 lo g ( )N iiiH P a P a m ax BBC HH 长沙学院 毕业设计 (论文 ) 11 从而达到压缩的目的。 将高频分量去掉就要用到量化,这是产生信息损失的根源。 “ 量化 ” 的主要任务是用有限个离散电平来近似表达已抽取出的信息。 在此采用均匀量化,通过改变程序中的量化因子 Q 的值以得到不同压缩比的图像。 Huffman 编码时,首先对经 DCT 变换及量化后的图像收据扫描一遍,计算出各种像素出现的概率;然后按概率的大小指定不同长度的唯一码字,由此得到一张 Huffman 表。 编码后的图像记录的是每个像素的码字,而码字与量化后像素值的。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。