mpeg-4编码技术的研究与仿真毕业设计内容摘要:

83。 38 参考文献 39 附录 40 摘要 21 世纪的人类社会是信息化的社会,就通信内容来说,它己不局限于简单的语音、文字信息,更进一步地,将图像视频信息亦纳入其中。 数字化后的信息,尤其是视频和音频信息具有数据海量性, 它们给存储和传输造成较大的困难。 MPEG4 是商业界最重要最有影响的多媒体数据压缩编码国际标准之一,它的全称为音频和视觉对象的通用编码。 它定义了音频、视频等多媒体数据语法结构和解码过程、互联网上的传输以及人与媒体交互的一整套框架,覆盖了多媒体的绝大部分应用领域。 它的基于对象思想使其具有高压缩比、灵活性好、可扩展性和可交互性强等优点。 MPEG4 是最重要的多媒体数据压缩编 /解码国际标准之一,在工业控制、国防建设和家庭娱乐等领域有广阔的应用前景。 本文首先对 MPEG4 数字视频标准的基本原理和实现算法进行了深入 的研究 , 分析 了 MPEG4与 MPEG MPEG2的主要区别 ,探讨 了 MPEG4编码技术的新特点及优势,并 展望了 MPEG4 的应用前景 , 然后改进了传统的运动估计算法,实现了一个基于 MPEG4视频压缩标准的实验模型, 用 MATLAB 仿真工具 进行 了 相应的 软件仿真。 关键 词: MPEG4, 数字视频,视频编码 ABSTRACT With the development of information technology in 21st century, the munication contents do not only have simple aural and literal information, and people also hope to be provided indubitable, intuitionistic and effective visual information. But the digital video and audio is too huge to store and transmit it. As one of the multimedia pression and coding standards, MPEG4 plays an important role in multimedia field. MPEG4 standard is officially called the general coding of audio and video objects. MPEG4 defines a set of frameworks including syntax and decoding of multimedia dada, transmission on Inter and interaction between human and media. Due to its objectbased idea, it has the virtues of high pression ratio, scalability, interactivity with users and so on. For this reason, it is applied in many fields such as mobile wireless munication. MPEG4 is one of the most significant muftimedium pressions of data coding and decoding international standard, there is the wide application foreground in the territorys such as the industry control and building up of national defense and household amuse and so on. MPEG4 is one of the most significant muftimedium pressions of data coding international standard, there is the wide application foreground in the territorys such as the industry control and building up of national defense and household amuse and so on. First of all, this article has deeply researched the theory and the realization algorithm for digital video based on the MPEG4. Analyze the main difference between MPEG4 and MPEG1,MPEG2. Explore the new characteristic and advantage of MPEG4 encoding technology. And prospects application future of MPEG4. Afterwards the motion estimation algorithm has been improved and the experimental pattern based on MPEG4 has been achieved, the software emulation has been implemented by MATLAB. Key Words: MPEG4, digital video, video coding 引言 近年来,随着生产力和经济的快速发展,人们 的 社会生活发生了许多改变,人们之间的流动性增加,迫切需要打破地域对交流设置的樊篱。 为了适应这种变化,各家厂商不仅在大力开发各种 通信 设备和通信器材,而且对通信内容进行了扩充,使其不再局限于简单的语音、文字信息,提供确切、直观、高效的图像视频信息已成为电信运营商的一个重要追求。 然而,图像视频信号经过数字化处理之后形成的数据量非常庞大,如此庞大的数据量不仅存储开销很大,而且在传输中使得通讯设备的负荷量很重,甚至承受不了。 采用压缩技术,可以把这些数据压缩几倍、几 十倍,甚至几百倍。 因此,研究如何去除冗余数据、高效地表示图像、进行数据压缩,具有重大的实用价值。 数字图像压缩技术己成为目前国内外的研究热点之一,为了保证不同厂商设备和产品之间的可交换性,国际标准化协会 (International Standardization Organization ISO),国际电子学委员会(International Electronics Committee , IEC) 、国际电信协会 ( International Telemunication Union, ITU)等国际 组织于 90年代领导制定了许多重要的多媒体数据压缩标准。 从 、 MPEG 到 MPEG2再到现在的 MPEG MPEG MPEG2 ,标准越来越成熟,覆盖的应用领域愈来愈广泛,尤其是 MPEG4和 等面向低码率高质量的标准对于实时视频传输处理有着非 常 重要的意义。 同时,通信技术也在飞速发展,各种宽带网络的出现使得实时视频传输成为可能。 目前在商业界发展最迅速、影响最大、技术较成熟的多媒体数据压缩编码国际标准是 MPEG4。 它的全称为音频和视觉对象的通用编码 ,是伴随着互联网而产生和发展起来的。 它定义了音频、视频等多媒体数据的码流语法和解码过程、互联网上的传输以及人与媒体交互的一整套框架,覆盖了多媒体的绝大部分应用领域。 它的基于对象思想使其具有高压缩比、灵活性好、可扩展性和可交互性强等优点。 MPEG4 正在蓬勃发展,及时了解和跟踪它的发展动向,掌握其核心技术,结合实际应用,是一项很有意义的事情。 本课题 的理论依据是 MPEG4视频编码原理。 实验基础的硬件环境是微机环境,软件环境为 WindowsXP 操作系统平台,MATLAB 程序开发环境。 本课题的意义在于 : 研究 、改进了 MPEG4 视频压缩标准的 实验模型, 掌握了视频压缩编码的核心技术,为 MPEG4 在通信设备上的实际应用和开发奠定了基础。 第一章 MPEG4 标准 简介 概述 近年来,多媒体技术飞速发展,在社会生活的许多领域得到了广泛的应用。 人们对网络信息的多样化提出了更高的要求,表现在媒体质量、媒体交互能力方面尤为突出,原有的 MPEG 1 /2 由于一些局限已经不能适应发展的需要, 为了适应数字视频技术的发展, 有必要 组织制定 新 的数字视频编码标准。 MPEG4 就是在这种背景下应运而生的。 它 是伴随着互联网 的产生而发展起来的。 ISO的 MPEG4标准的第一版于 1999年 1月正式公布,标准的第二版于 1999年 12 月公布。 MPEG4 的初衷是针对视频会议、视频电话的超低比特率编码,但在调查过程中发现,高能通用芯片性价比的提高使得基于软件平台的压缩编码方法具有实用可能 : 人们对视频信息的应用要求由播放型转向基于内容的访问、操作型。 这使得 MPEG 组织不得不修改计划,针对应用定义一种新编码概念 —— 基于内容的压缩编码方法,将基于内容的检索与编码结合起来考虑,在压缩数据中加入描述视频内容的信息,从而使对多媒体信息的内容的访问 可以直接针对压缩数据进行。 这种新的编码方法最大好处之一是可以基于通用芯片,打破了基于专业硬件的限制,且还可以加入新的有效的算法模块,甚至涉及到图像分析的较复杂算法,这对于以前基于专用硬件的压缩编码方法是不可想象的。 较之 MPEG 前两个图像压缩标准而言, MPEG4 为多媒体数据压缩提供了一个更为广阔的平台,它更多定义的是一种格式和框架,而不是具体的算法。 MPEG4 定义了多媒体编码和解码、网络传输以及人与媒体交互的一整套框架,涵盖了多媒体的绝大部分应用领域。 从结构上看, MPEG4 标准分为十个部分 : 系统层、 视频、音频、 DMIF、一致性测试、参考软件、优化的视频编码参考软件、用 IP 网络承载 MPEG4 内容、参考硬件描述和高级视频编码,前四个模块为 MPEG4 的核心模块 ; 从层次上来讲,可划分成三个层次 : 压缩层,同步层,传输层。 压缩层对应视频、音频核心部分,对传输部分是不可知的。 MPEG4要实现的目标有 : (1)再现被称为“媒体目标”的听觉、视觉或视听内容单元,这些媒体目标可以是自然的或人造的 ; (2)能够把音效、视觉、自然合成的对象组合成音频、视频场景 ; 且能允许单独对这些对象进行访问、控制和重用 ; (3)切 换和同步媒体目标的数据,以便它们能在网络通道上传送,提供适合特定媒体目标的 QoS ; (4)在接收端产生交互的视听景物,满足多种业务的需要。 MPEG4 被称为面向对象的编码技术, 它 基于对象的编码思想使其具有高压缩比、可扩展性、可交互性等许多优点。 在网络视频通信中具有广阔的应用前景。 其传输速率要求较低,可用 于传输速率低于 64kb/s 的实时图像,最高分辨率为768 X 576。 MPEG4 利用很窄的带宽,通过帧重建技术压缩和传输数据,以最少的数据获得最佳的图像质量。 MPEG4 采用了包括小波变换等多种变换, 可以获得更小的硬盘空间占用,更高的清晰度。 基于 MPEG4 的技术正在蓬勃发展,代表着未来多媒体数据压缩编码的发展趋势,及时跟踪和了解 MPEG4 的发展动态,掌握其核心技术,并结合实际应用在某些关键方向上有所创新和发展,是一项很有意义的工作。 MPEG4 与 MPEG MPEG2 的比较 解决视频、音频数字化后数据量大与数字存储媒体和通信网容量小的矛盾的主 要途径之一就是压缩。 为此,国际标准化组织先后 于 1993 年和 1995 年制定了视频、音频编码的国际标准 MPEG1和 MPEG2。 MPEG1 ,MPEG2 都是采用第一代压缩编码技术,着眼 于 图像信号的统计特性来设计编码器,属 于 波形编码的范畴。 第一代压缩编码方案把视频序列按时间先后分为一系列帧, 每 一帧图像又分成宏块以进行运动补偿和编码。 这种编码存在以 下 缺陷 : (1)将图像固定地分成相同大小的块,在高压缩比的情况 下 会出现严 重 的块效应,即马赛克效应 ; (2)不能对图像内容进行访问编辑和回放等操作 ; (3)不能充分利用人类视觉系统 ( HVS , Huaman Visual System)的特性。 MPEG4 在 MPEG2 基础上作了很大 的扩充 .主要 目 标是多媒体应用。 MPEG4标准与 MPEG1和 MPEG2标准最根 本 的区别在 于 MPEG4是基 于 内容的压缩编码方法 , 它突破了过去 MPEG1 和 MPEG2以 矩 形或方形块处理图像的方法 , 这些方法将整帧图分割成固定尺寸、固定开头的 子 块进行处理。 而 MPEG4 是对一幅图像按内容切分块 ,即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象分别编码后 ,再经过复用传输到接收端 ,然后对不同的对象分别解码 ,从 而 组合成所需要的视频和音频。 这样既方便对不同的对象采用不同的编码方法和表示方法 , 利 用 不同 数据类型间的融合 ,并且 可方便地实现对 于 各种对象的操作及编辑。 MPEG4 标准的 特点 及优势 MPEG4 与 MPEG1 和 MPEG2 相比 , 在交互性、抗误码性和高效压缩上都有 巨大的优势。 基 于 内容 的 交互性 基 于 内容功能的核心是支持对独立内容 (即某场景中的物理对象 )的编解码。 它把一个视听场景定义成了一系列可再现的视听对象 , 这些视听对象在时间和空间上具有某些相关联的成分。 对场景中的各个对象分别进行编码是一种很有效的编码方法 , 可实现同场景中有意义的对象的交互。 这是对今 天 模拟和数字系统中具有交互 功能的视频播放器的很好的扩展 , 例如它允许信 息 和场景中的运动对象相连接 , 可将资源定位器 (URL)关联上场景中的足球运动员 ,当用户在足球运动员上 点 击鼠标时即可启动 URL, 从 而 得到关 于 这个运动员的详细信 息。 传统的基 于帧的视频系统要实现上述功能十分困难 , 除非这个人是固定的 , 预先定义好位置。 又如 , 在一个大型的交响音乐会的现场转播中 , 发现了一陌生的乐器 , 它奏出的旋律被其他乐器的声音所淹没 , 通过对音频对象的操纵 .可以让这场大型交响音乐会变成这个陌生乐器的独奏音乐会 , 从 而 好好欣赏它的音色。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。