基于dsp的网络电话终端的语音传输的研究毕业论文(编辑修改稿)内容摘要:
均匀分段的方式划分量化区间 ,就称之为均匀量化或线性量化 ,其主要问题是小信号处量化噪声大 ,信号过大超过量化范围时又会产生显著的过载量化噪声。 因此 ,实 际采用的都是非均匀量化。 PCM 编码虽然能够提供相当好的长途通信级语音质量 ,但由于其速率过高 ,尤其在多媒体应用以及在共享信道的数据网中应用时 ,采用 PCM传送话音占用的网络带宽资源过高 ,所以人们提出了许多改进技术 ,以降低话音编码的速率 ,或者说在同样的码率下可以进一步提高话音的质量。 降低编码比特率的基本思路是利用话音抽样信号之间的相关性。 分析表明 ,话音波形中有很多的冗余信息 ,作为信息冗余的度量 ,相邻 8khz 抽样值之间的自相关系数一般为。 由此可知 ,相邻抽样值之差一般很小 ,其 包含的信息量远小于抽样值本身。 因此一个自然的想法就是设计一种编码方法 ,对此差值进行编码 ,而不是对抽样值本身进行编码 ,这样所需的比特率必然可以下降 ,这就是差分脉冲编码 (DPCM)。 为了获得尽可能小的量化信噪比 ,应该对小信号采用较小的量化步长 ,对大信号可采用较大的量化步长。 由于对不同讲话者和在不同环境下 ,话音能量的差别可高达 40dB,即使在同一话音中 ,不同时刻的信号幅度也会有相当大的变化 ,因此有必要根据输入信号的幅度变化动态地调整量化步长。 这样可使量化器范围和 17 输入信号的动态范围相匹配 ,减小量化 噪声 ,从而进一步降低编码比特率 ,这就是自适应量化技术。 它可用于 PCM、 DPCM 和 DM。 对于线性量化来说 ,只需控制一个量化步长即可。 对于非线性量化来说 ,则要根据给定的非线性特性控制多个量化步长。 自适应线性预测的基本原理 :根据话音波形的时间相关性确定预测系数 ,使差分信号的方差为最小 ,时间相关性则是以自相关函数来度量的。 由于话音信号的自相关函数大体是随音节而变化的 ,也就是在一个音节时间内自相关函数基本不变 ,只是从一个音节至另一音节时才有较明显的变化 ,因此 ,自适应预测都采用音节适应算法。 在此 ,一个音节的时间常称为一帧。 为了计算预测系数 ,需要设定一个数据取样窗口。 设窗口宽度为 N,则每帧需用到 N个抽样值 ,利用这些样值估算自相关函数值 ,并进而计算预测系数。 和差分编码类似 ,这 N个抽样值可以直接取自于输入信号 ,由缓冲寄存器暂存 ,也可以由量化后的差分信号反馈后重构生成。 前者称为前馈 (feedforward)自适应预测 ,又称开环自适应预测 ,是根据原始信号调整预测系数的。 后者知称为反馈 (feedback)自适应预测 ,又称闭环自适应预测 ,是根据重构信号调整系数的。 (2)参数编码 参数编码器又称为声码器 (Vocoder),它的原理和设计思想和波形编码完全不同。 波形编码的基本思路是忠实地再现话音的时域波形 ,为了降低比特率 ,可以充分利用相邻抽样点之间的信息冗余性 ,对差分信号进行编码 ,在不影响话音质量的前提下 ,比特率可降至 32kbit/s。 在话务过载的情况下 ,还可降质使用 24或16kbit/s编码 ,但要进一步降低比特率就有困难了。 参数编码根据对声音形成机理的分析、着眼于构造话音生成模型 ,该模型以一定精度模拟发话者的发声声道 ,接收端根据该模型还原生成发话者的音素 ,在频域上该模型就对应为具有一定零极点分布的数字滤波器。 编 码器发送的主要信息就是该模型的参数 ,相当于话音的主要特征 ,而并非具体的话音波形幅值。 而且由于话音信号变化是缓慢的 ,一个音素要持续相当长一段时间 (相对于抽样周期而言 ),因此模型参数的更新频度较低 ,不但可以利用抽样值间的相关性 ,还可以充分利用帧与帧之间的信息冗余性以及更长时间段中的音源信息冗余性 ,有效地降低编码比特率。 因此 ,目前小于 18 16kbit/s 的低比特率话音编码都采用参数编码。 虽然参数编码和波形编码的原理完全不同 ,但是归根到底信息都取自于对抽样值的分析计算 ,为了去除冗余信息都需对差分信号 (或称残差信号 )进行 处理 ,因此在技术上两者并无明显的界线 ,许多技术 ,如线性预测、自适应预测、矢量量化等既可用于参数编码 ,也可用于波形编码。 两种编码技术的比较 :波形编码的基本出发点是最小化原信号和重构信号之间的差值信号 ,最小化判据一般为以“块”为基础的差分信号的均方差 ,块可以小到单个话音抽样。 波形编码的设计要求是获得尽可能高的信噪比 (SNR)。 改进的编码器还考虑人类听觉系统的主观感觉效果 ,为此可设置屏蔽滤波器 ,修正原信号和重构信号。 这样 SNR 有可能下降 ,但主观感觉质量反而会提高。 波形编码器主要利用话音波形的短时相关性 ,特别是相 邻抽样点之间的相关性来降低比特率 ,改进算法还考虑了长时相关性。 参数编码的基本出发点是根据确定的成音模型确定模型参数 ,虽然 LPC 声码器也是通过残差信号的最小化进行计算的 ,但是其着眼点是要求模型参数的最佳值 ,而并非 SNR 的最大化。 8khz,码率为 64kbit/s,主要包括 A律和 u律两种 ,都是采用压扩方法。 它将 13位或 14位的 PCM 编码转换成 8位 A律或 u律的压扩编码 ,质量相当于 12位比特的线性量化 ,同时还规定了 A律和 u律之间的转换关系。 设归一 化输入信号为 x,则采用 A律的压缩函数为 : / ( 1 l n ) s g n ( ) , 0 1 /( 1 l n ) ( 1 l n ) ] s g n ( ) , 1 / 1A x A x x AA x A x A x 当 x=0时, y 趋于负的无穷,这样不满足压缩特性的要求,所以当 x很小时,应对它加以修正,过零点做切线,这就是公式的上式,他是一个线性方程,对应的国际标准值为 为压扩参数, A=1时无压缩, A值越大压缩效果越明显。 19 图 折线逼近的压缩方程曲线 x为压缩器归一化输入电压; y为压缩器归一化输出电压; A 为常数,决定压缩程度 ; 4 IP 电话原理及技术 lP 电话基本原理 IP电话是通过 Inter/Intra等互联网络来传递语音信息的 ,该系统包括终端设备、网关、多点接入控制单元 (MCU)和网络管理者等部分。 其基本原理是 :通过语音压缩算法对语音数据进行压缩编码处理 ,然后把这些语音数据按TCP/IP标准进行打包 ,经过 IP网络把数据包送至接收地 ,再把这些语音数据包串起来 ,经过解码解压处理后 ,恢复成原来的语音信号 ,从而达到由互联网传送语音的目的。 由于 IP 电话使用了分组交换和统计复用技术 ,实现了语音、数据的综合传输 ,从而克服了传统电话对紧缺通信带宽的高额消耗 (一路电话话音占用了 20 64Kbps 的带宽 ),而它只需要 6一 8Kbps(甚至低于 ),大大地节省了通信带宽 ,使得整个网络的运营成本大幅度降低。 这对于渴望减少巨额国际传统电话通话费用的公司来说 ,用 IP 电话带来的好处是显而易见的。 IP 电话的关键技术 IP 电话的关键技术包括分组语音技术、语音编码和压缩技术、静音检测、分组丢失补偿和回波抵消等。 传统的电话网是以电路交换的方式传输语音 ,它需要的基本带宽为 64kbit/s。 而要在基于 IP的分组网络上传输语音 ,就必须对模拟的语音信号进行特殊的处理 ,使处理后的信号可以适合在面向无连接的分组网络上传输 ,这就是分组语音技术。 语音编码就是将语音信息转换为分组信息以及将分组信息转换为语音 ,其中包括优化编码方案、寻找最佳算法、对语音进行高效、优质的编解码以及语音恢复等。 无论对实时的应用 (如 IP电话 )还是非实时的应用 (如语音邮件 ),发送端语音都要经过模拟信号 — 数字信号 — 语音包的处理过程 ,并在接收端对语音包进行相反处理 ,从而得到与输入端相同的语音信号。 所以可将分组语音的处理流程分为发送端处理流程和接收端处理流程。 (l)发送端处理流程 :首先 ,把模拟信号转换为数字信号 ,并对其进行进入缓冲器前的量化数据处理。 先对模拟信号进行 8位或 16位量化 ,然后再送入缓冲区 ,再由编码器对语音块 (也被称为帧 )进行编码 ,典型帧为 10一 30ms,考虑到传输过程中的代价 ,语音包通常由 60、 120或者 240ms 长的语音数据组成。 其次 ,把语音包按接收器 A/D 转换 压缩编码器 IP 封装 /发送器 Inter 播放器 D/A转换 压缩解码器 IP 解包 /接收器 21 照特定的帧长进行编码。 大部分的编码器都有特定的帧尺寸 ,若一个编码器使用15ms 的帧 ,则把第一级来的包分成 8帧 ,并按顺序进行编码。 每个帧合 120个语音样点 (抽样频率为 skHz)。 编码后 ,将 8个压缩的帧合成一个压缩的语音包送入网络处理器。 最后网络处理器为语音包添加包头、时标和其它信息后通过网络传送出去。 (2)接收端处理流程 :首先 ,网络提供一个可变长度的缓冲区 ,用来调节网络产生的抖动。 缓冲区可容纳许多语音包 ,用户可选择缓冲区的大小 ,大的缓冲区能调节大的抖动 ,但产生延迟较大 ,小的缓冲区产生延迟较小 ,但不能调节大的抖动。 其次 ,解码器将接收到的语音包进行解压缩产生新的语音包。 这里也可按帧进行操作 ,完全和编码器的长度相同。 若帧长为 15ms,则 120ms 的语音包被分成 8帧 ,然后被解码还原成 120ms 的语音数据流送入解码缓冲区。 最后 ,缓冲区中的语音样点被播放驱动器取出送入声卡 ,通过扬声器按预定的频率 (如 8kHz)播出。 模拟语音信号必须经过处理 ,转换成适合在护网络上传输的 IP 数据包。 这个过程需要先进行数字编码 ,转换为 PCM码 ,然后经过专门的 DSP芯片进行数据压缩 ,最后再打上 IP 包的标记 ,形成 IP 数据包的形式 ,以适合 IP 网络上的传输带宽 ,其中涉及到 PCM、 DSP、编码、压缩等内容。 (l)PCM 技术 :脉冲编码调制 (Pusle Code Modulation 简称 PCM),是指把模拟信号转化为数字信号的过程 ,为目前世界各国主要采用的方式。 PCM 包括抽样、量化和编码三个过程。 编码形式有多种 ,如 :低速编码和高速编码。 线性编码和非线性编码。 逐次反馈型、级联型和混合性等。 (2)DSP 技术 :DSP 是数字信号处理器 (digital signal Proeessor)的 缩写 ,属于MPU(微处理器 )的一种 ,它主要应用于声音压缩、图像压缩等数字压缩技术领域 ,能将声音、图像等模拟信号高速转变成数字信号。 DSP 是一种特殊的单片机 ,同时也是一个嵌入式系统。 网络设备中引入了 DSP 技术 ,使得交换以太网和快速交换以太网变得更快、更便宜、也更容易升级。 现在数字信号处理器广泛用于调制解调器和移动电话 ,发展非常迅速。 DSP 优于 RISC 处理器 ,其原因在于 DSP 有嵌 22 入的协处理器和用于快速数据处理的并行数据通道。 另外 ,基础系统和扩展模块中的 DSP 也能分担一些数据处理的任务。 进入九十年代后 ,DSP 技术 发展十分惊人 ,目前已成为不少新兴科技的主要推动力 ,其中包括电信和多媒体技术 ,以 DSP作为主要元件 ,再加上外围设备和特定的功能单元综合成的单一芯片 ,加速了DSP 方案的发展。 也揭开了通信及消费电子市场合一的新纪元。 通过 Intemet 传输实时的语音或图像与传输普通数据是不一样的 ,应用网络的组成必须符合这种实时传输的需要 ,能支持高品质的 VoIP(Voice over IP)应用是走向成功的一个关键因素。 语音的分组传送通常要求网络提供充足的带宽 ,所以对现有的多数 IP网络而言 ,话音压缩技术是实施 IP语音通信的关键所在。 语音压缩协议有上面提到的协议中带 G 打头的几种。 编码压缩方法由 ITU 统一制定 ,并标准化。 它的压缩能力由 DSP 的处理能力决定 ,通常 DSP 的处理能力用 MIPS(millions of instructions Per Second)来度量。 编码压缩仅负责实际传输中的 IP 分组数据进行压缩 ,不负责对 IP头压缩 ,一般 ,IP用 DP头 (包括地址信息和控制信息 )要耗去 7kb/s左右的带宽 ,如果有些 IP路由器支持 IP包头的压缩 ,那么带宽损耗可以降低 23kb/s。 静音检侧又称话音活动性检测 (VAD Voice Activity Detection ),它是一种静音压缩技术。 在电话通信中 ,平均来说 ,每一方说话的时间和听对方说话的时间大体上各占一半 ,加上说话时还有停顿间隙 ,因此任一方对线路的占用率大约只有 40%左右。 在电路交换中 ,即使不说话 ,也要占用 64kbit/s 的信道。 而在分组交换中 ,由于传输通道是统计复用的 ,因此在通话者不讲话时就可以不发送话音分组 ,从而进一步降低语音比特率。 这一技术的关键就。基于dsp的网络电话终端的语音传输的研究毕业论文(编辑修改稿)
相关推荐
EG2 不是 MPEGl的简单升级,MPEG2 在系统和传送方面作了更加详细的规定和进一步的完善。 MPEG2 特别适用于广播级的数字电视的编码和传送,被认定为 SDTV 和 HDTV 的编码标准。 MPEG4 也是由 ISO/IEC 下的“动态图象专家组”制定的图像压缩编码标准,于 1999 年初正式成为国际标准。 它是一个适用于低传输速率应用的方案。 实际上, MPEG4 对
个更深入的了解。 在了解课题以后,接下来本人通过各种途径收集关于课题的资料。 通过这些资料,可以在学习前人成果的基础上,对自己课题做好充分的扩展和发挥。 本课题主要设计方案是从硬件设计和软件编程两个方面来完成设计目的,选用 TI 公司 TMS320VC5402 定点数字信号处理芯片 ]13[ 作为 CPU。 硬件方面设计主要原理是:通过信号发送器产生的 0~2V模拟信号,经过 AD 采样,送到
备都是相互兼容,这样的系统接口以实现某种功能要比模拟系统与这些系统接口要容易的多。 ( 2)编程方便。 DSP 系统种的可编程 DSP 芯片可使设计人员在开发过程中灵活方便地对软件进行修改和升级。 ( 3)稳定性好。 DSP 系统 以数字处理为基础,受环境温度以及噪声的影响较小,可靠性高。 ( 4)精度高。 16 位数字系统可以达到的精度。 ( 5)可重复性好。
11 图 CPU定时器内部结构 从上图可以看出, CPU 定时器可以分为 16 位的分频器及 32 位的计数器。 可将计数周期先存到 PRDH:PRD(周期寄存器)中,当计数器启动时, PRDH:PRD 的值载入 TIMH:TIM(计数器)中进行减计数,当值减为 0 时,发出中断请求信号,同时计数值重新装载到周期寄存器中。 定时器初始化主要程序如下: void
系统基本功能的调试工作,主要工作包括 : (1) 方案论证 :根据系统性能指标要求,确定系统的控制方案。 (2) 原理图绘制 :根据系统设计 方案完成控制系统 DSP 电路原理图的设计工作,包括 DSP 本体电路设计和直流直线电机驱动电路设计。 . (3) 硬件调试 :制作 PCB 电路板。 系统控制软件的设计与实现 按照控制系统技术指标的要求,对系统进行合理的分析与规划
3。 50 通信接收中断服务程序流程图 51 本章小结 51 第六章 现场测试数据和分析 52 现场测试实验 52 测试数据分析 54 电能测量数据分析 54 电梯能效数据分析 55 提高电梯能效的途径 59 本章小结 59 结 论 60 参考文献 61 V 附 录 63 攻读硕士学位期 间取得的研究成果 错误 !未定义书签。 致 谢 72 第一章 绪论 1 第一章 绪论 课题的研究背景