语音信号时域分析毕业设计论文(编辑修改稿)内容摘要:
汉明窗: hH={− (2nπN−1)), 0 ≤ n ≤ N− 1 0, 其余值 () 下图是两个窗函数的时域波形: 图 25 矩形窗幅度特性 图 26 汉明窗时域波形 图 27 汉明窗幅度特性 西安工程大学毕业设计(论文) 13 本章小结:本章主要讨论语音信号处理前对语音信号的准备工作,包括采集、分类预处理。 主要是为了为语音信号的时域分析做好必要的准备工作。 西安工程大学毕业设计(论文) 14 第 3 章 语音信号的时域分析 语音信号分析技术 语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。 而且 ,语音合成的音质好坏,语音识别率的高低,也都取决于对语音信号 的准确性和精确性。 因此语音信号分析在语音信号处理应用中具有举足轻重的地位。 语 音信号平稳性、时变、离散性大、且其中蕴含着说话内容及说话人特征 ,处理难度大 , 语音信号可用其取样波形描述 ,也可用信号参数和特征来描述。 提取少量参数描述语音信号 ,即语音信号的参数表示 ,是语音处理的关键技术之一 .根据所分析的参数不 同 ,语音信号分析分为时域、频域、倒频谱、小波域、高阶积累量域等方法 .时域分析具有最简单、运算量小、物理意义明确等优点。 . 贯穿于语音分析全过程的是“短时分析技术”。 因为,语音信号从整体来看其特性及表征其本质特征的参数均是随时间而变化的,所以它是一个介于稳态过程,不能用处理平稳信号的数字信号处理技术对其进行分析处理。 但是,由于不同的语音是由人的口腔肌肉运动构成声道某种形状而产生的响应,而这种口腔肌肉运动相对于语音频率来说是非常缓慢的,所以从另一方面看,虽然语音信号号具有时变特性,但是在一个短时间范围内 (一般认 为在 10~ 30ms 的短时间内 ),其特性基本保持不变即相对稳定,因面可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。 所以任何语音信号的分析和处理必须建立在“短时”的基础上.即进行“短时分析”,将语音信号分为一段一段来分析其特征参数,其中每一段称为一“帧”,帧长一般取为 10~ 30ms。 这样,对于整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。 根据所分析出的参数的性质的不同,可将语音信号分析分为时域分析、频域分析、线性预测、同态处理分析等;时域分析方法具有简单、计算量小、物理意义明 确等优点,但由于语音信号最重要的感知特性反映在功率谱中,而相位变化只起着很小的作用,所以相对于时域分析来说频域分析更为重要。 本文将简要介西安工程大学毕业设计(论文) 15 绍时域分析以及语谱图分析。 语音信号的时域分析 语音信号的时域分析就是分析和提取语音信号的时域参数。 进行语音分析时,最先接触到并且也是最直观的是它的时域波形。 语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。 时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。 这种分析方法的特点是: ① 表示语音信号比较直观、物理意义明确。 ② 实现起来比较简单、运算且少。 ③ 可以得到语音的一些重要的参数。 ④只使用示波器等通用设备,使用较为简单等。 语音信号的时域参数有短时能量、短时过零率、短时自相关函数和短时平均幅度差函数等,这是语音信号的一组最基本的短时参数,在各种语音信号数字处理技术中都要应用。 在计算这些参数时使用的一般是方窗或汉明窗。 短时能量及短时平均幅度分析 设语音波形时域信号为 x(l)、加密分帧处理后得到的第 n 帧语音信号为 Xn(m),则 Xn(m)满足下式: ( ) ( ) ( ) ( )nx m w m x n m m 01mN (31) 1 0 ~ ( 1)( ) { mNmwm , 0, 其 他 值 (32) 其中, n= 0, 1T, 2T,„,并且 N 为帧长, T 为帧移长度。 设第 n帧语音信号 Xn(m)的短时能量用 En 表示,则其计算公式如下: 1 20 ()NnnmE x m (33) En 是一个度量语音信号幅度值变化的函数,但它有一个缺陷,即它对高电平非常敏感 (因为它计算时用的是信号的平方 )。 为此可采用另一个度量语音信号幅度值变化的函数.即短时平均幅度函数 Mn,它定义为: 10 ()NMnnm xm (34) Mn 也是一种语音信号能量大小的表征,它与 En 的区别在于计算时小取样值西安工程大学毕业设计(论文) 16 和大取样值不会因取平方而造成较大差异,在某些应用领域里会带来一些好处。 短时 能量可以度量语音信号的能量随时间的变化情况, 短时能量和短时平均幅度函数的主要用途有:①可以区分浊音段与清音段,因为浊音时 En值比清音时大的多。 ② 可以用来区分声母与韵母的分界,无声与有声的分界,连字 (指字之间无间隙 )的分界等。 ③作为一种超音段信息,用于语音识别中。 下图为不同的窗长对短时能量的影响 (语音信号为(‘西安工程大学’) 图 31 帧数为 50 的 短时能量 图 32 帧数为 100 的短时能量 西安工程大学毕业设计(论文) 17 图 33 帧数为 200 的短时能量 图 34 帧数为 400 的短时能量 短时过零率分析 短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。 过零率分析是语音时域分析中最简单的一种。 对于连续语音信号,过零即意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值改变符号则称为过零。 过零率就是样本改变符号的次数。 定义语音信号 Xn( m) 的短时过零率 Zn 为: 101 s g n ( ) s g n ( 1 )2 Nn n nmZ x m x m ( 35) 式中, sgn [ ]是符号函数,即: 西安工程大学毕业设计(论文) 18 1,( 0 )1,( 0 )sgn x xx ( 36) 在实际中求过零率参数时,需要十分注意的一个问题是如果输入信号中包含有 50Hz 的工频干扰或者 A/D 变换器的工作点有偏移 (这等效于输入信号有直流偏移 ),往往会使计算的过零率参数很不准确。 为了解决前一个问题, A/D 变换器前的防混叠带通滤波器的低端截频应高于 50Hz,以有效地抑制电源干扰。 对于后一个问题除了可以采用低直流漂移器件外,也可以在软件上加以解决,这就是算出每一帧的直流分量并予以滤除。 短 时平均过零数可应用于语音信号分析,它粗略的描述了信号频谱特性 ,因而可用于区分清 /浊音 .发现发浊音时,尽管声道有若干个共振峰,但由于声门波引起谱的高频跌落,所以其话音能量约集中在 3kHz以下。 而发清音时,多数能量出现在较高频率上。 高频就意味着高的平均过零率,低频意味着低的平均过零率,所以可以认为浊音时具有较低的过零率,而清音时具有较高的过零率。 当然,这种高低仅是相对而言,并没方精确的数值关系。 利用短时平均过零率还可以从背景噪声中找出语音信号,可用于判断寂静无声段和有声段的起点和终点位置。 在孤立词的语音识别 中,必须要在一连串连续的语音信号中进行适当分割,用以确定一个一个单词的语音信号,即找出每一个单词的开始和终止位置,这在语音处理中是一个基本问题。 此时,在背景噪声较小时用平均能量识别较为有效,而在背景噪声较大时用平均过零率识别较为有效。 但是研究表明,在以某些音为开始或结尾时.如当弱摩擦音 (如 [f]、 [h]等音素 )、弱燃破音 (如 [p]、 [t]、 [k]等音素 )为语音的开头或结尾;以鼻音 (如 [n]、 [m]等音素 )为语音的结尾时.只用其中一个参量来判别语音的起点和终点是有困难的,必须同时使用这两个参数。 图 31 是 用 MATLAB 仿真一段语音信号时域波形的短时平均过零率。 (语音信号为‘西安工程大学’) 西安工程大学毕业设计(论文) 19 图 35语音信号的短时平均过零率 短时平均幅度与短时过零率的分布特点分析 短时平均幅度(或短时能量)与短时过零率都是随机变量。 研究发现,它们的概率分布决定语音的性质。 对于无声 .清音和浊音而言,它们的短时平均幅度的概率分布不仅是不同的,而且他们的短时过零率的概率分布也是不同的。 设用p( M/S)表示无声的短时平均幅度的概率分布,用 p( M/U)表示清音的短时平均幅度的概率分布,则用下图给出了它们的分布曲线。 西安工程大学毕业设计(论文) 20 短时自相关函数分析 相关分析师语音信号的时域波形常用的分析方法,利用短时自相关函数可以求得语音波形的基音周期;在用线性预测分析语音信号时,也要用到短时自相关函数。 其定义如下: Rn(K)=∑ Xn(m)Xn( m +k)N−1−Km=0 ( 0< k≤ K) ⑴ 式中, K 为最大延迟点数, N为帧长。 短时自相关函数具有如下性质:①若语音信号时周期的,则其短时自相关函数也是周期的;②若语音信号时偶函数,则取、其短时自相关函数也是偶函数;③ k=0时,短时自相关函数具有最大值,这是它表示语音信号的能量或平均功率。 由上式不难看出,随着延迟 k的增加,式中相加的乘积项将减少,则导致短时自相关函数的幅度值下降;如果帧长不够,就难于准确的确定语音信号波形序列的基音周期。 对上式进行适当修改,则有修正的短时自相关函数; Rn( k) =∑ X’n(m)X′n( m+k)N−1m=0 ( 0﹤ k≤ K) ⑵ 式二中的语音信 号序列不再由式( 2) 表示,而进行如下修正; {X‘n(m) = X(n+ m)w’( m)w‘(m) = { 1 ( m≤ m ≤ N −1+ K)0 (m 0, m 𝑁 −1 +𝐾) 对 N 点窗的 K点短时自相关函数,如直接计算,约需 KN次乘法和加法;对很多实际应用, K与 N均较大(如 K=250,N=401) .为此提出一些减少运算量的方法。 如 FFT,这是由于自相关函数为功率谱的 IDFT。 为避免自相关计算的混叠,需 2N 点 DFT(用 FFT 实现),其中有 N点数据由 N个零点取样来补足。 构成一个西安工程大学毕业设计(论文) 21 平方幅度约需 2N 次乘法,而 2N 点 FFT 需 2N ㏒ 2N 次乘法,得到所 有 N 点自相关函数。 因而, FFT 方法所需乘法总数为 : NF =2 2N ㏒ 2N+2N 另一方面,目前 DSP 可在一个很短的指令周期内完成一次乘加运算,且为卷积运算设计了一些效率很高的运算指令,所以如采用 DSP 实现自相关运算,通常是直接计算反而更加简单,而不必采用结构复杂的快速算法。 下图为一段语音信号分别加矩形窗和汉明窗的短时自相关分析 (语音信号为“西安工程大学”): 图 38加矩形窗后的自相关函数 短时平均幅度差函数分析 短时平均幅度差函数其定义为: Fn( k) =∑ |XnN−1−Km=0 (m) −Xn(m +k)| ( 0< k≤ K) 如果语音信号具有周期性,则由上式表示的短时平均幅度差函数的极小值也会周期的出现;也就是说,若语音信号是周期的,则其短时平均幅度差函数也是周期的;这一点与短时自相关函数类似,因此可以用它代替短时自相关函数来检测语音波形序列的基音周期。 而且,短时平均幅度差函数与短时自相关函数的关系为 : Fn( k) =√2β( k)【 Rn(0)Rn( k)】 1/2 对于不同。语音信号时域分析毕业设计论文(编辑修改稿)
相关推荐
,单时钟周期 /机器, 1个 T,功能强大,比普通 8051 快 8 〜12倍。 ( 3) 61 千字节的片上闪存程序存储器芯片,擦拭次数超过 100000 次。 ( 4)在芯片 EEPROM 中的大容量块,擦拭人数超过 100000 次。 ( 5) 8通道 10高速 ADC 的输出 ,可以实现每秒 300000 次的速度 ,三路 PWM 也可以作为一个 3 通道 D/A 转换器 [17]。 (
(MFCC) 1. 线性预测系数 (LPC) 这里我采用最简单的一种线形预测系数特征矢量 (LPC)。 线性预测(Linear Prediction)分析是最有效的语音分析技术之一,在语音编码、语音合成、语音识别和说话人识别等语音信号处理领域中得到了广泛的应用。 基河南科技大学本科毕业设计(论文) 11 本思想是:一个语音信号的抽样值 可以用过去的若干个抽样值的线性组合来逼近。
端应做弯钩(Ⅲ级钢筋可不做弯钩),搭接处应在中心和两端扎牢。 接头位置应相互错开,当采用绑扎搭接接头时,在规定搭接长度的任一区段内有接头的受力钢筋截面面积占受力钢筋总截面面 积百分率,受拉区不大于 25。 ( 4)板钢筋绑扎 工艺流程:清理模板 — 模板上画线 — 绑板下受力筋 — 绑负弯矩钢筋。 ①清理模板上面的杂物,用粉笔在模板上划好主筋,分布筋间距。 ②按划好的间距,先摆放受力主筋
报告、实物说明、诗歌、 小品表演等等。 活动的结论要具多样性,既可以得出统一认识,也可以保留多种意见。 重视学生之间的合作、互助与交流,注意培养学生策划、组织、协调和实施的能力。 在语文综合实践活动中 ,师生之间应当在开放的基础上 ,建立相互尊重、民主平等、情感和谐的人际关系;教师在学生综合性学习中应当做学习者、意见的倾听者,与学生平等对话。 学习应在师生平等对话的过程中进行。
y deviated from the correct direction. During 19591961, China suffered a natural disaster which made a significant loss to the whole nation。 therefore, at the end of 1960, the government began to
果来看,企业不仅为此花费了高昂的成本,而且效果并不明显。 采购代理模式把物资采购这一职能从企业内部分离出 来,采购代理企业与客户的关系公开化、明晰化,对客户企业来说,减少了物资采购的环节,从而在源头上降低了物资采购中出现腐败的可能性,大大降低了物资采购中的监督成本。 采购代理作为一种新型的物资采购模式,其廉价、高效、快捷的特点必将不断地被更多的企业所认识,成为众多企业降低采购成本的一种新选择。