基于vq的大学生语音识别算法研究毕业论文(编辑修改稿)内容摘要:
区域边界对应一个码字,所有 M 个码字构成码本。 识别时,将输入语音的 K 维帧矢量与已有码本中的 M 个区域边界比较,按失真测度最小准则找到与该输入矢量距离最小的码字标号来代替此输入的 K 维矢量,这个对应的码字即为识别的结果,再对它进行 K 维重建就得到被识别的信号。 专家知识库 用来存储各种语言学知识。 知识库中一般包含词汇、语法、句法、语义和常用搭配等知识,如汉语的声调变调规则、音长分布规则、同音字判别规则、构词规则 、语法规则、语义规则等。 知识库中的知识需要具有便于修改和扩充的特点。 对于不同的语言需要有不同的语言学专家知识库,同样,汉语也有其特有的专家知识库。 判决 对于输入信号通过计算而得的测度,根据若干准则及专家知识库,判决选出可能的结果中最好的那个,由识别系统输出,这一过程便称之为判决。 因此,选择适当的各种距离测度的门限值是最主要的问题。 这些门限值与语种有着密切的关系。 判决的结果 识别率是检验门限值选择正确与否的唯一标准,通常情况下需要调整这些门限值才能得到满意的识别结果。 矢量量化 矢量量化 的研究涉及到许多学科的技术和理论知识,应用范围非常广泛。 由于采用矢量量化技术的数据压缩具有编码简单、效率高、压缩比大等诸多优点,因而,矢量量化最先在语音、图像、视频这些媒体信息的压缩中得到了广泛的应用。 由于矢量量化高压缩比的特性,兰州理工大学毕业论文 7 使得它可以应用在国防军事的遥感卫星、雷达监测等方面,可以应用在高清电视、网络视频等民用设施的实时传输上。 矢量量化技术在其他方面的应用也发展十分迅速,如语音识别,说话人识别,文件检索,移动通信等众多科学领域中矢量量化技术已得到了广泛地应用。 矢量量化的三大关键步骤和技术是 ]6[ :码书设计、码字搜索和码字索引分配,其中码书设计和码字搜索是矢量量化过程中的关键。 码书设计在一方面可以看成是一个统计聚类的过程,但从另一个角度来看,码书设计也是一个迭代过程。 码书设计可以视其为一个类似于函数优化的问题,所以设计时要搜索最优化的全局码书,需要一种全局算法。 从以上分析可以看出,码书的优化是一个很重要的环节。 人们试图努力找到各种新的码书优化的算法和策略,多种理论研究都应用到了码书算法,例如神经网络,模糊集合论,遗传算法等。 此外 ,先进的预测技术也是提高压缩比的一种方法。 矢量量化的基本概念 量化的实质是把一个模拟信号值的连续范围分为若干个相邻并且具有唯一量值的区间,凡落在某区间的抽样信号样值都指定为该区间量值的过程。 量化可分为标量量化和矢量量化两大类 ]2[。 标量量化 整个信号的动态范围被分成若干个小区间,每个小区间有一个代表值。 当输入的标量信号落入这个小区间时,其量化值就用这个代表值代替,或者称之为被量化为这个代表值。 因为此时的 信号量是一维的标量,所以称之为标量量化。 矢量量化 用线性空间的观点把标量量化看成是一维矢量量化。 矢量量化是对矢量进行量化,它把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替,或者称之为被量化为这个代表矢量 ]7[。 矢量量化是标量量化的发展,同时,矢量量化总是优于标量量化。 矢量维数越大,矢量量化的性能就越优越。 在输入信号序列中,每 K 个连续样点可以组成一组 K 维欧式空 间中的一个矢量,矢量量化就是把这个 K 维输入矢量 X 映射成另一个 K 维量化矢量 Y。 其中 ,量化矢量构成的集合},...,{ 21 JyyyY 称为码书或码本,码书中的每个矢量 iY 称为码字或码矢。 例如,当 K=2 时所构成的是一个二维矢量,所有可能的二维矢量就构成了一个平面,记二维矢量 },{ 2,1, iii xxx ,所有可能的 },{ 2,1, iii xxx 就是一个二维空间。 如图 22( a)所示,矢量量化就是将平面分成 M 个如 MSSS ,..., 21 的小区域,从每个小区域中找出代表向量 ),...,2,1( MiYi ,这些代表向量的集合就是有 M 个区间的二维矢量量化器。 图 22( b)所示的是一个 7,2 MK 的二维矢量量化兰州理工大学毕业论文 8 器,共有 7 个代表值 721 ,..., YYY ,这些代表值值通常被称为量化矢量 ]4[。 若要对一个落在二维矢量空间中的模拟矢量 X 进行量化,首先要选择一个合适的失真测度,而后利用最小失真原则 ]8[ ,分别计算用量化矢量 }{iY 替代 X 所带来的失真。 其中最小失真值所对应的那个量化矢量,就是模拟矢量 X 的重构矢 量(或称恢复矢量)。 通常把所有 M个量化矢量(重构矢量或恢复矢量)构成的集合 }{iY 称之为码书或码本。 码书中的量化矢量称为码字或码矢。 不同的划分或不同的量化矢量的选取就可以构成不同的矢量量化器。 (a) (b) 图 22 矢量量化示意图 根据上面对矢量量化的描述,可以给矢量量化进行如下下的定义:矢量量化是把一个 K维模拟矢量 kRxX 映射成为另一个 K 维量化矢量,其数学表达式为: )(XQY (21) }, . . . ,{ 21 kiNN RYYYYyY (22) 式中, X 表示输入矢量; x 表示信源空间; kR 表示 K 维欧氏空间; Y 表示量化矢量(码字或码矢); )(Q 表示量化符号; Ny 表示输出空间(即码书); N 表示码书的大小(即码字的数目)。 矢量量化系统一般情况下可以分解为两个集合的映射 ]9[ ,即 Q (23) 式中, 是编码器,它是将输入矢量 kRxX 映射为信道符号 },...,{ 21 NN iiiI 中的一个元 ji ; 是译码器,它是将信道符号 ji 映射为码书中的一个码字 iY ,即 jiX )( ),( Nj IixX (24) ij Yi )( ),( NiNj yYIi (25) 兰州理工大学毕业论文 9 矢量量化步骤 码书设计、码字搜索和码字索引分配是矢量量化的三个关键技术,其中码书设计和码字搜索尤为重要。 码书设计 对于矢量量化,首先要设计出一个性能良好的码书,一个好的码书是实现编码的基础。 如果用平方误差测度作为失真测度,且训练矢量数为 N,想要生成含有 M(MN)个码字的码书,那么设计码书的过程就要找到一种最佳方案,把 N 个训练矢量分成 M 类,而把这 M 类的质心矢量作为码书的码字。 因而,寻求一种高效的算法,使尽可能找到全局最优或接近全局最优的码书来提高码书的性能,从而减少计算的复杂程度才是研究码书设计算法的目的。 码字搜索 矢量量化码字搜索算法是当码书已经设计好的时候,输入给定矢量,在码书中搜索与输入码字间失真最小的码字。 码字索引分配 在矢量量化参与的编码和解码系统中,如果信道有噪声,则在信道左端的索引 i 经过信道传输输出索引 j ,这样就会导致在 解码端引入额外的失真。 码字索引进行重新分配可以有效的减少这种失真 对于矢量量化来说,设计性能好的码书是矢量量化最为关键的问题。 好的码书能最大程度的提高矢量量化的效果,使得恢复后的矢量、语音、图像和原来的矢量、语音、图像尽可能的相似。 矢量量化器 矢量量化反映在实际中的应用就是矢量量化器 ]10[ ,矢量量化器在实际生产生活中应用非常广泛,特别是在多媒体信息中更加突出。 矢量量化技术的核心是矢量量化器的设计。 第一个实际的矢量量化器 1978年发明至今,随着发展矢量量化技术被不断的推出新的设计。 矢量量化器根据其原理 ]11[ 可以分解为编码器和解码器两部分,如图 23。 在编码端,输入矢量 X 与码书 (a)中的每一个或部分码字进行比较,分别计算它们的失真,检索到失真最小码字 iY 的序号 i(或码书中此码字所在的地址), 并将 i 的编码信号通过信道传输到译码端;在译码端,先把信道传来的编码信号译成序号 i ,再根据序号 i (或码字 iY 所在地址 ),从码书( b)中查出相应的码字。 由于码书( a)与码书( b)是一样的, 此时 ),( iYXD 失真最小,所以 iY 就是输入矢量 X 的重构矢量(恢复矢量)。 由于信道中传输的并非矢量 iY 本身,而是其序列号 i 的兰州理工大学毕业论文 10 编码信号,所以理论上传输速率还可以进一步提高。 图 23 矢量量化器原理框图 失真测度 矢量量化器的设计关键是编码器的设计,而译码器仅是一个简单的查表过程。 编码的过程中,需要引入失真测度的概念 ]12[。 失真是将输入信号矢量用码书的重构矢量来表征时的误差或付出的代价,用这种误差的统计平均值(平均失真)来表征矢量量化器的工作特性。 在矢量量化器的设计过程中,失真测度的选择是很重要的,选用的是否得当直接影响着系统的性能。 常用的失真测度主要有均方误差失真测度 ]13[ (即欧氏距离)、加权的均方误差失真测度、板仓 斋藤似然比距离、似然比失真测度等,在语音信号处理中常被应用于语音波形的矢量量化、线性预测参数矢量量化和孤立词识别的矢量量化中。 在本毕业论文设计中,各种算法中涉及到计算失真的部分均 采用的是欧氏距离 均方误差。 ( 1)欧氏距离 均方误差 设输入信号的某个 K 维矢量 X,与码书中某个 K 维矢量 Y 进行比较, ix 、 iy 分别表示 X和 Y 中的各元素 )1( ki ,则定义均方误差为欧氏距离,即有 K YXYXyxKYXd TKi ii )()()(1),( 1 22 (26) 这里, ),(2 YXd 的下标 2 表示平方误差。 ( 2)线性预测失真测度 用全极点模型表示语音信号的线性预测方法广泛应用于语音信号处理中。 在分析语音信失真测度 ),( YXd 码书( a) NYYY ,..., 21 计算 ),(min ii YXd 置 iX )( 信道 /存储器 码书 ( b) NYYY ,..., 21 寻找 iY iYi)( 输入 矢量 X )(XQYi 编码器 译码器 i i 兰州理工大学毕业论文 11 号时,它按照预测误差能量(方均值)最小准则 ]6[ ,得到模型的预测系数。 为了比较 用这种参数表征的矢量,如果直接使用 Euclid 失真 ]14[ ,显然意义不大。 因为仅由预测系数的差值不能完全表征这两个语音信息的差别。 此时,直接用由这些系数所描述的信号模型的功率谱进行比较是适宜的。 日本学者板仓等人提出了这种失真测度。 设 x( n) (n=0,1,...,N1)是一帧 N 长信号, paaa ,..., 21 是其 p 阶最佳线性预测系数,并组成特征矢量 ],...,1[ 21 paaaa ,再设码书中的某特征矢量为 ],...,1[ 21 paaaa 。 信号 x(n)(功率谱为 )(wf )和码书特征矢量 a 决定的信号(功率谱为 )(wf )之间的 ItakuraSaito 失真测度,定义为 1ln),(222 pPTxIS aRaffd (27) xR 信号 x(n)的 p+1 阶自相关矩阵 )(ir 信号 x(n)的自相关函数, iNkikxkxir 10)()()( 2 信号 x(n)的预测误差功率; 2p p 阶码书重构矢量的预测误差功率 ( 3)识别失真测度 将矢量量化技术应用于语音识别时,对失真测度还应该有其他一些考虑。 研究表明,频谱与能量均携带有语音信号的信息,如果仅以功率谱作为失真比较的参数,则语音识别的性能不够理想。 为此,可以采用如下定义的失真测度: )(),()。基于vq的大学生语音识别算法研究毕业论文(编辑修改稿)
相关推荐
实现 : ( 1) 建立文件。 单击 ―File‖菜单下的 ―New‖命令或者使用快捷键 Ctrl+N,弹出 ―New‖对话框。 在 ―Device Design Files‖页面下双击 ―VHDL File‖选项(或选中该项后单击 ―OK‖按钮)后建立新文件。 理工大学学士学位论文 7 ( 2) 输入程序。 在程序编辑区内编写程序。 ( 3) 保存文件。 单击保存文件按钮,弹出对话框将输入的
select LCD_RS = 39。 039。 when function_set|entry_set|set_display|clr_display|set_addr, 39。 139。 when others。 what byte to transmit to lcd refer to datasheet for an explanation of these values with
库 Max+plusⅡ有着丰富的数据库单元提供给设计者调用,其中包括多种最新的参数化的兆功能( MageFunction)和很多特殊逻辑功能( MacroFunction)以及 74系列所需全部器件。 ( 6)和结构无关 Max+plusⅡ系统的 Complier 支持 Altera 公司的 MAX9000、 FLEX6000、 FLEX8000、Classic、 MAX5000、
)。 除了其它硬件描述语言此套 VHDL, 这在一定程度上定义了一个专案方式的行为工具使用它们。 模拟和合成是使用 VHDL 语言两种主要的工具。 这种语言参考手册没有定义模拟器,但明确定义了每个模拟器必须使用每一部分的语言。 VHDL 并不限制用户使用一种描述方式。 VHDL 允许使用任何方式去描述设计 自顶向下 ,自底向上或中间空出。 VHDL 可以用来描述硬件在门级或更抽象的方式。
或称典范 ( paradigm)。 C++提供了 class、 namespace 和访问控制 ,使设计决策的各异化( locality) 成为可能。 第四章 系统结构功能分析 班级信息管理系统的功能结构 班级信息管理系统的功能结构如图 6 图 学生管理系统功能结构图 学生管理系统的业务流程图 学生管理系统 基本信息管理 学生管理 查询管理 科室信息管理 科目信息管理 教师信息管理 班级科目管理
amp。 (num2 = EPSINON) ){ num_buffer = 除数不能为零。 error = true。 } else{ thism_num = num1 / num2。 }break。 default:thism_num = thisnum2。 break。 } 结果如下图所示 ③科学性运算按钮的处理: 只需根据数值分析等为按钮进行算法的合理设计,正确赋值即可,具体代码如下: