htk语音建模使用方法经验总结内容摘要:

表,这里我们采用LMTutorial文件夹下的 ,里面包含了五千个常用字 (可以将总的 MLF文件进行高级排序,选中删除重复项那个选项,在排序的结果上去掉除了字以外的信息,比如说带有 lab的行和句号 ),接下来我们利用 LGCopy过滤掉字表外的字,讲训练文本中所有字表外的字归纳到一类,这个类的标记为 !!UNK LGCopy T 1 o m lm_5k/ b 202000 d lm_5k w * o表示所有带字表外的字的文法都会被提取出来存放在 lm_5k目录下,生成data.*, 同时产生一个新的字图 ,这个字图只包含在字表中出现的字和符号 !!UNK。 接下来 生成一元文法语言学模型: LBuild T 1 n 1 lm_5k/ lm_5k/ug 生成的一元文法模型 ug存放在 lm_5k目录下 生成二元文法模型: LBuild T 1 c 2 1 –n 2 l lm_5k/ug lm_5k/ lm_5k/bg1 * lm_5k/data.* c 2 1表示舍弃出现不超 过一次的二元文法, n 2表示生成二元文法语言学模型, l lm_5k/ug表示更新已经存在的 ug来产生新的模型。 生成三元文法模型: LBuild T 1 c 3 1 n 3 l lm_5k/bg1 lm_5k/ lm_5k/tg1_1 * lm_5k/data.* c 3 1表示舍弃出现不超过一次的三元文法。 也可以不通过一元二元文法模型直接生成三元文法: LBuild T 1 c 2 1 c 3 1 n 3 lm_5k/ lm_5k/tg21_1 * lm_5k/data.* 讲二元文法语言模型转换成 lattice形式。 HBuild n bg1 s s /s n bg1表示输入语言学模型 bg1, s s /s表示设定起始点和终点分别为 s /s,设置这个之后在后续的处理中需要修改相应的字典, 表, lattice形式的语言学模型, 这个可以直接被 HVite所用。 类 的语言学模型训练 首先建立一个 classes map,用来指定哪个字在哪个类,同时需要定义类的数量,类的数量定义的越多,分类越细,计算时间也越长,利用 Cluster来完成这一步聚类 Cluster T 1 c 150 i 1 k o * lm_5k/data.* c 150表示定义 150个不同的类; i 1表示进行一次迭代计算,实验表明迭代多 次并不能讲识别率提高多少,花费时间也比较多; k表示将字表外的字归纳在一个类; o ,并将其保存在,这条命令会在 ,其中用来训练模型的文件为 ,这个文件称为 class map,列出了分类的详细情况。 、 接下来利用 LGCopy生成 classes ngram,这个与前面所生成的文法文件不同的是原来的文法文件包含的是字的序列, classes ngram则是讲字替换成其所在的类的名称: LGCopy T 1 d m lm_5k/ * lm_5k/data.* d , m 图,这个字图包含了每个类的名字,在这里称其为字图的原因是它的用法跟前面的字图是一样的,生成的 classes ngram保存在 , 文件名 为 data.*。 基于类的语言学模型共有两个成分组成,一个是 classes ngram的模型形式,一个是 wordgivenclass,这个文件 可以给出 分类之后 某个 字 出现 的 次数 除以字所在的类的 出现次 数的 概率值,也可以只给出出现的次数。 首先生成 classes ngram的模型形式: LBuild T 1 c 2 1 c 3 1 n 3 * 生成的文件保存在 lm_5k目录下,文件名为。 然后生成 wordgivenclass: Cluster l lm_5k/ * lm_5k/data.* q表示给出出现的次数,如果用 p,则给出概率,生成的文件 保存在 lm_5k目录下,文件名为。 可以通过 LLink讲两个文件连接起来: LLink lm_5k/ lm_5k/ lm_5k/cl150tg_1_1 生成的文件保存在 lm_5k目录下,文件名为 cl150tg_1_1。 也可以生成一个总的模型: LLink s lm_5k/ lm_5k/ lm_5k/ 生成的文件保存在 lm_5k目录下,文件名为。 这个文件不能直接被 Hvite所用,但是能直接被 HDecode所用。 四 补充 HLRescore可以利用三元文法语言学模型 将 HVite生成的 二元文法的 lattice重新判分,对 lattice中语言学模型的得分进行更新,声学模型的分值不变,同时搜索出一条最优路径。 HLRescore C S f i n tg_lm L lat_bg。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。