htk语音建模使用方法经验总结内容摘要:
表,这里我们采用LMTutorial文件夹下的 ,里面包含了五千个常用字 (可以将总的 MLF文件进行高级排序,选中删除重复项那个选项,在排序的结果上去掉除了字以外的信息,比如说带有 lab的行和句号 ),接下来我们利用 LGCopy过滤掉字表外的字,讲训练文本中所有字表外的字归纳到一类,这个类的标记为 !!UNK LGCopy T 1 o m lm_5k/ b 202000 d lm_5k w * o表示所有带字表外的字的文法都会被提取出来存放在 lm_5k目录下,生成data.*, 同时产生一个新的字图 ,这个字图只包含在字表中出现的字和符号 !!UNK。 接下来 生成一元文法语言学模型: LBuild T 1 n 1 lm_5k/ lm_5k/ug 生成的一元文法模型 ug存放在 lm_5k目录下 生成二元文法模型: LBuild T 1 c 2 1 –n 2 l lm_5k/ug lm_5k/ lm_5k/bg1 * lm_5k/data.* c 2 1表示舍弃出现不超 过一次的二元文法, n 2表示生成二元文法语言学模型, l lm_5k/ug表示更新已经存在的 ug来产生新的模型。 生成三元文法模型: LBuild T 1 c 3 1 n 3 l lm_5k/bg1 lm_5k/ lm_5k/tg1_1 * lm_5k/data.* c 3 1表示舍弃出现不超过一次的三元文法。 也可以不通过一元二元文法模型直接生成三元文法: LBuild T 1 c 2 1 c 3 1 n 3 lm_5k/ lm_5k/tg21_1 * lm_5k/data.* 讲二元文法语言模型转换成 lattice形式。 HBuild n bg1 s s /s n bg1表示输入语言学模型 bg1, s s /s表示设定起始点和终点分别为 s /s,设置这个之后在后续的处理中需要修改相应的字典, 表, lattice形式的语言学模型, 这个可以直接被 HVite所用。 类 的语言学模型训练 首先建立一个 classes map,用来指定哪个字在哪个类,同时需要定义类的数量,类的数量定义的越多,分类越细,计算时间也越长,利用 Cluster来完成这一步聚类 Cluster T 1 c 150 i 1 k o * lm_5k/data.* c 150表示定义 150个不同的类; i 1表示进行一次迭代计算,实验表明迭代多 次并不能讲识别率提高多少,花费时间也比较多; k表示将字表外的字归纳在一个类; o ,并将其保存在,这条命令会在 ,其中用来训练模型的文件为 ,这个文件称为 class map,列出了分类的详细情况。 、 接下来利用 LGCopy生成 classes ngram,这个与前面所生成的文法文件不同的是原来的文法文件包含的是字的序列, classes ngram则是讲字替换成其所在的类的名称: LGCopy T 1 d m lm_5k/ * lm_5k/data.* d , m 图,这个字图包含了每个类的名字,在这里称其为字图的原因是它的用法跟前面的字图是一样的,生成的 classes ngram保存在 , 文件名 为 data.*。 基于类的语言学模型共有两个成分组成,一个是 classes ngram的模型形式,一个是 wordgivenclass,这个文件 可以给出 分类之后 某个 字 出现 的 次数 除以字所在的类的 出现次 数的 概率值,也可以只给出出现的次数。 首先生成 classes ngram的模型形式: LBuild T 1 c 2 1 c 3 1 n 3 * 生成的文件保存在 lm_5k目录下,文件名为。 然后生成 wordgivenclass: Cluster l lm_5k/ * lm_5k/data.* q表示给出出现的次数,如果用 p,则给出概率,生成的文件 保存在 lm_5k目录下,文件名为。 可以通过 LLink讲两个文件连接起来: LLink lm_5k/ lm_5k/ lm_5k/cl150tg_1_1 生成的文件保存在 lm_5k目录下,文件名为 cl150tg_1_1。 也可以生成一个总的模型: LLink s lm_5k/ lm_5k/ lm_5k/ 生成的文件保存在 lm_5k目录下,文件名为。 这个文件不能直接被 Hvite所用,但是能直接被 HDecode所用。 四 补充 HLRescore可以利用三元文法语言学模型 将 HVite生成的 二元文法的 lattice重新判分,对 lattice中语言学模型的得分进行更新,声学模型的分值不变,同时搜索出一条最优路径。 HLRescore C S f i n tg_lm L lat_bg。htk语音建模使用方法经验总结
相关推荐
督 客户总监 职位关系 可直接升迁的职位 部门经理 可相互转换的职位 销售代表 可升迁至此的职位 三、 任职资格: 所需学历及 专业 最低学历 专业 其他说明 大专以上学历 计算机 其他专业同等学历也可 所需技能培训 (方可上岗) 培训时间 培训科目 三个月 企业文化、计算机、 所需经验 一年以上相关工作经验 负责客户中心 IBM 产品的销售 一 般 能 力 项目 激励能力 计划能力 人际关系
致设备缓存中的数据丢失。 易用性、可管理性,帮助管理员轻松完成所有设置任务 支持即插即用 ,无需添加任何其它专用设备。 采用可视化管 理,在 GUI 管理界面上可以所见即所得地对磁盘、 RAID 组等进行配置操作和状态监控。 采用中文管理界面,便于操作使用。 . 存储容量 单个通道 24 小时存储 1 天的计算公式∑ (GB)=码流大小( Mbps)247。 8 3600秒 24
态。 为了清楚地介绍菜单的操作,我们在菜单目录示意图中使用以下的标记分别表示回车,向上 /向下滚动和离开: 进入菜单模式 按下 MENU按钮,液晶屏将从标准显示切换到菜单模式,从菜单可进入各子菜单条目。 在菜单中浏览各参数 使用向上 /向下按钮可选择某菜单条目,被选的菜单条目前出现一闪烁的小方块,再按下回车按钮,可打开被选菜单的子菜单。 使用向上 /向下按钮可选择所需的参数,再次按下
12/145 所以我们采集完之后到“ NandFlash”文件夹找到“ Project”文件夹,打开就可以找到采集的数据了。 关于 图 42 软件版权 在此关于界面可以查看软件的版本号, 软件版权所有,联系开发者。 如图 42 手持机信息 可以查看 手持机仪器号,注册有效期及操作系统。 如图 43 HiQ GIS 采集软件使用手册 13/145 图 43 手持机注册 在此界面输入注册码
7502高达 192G的交换容量,支持双主控和双电源设计,保证了校园网的高性能和高可靠性。 同时具有很高的性价比,是非常理想的中型校园网核心设备。 网络出口要求高转发性能和较强的安全控制策略。 AR18631 路由器是教育行业唯一一款支持千兆线速转发的路由器,转发率高达 600Mpps,带机量高达 500~1000 人。 同时支持丰富的安全特性,支持防攻击和应用过滤等功能。 充分保证校园网的安全
mSCF和 MS间进行呼叫无关的、由网络或用户发起的交互过程,该接口为标准协议接口。 MSC与 SIWF之间的接口( K接口) 当 MSC检测到无法提供要求的 IW 功能时,可以使用 SIWF 服务器上的资源。 此接口用于分配 SIWF上的资源和建立到服务器的物理连接。 MSC与 gsmSCF之间的接口( L接口) 当 MSC调用了 MPTY、 ECT 或 CD补充业务时,向