博士科研启动基金(BS090143)
- 作品数:8 被引量:5H指数:1
- 相关作者:黄浩李兵虎王建明秦春香哈力旦·阿不都热依木更多>>
- 相关机构:新疆大学更多>>
- 发文基金:博士科研启动基金国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 发音错误检错中声学模型训练准则的比较研究
- 2013年
- 在发音错误检错系统中,将传统语音识别系统中的最大似然估计准则和最小音素错误准则应用于声学模型训练通常不能获得F1值指标意义下的最佳性能.本文在对最大似然准则以及最小音素错误准则参数更新公式进行分析的基础上,提出了最大化F1值函数的区分性训练准则,并利用构造弱意义辅助函数的方法对声学模型参数进行优化.通过比较,发现最大化F1值函数的区分性训练准则能够有效地增大训练和测试数据检错的F1值,同时训练数据和测试数据上的精确度、召回率都有明显改进.
- 王建明黄浩王羡慧
- 关键词:最大似然估计辅助函数
- 多分类器区分性组合在二次解码中的应用
- 2011年
- 提出利用基于隐马尔可夫模型的谱特征模型、基于高斯混合模型的声调分类器以及基于多层感知器的音素分类器模型的组合来提高语音识别中二次解码中的识别率。在模型组合中,使用上下文相关的模型权重加权模型得分,并使用区分性训练来优化上下文相关权重来进一步改进识别结果。对人工选取各种上下文相关权重集合进行了性能评估,连续语音识别实验表明,使用局部分类器进行二次解码能够明显降低系统误识率。在模型组合中,使用当前音节类型及左上下文相结合的模型权重集合能够最大程度降低系统误识率。实验表明该方法得到的识别结果优于基于谱特征与基频特征和音素后验概率特征合并得到特征组合的识别系统。
- 黄浩李兵虎
- 关键词:语音识别多层感知器
- 汉语语音识别声调模型集成中基于决策树的上下文相关权重参数聚类方法
- 2011年
- 声调集成是汉语语音识别的一个重要任务.在语音识别的二次解码过程中,使用区分性训练的权重因子进行声调模型集成已被证明是一个有效的方法,而且使用上下文相关的得分加权进行模型组合也得到了应用.上下文相关模型组合方法的一个不足是将会带来大量的训练参数,从而导致权重训练受到过拟合的影响.针对该问题,提出利用声学决策树对上下文相关权重参数进行参数聚类,决策树节点问题集根据最小化训练数据的期望误识率进行选择.提出问题集剪枝来加快决策树的构建速度.汉语连续语音识别实验表明与人工选择上下文相关权重参数相比,该方法能够在大大减少参数数量的条件下明显降低误识率.
- 黄浩李兵虎吾守尔.斯拉木
- 关键词:决策树汉语语音识别上下文相关
- 基于音位学特征的维吾尔语声学建模被引量:1
- 2012年
- 本文将表征维吾尔语语音特点的音位学特征引入维吾尔语语音识别声学建模中,并根据维吾尔语发音特点确定了区别于维吾尔语元音、辅音的六类音位学特征,以其为目标值训练神经网络多层感知器获取语音信号在各类音位学特征集的后验概率,并将此作为隐马尔克夫模型的输入特征进行模型训练,并与基于MFCC的声学模型进行比较.本文实验报告了组合特征下的识别结果及其改进方法.
- 秦春香黄浩哈力旦·阿不都热依木
- 关键词:多层感知器语音识别
- 新疆非母语汉语语音识别中的字典自适应技术
- 2011年
- 将标准普通话语音数据训练得到的声学模型应用于新疆维吾尔族说话人非母语汉语语音识别时,由于说话人的普通话发音存在较大偏误,将导致识别率急剧下降。针对这一问题,将多发音字典技术应用于新疆维吾尔族说话人汉语语音识别中,通过统计分析识别器的识别错误,建立音素混淆矩阵,获取音素的发音候选项。利用剪枝策略对发音候选项进行剪枝整合,扩展出符合维吾尔族说话人汉语发音规律的替代字典。对三种剪枝方法产生的发音字典的识别结果进行了对比。实验结果表明,使用相对最大剪枝策略产生的发音字典可以显著提高系统识别率。
- 李兵虎黄浩
- 关键词:剪枝策略
- 发音特征在维汉语音识别中的应用
- 2012年
- 采用传统谱特征作为输入进行语音识别通常会受到声学环境差异的影响。为此,提出汉语和维语音素和音位的对应规则,并将这种规则应用于基于发音特征的语音识别系统。训练神经网络多层感知器,获取语音信号各类发音特征的后验概率,将其与美尔频率倒谱系数(MFCC)拼接后送入隐马尔科夫模型进行声学模型训练。将不同发音特征分别与传统MFCC特征进行组合并给出测试结果。实验结果表明,当汉语声带状况和送气发音特征与传统MFCC组合时,以及维语的发音方式和声带状况特征与MFCC组合之后,系统误识率较低。
- 秦春香黄浩
- 关键词:多层感知器声学模型美尔频率倒谱系数
- 区分性模型组合中基于决策树的声学上下文建模方法被引量:1
- 2012年
- 上下文相关的区分性模型组合的局限在于引入大的模型权重参数集,在数据有限时容易导致区分性权重训练过拟合.针对该问题,本文提出利用决策树进行上下文建模,采用最小音子错误准则构建决策树以获得最优上下文相关权重参数集.决策树构造过程中通过评估目标函数的一阶近似增量来加速最优问题集的选择,并利用精细问题集来获得更好的声学区分能力.基于多模型组合的语音识别实验表明,该方法能够增强权重训练对过拟合的鲁棒性,在大幅减小参数数量的情况下降低误识率,并优于在特征空间进行组合的方法.
- 黄浩李兵虎吾守尔.斯拉木
- 关键词:上下文建模语音识别
- 自动发音错误检测中基于F_1值最大化的声学模型训练方法被引量:3
- 2013年
- 为了提高计算机辅助语言学习中自动发音错误检测系统的性能,提出一种声学模型的区分性训练方法。该方法将经过正确度标注的非母语语音数据库上的发音错误检测的F_1值的最大化作为模型参数的训练准则。采用Sigmoid函数对F_1值函数进行平滑构造目标函数,并利用构造弱意义辅助函数的方法以及扩展Baum-Welch形式的参数更新公式进行优化。提出在模型参数更新与音素门限同时优化的策略保证目标函数增长的单调性。发音错误检测实验表明该方法能够有效地增大训练和测试数据检错的F_1值。同时训练数据和测试数据上的精确度、召回率以及检测正确度都有明显改进。
- 黄浩王建明哈力旦.阿布都热依木吾守尔.斯拉木
- 关键词:声学模型最大化发音SIGMOID函数模型参数目标函数