江苏省“青蓝工程”基金(QL003YZ)
- 作品数:15 被引量:62H指数:4
- 相关作者:杨震郑宝玉张玲华简志华贾艳阳更多>>
- 相关机构:南京邮电大学南京邮电学院更多>>
- 发文基金:江苏省“青蓝工程”基金国家高技术研究发展计划更多>>
- 相关领域:电子电信更多>>
- 基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用被引量:4
- 2006年
- 通过对纯净语音及含噪语音短时谱的分析比较,提出了一种基于基音频率及其谐波结构的新的语音特征参数。实验表明,与传统的倒谱特征相比,新特征对加性白噪声相对较不敏感,在闭集文本无关说话人识别中,新特征可以在加性白高斯噪声环境下提高系统的说话人识别率。
- 张玲华郑宝玉杨震
- 关键词:说话人识别基音频率
- 一种新的具有噪声鲁棒性的说话人语音特征及其应用
- 本文通过对基音频率统计特性的分析,提出了一种新的具有噪声鲁棒性的有效特征参数提取方法。实验表明,新特征对加性白噪声不敏感,但对说话人识别应用来说性能不太理想,包括在无噪声情况下。为充分利用新特征对噪声不敏感以及MFCC时...
- 张玲华郑宝玉杨震
- 关键词:说话人辨认基音频率
- 文献传递
- 基于LPC分析的语音特征参数研究及其在说话人识别中的应用被引量:18
- 2005年
- 对LPC(线性预测系数)参数及其派生参数进行了研究,重点讨论了各参数的计算方法,在此基础上提出了一种由LPC参数和语音帧能量构成的组合参数。利用GMM对20个说话人进行了闭集文本无关说话人识别实验。结果表明,与LPC参数的派生参数相比,该组合参数可以以较少的运算量取得与LPC派生参数相当的识别效果;与直接使用LPC参数相比,该组合参数能够在运算量增加不明显的情况下改进系统的性能,特别是在测试音长度较短的情况下,对性能的改进尤为明显。
- 张玲华郑宝玉杨震
- 关键词:说话人识别特征参数运算复杂度
- 语声转换技术发展及展望被引量:4
- 2007年
- 语声转换通过改变语音信号的声学特征参数来调整语音的个性特征,从而使得转换后的源说话人语音听起来就像是目标说话人的声音一样。系统地介绍了当前语声转换技术的发展状况,在描述语声转换技术的应用场景和系统框架的基础上,着重阐述了系统的转换模块,即声道特性的转换和韵律转换,特别是重点介绍了声道特性的转换算法。简要地介绍了系统性能的测试方法,最后对全文进行了总结,并针对当前语声转换技术还存在的一些问题,对未来的发展进行了展望。
- 简志华杨震
- 关键词:语音处理
- 语音信息隐藏技术及应用被引量:7
- 2004年
- 对语音中信息隐藏的研究现状进行了概述,并对常用的方法等进行了比较和分析,最后探讨了其广阔的应用前景和研究中的一些难点。
- 贾艳阳杨震
- 关键词:信息隐藏数字水印语音保密通信
- 一种修正的倒谱公式及其在说话人识别中的应用
- 本文介绍了倒谱参数的特点,讨论了倒谱参数在基于隐马尔可夫模型(HMM)的说话人识别系统中的应用。推导了计算LPC倒谱的递推公式,并根据实验结果对该公式进行了修正,给出了实验公式。实验数据表明,修改后的倒谱公式用于与文本无...
- 张玲华杨震郑宝玉
- 关键词:特征参数说话人识别
- 文献传递
- 基于混合线性变换的语声转换算法被引量:3
- 2007年
- 针对在没有对称语音库的情况下,该文提出了一种基于混合线性变换的语声转换算法,在最大似然估计准则下,使用EM迭代算法计算变换函数的参量。为了减小线性加权对语音谱包络的平滑作用,使用线性调频Z变换来调节语音信号的LPC系数。客观评测和主观感受的实验结果都表明,基于混合线性变换的语声转换算法也可以取得与传统语声转换技术相当的转换效果,解除了传统语声转换技术需要对称语音库的要求。
- 简志华杨震
- 关键词:最大期望算法线性调频Z变换
- 基于HMM的说话人辨认系统及其改进被引量:5
- 2003年
- 对基于隐马尔可夫模型(HMM)的说话人辨认系统进行了讨论,完成了系统设计。对系统中矢量量化这一关键性环节进行了改进,提出了一种新的基于遗传算法的码本生成方法。测试结果表明,改进后的系统具有较高的正确识别率,特别是在与文本无关的情况下。
- 张玲华杨震郑宝玉
- 关键词:HMM隐马尔可夫模型说话人识别语音信号处理矢量量化
- 改进的GMM模型语声转换系统被引量:2
- 2007年
- 传统的基于GMM模型线性语音转换系统在语音转换阶段,由于转换函数的概率加权组合使合成语音共振峰带宽变宽,谱包络过于平滑。文中提出依据后验概率大小和前后语音的相关性,选择部分转换分量函数进行语音转换。实验表明不仅简化了语音转换,而且经过转换的语音质量也有一定的提高,对语音的实时转换有重要的意义。
- 申毅简志华杨震
- 关键词:语音处理高斯混合模型
- 基于倒谱加权的说话人识别技术被引量:2
- 2006年
- 提出一种通过加不同权值来考察语音各阶参数的抗噪性强弱的方法,采用此方法分析了对干净语音和加白噪声语音的Mel倒谱各阶参数加不同权值后对识别系统性能的影响。得出结论:高阶Mel倒谱参数抗噪性较差而低阶倒谱参数抗噪性较好。因此可以根据抗噪性的强弱对该倒谱各阶参数进行合理加权,以便突出抗噪性强的参数对说话人识别系统的贡献。
- 孙林慧李平安
- 关键词:权值抗噪性说话人识别