国家自然科学基金(61075008)
- 作品数:28 被引量:62H指数:5
- 相关作者:于凤芹杨松何艳韩德亮屠彬彬更多>>
- 相关机构:江南大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术语言文字更多>>
- 基于Chirp原子改进的声母时频特征提取研究
- 2013年
- 对比了传统时频方法对汉语声母的分析精度,针对其中所存在的各种缺陷,提出首先利用Chirp原子对声母进行匹配追逐分解,然后利用原子魏格纳威利分布重构方法对声母进行时频特征提取。仿真实验结果表明,该方法与短时傅里叶变换相比具有较高的时频聚集性;与直接魏格纳威利分布相比无交叉项干扰,且降低了时频表示数据量;与Gabor原子分解相比,使用原子数量更少,重构精度更高,证实了该方法的有效性。
- 董帅飞于凤芹
- 关键词:汉语声母短时傅里叶变换
- 对MFCC进行GMM聚类的汉语数字识别方法被引量:1
- 2011年
- 汉语数字识别常用MFCC作为特征,针对0-9十个数字MFCC样本特征数据量大的问题,提出了用GMM模型对提取的特征参数MFCC的数据进行聚类来减少数据量,以GMM模型参数中的均值作为新的特征,采用动态规划算法进行汉语数字语音识别。仿真实验表明,进行GMM特征变换后的新特征数据为MFCC的30.9%,系统运行时间减少了237.18s,识别率降低1.11%。
- 高文曦于凤芹
- 关键词:MFCC
- 基于PCA和LDA的方言辨识
- 2012年
- 针对PCA没有有效利用样本的类别信息而导致方言识别率低的问题,采用PCA和LDA组合方法进行特征提取。首先用PCA对普通话、上海话、广东话和闽南话四种方言进行降维,然后在降维后的空间中用LDA进一步特征提取,最后将该特征向量送入BP神经网络进行辨识。仿真实验结果表明,基于PCA和LDA的方言识别的平均识别率高达85%。
- 何艳于凤芹
- 关键词:方言辨识主成分分析线性鉴别分析BP神经网络
- 基于发声机理与人耳感知特性的说话人识别被引量:3
- 2013年
- Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱-感知线性预测倒谱系数(RASTA-PLPCC)融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8.0%。
- 杜晓青于凤芹
- 关键词:说话人识别RELATIVE
- 基于样本熵的语音/音乐识别被引量:4
- 2012年
- 传统的MFCC及短时能量特征只反映了信号序列的静态特征,目前基于这些特征的语音/音乐识别率为79%~86%。样本熵可以反映信号序列中的新信息量的大小以及新信息量的变化程度。以样本熵作为特征对语音/音乐进行分类识别,提取混合信号的样本熵,计算每段信号样本熵的均值和方差,采用k均值聚类进行识别。仿真实验结果表明,基于样本熵的语音/音乐识别的识别率可提高到88.073%。
- 杨松于凤芹
- 关键词:K均值聚类
- 基于Chirp原子MP分解的汉语声母时频结构分析被引量:1
- 2014年
- 针对汉语声母语音呈现的非平稳特性,提出一种基于Chirp原子MP分解的汉语声母时频结构分析方法。实验仿真结果表明,该方法与直接WVD相比,无交叉项干扰,与Gabor原子分解相比,在重构声母信号90%能量情况下,不仅更加准确地提取了声母的时频特征参数,且采用原子个数和耗费时间分别为Gabor原子分解的30.77%和24.53%,证实了该方法的优越性。
- 董帅飞于凤芹
- 关键词:汉语声母MATCHING
- 基于局部线性嵌入算法的汉语数字语音识别被引量:1
- 2012年
- 语音信号转换到频域后维数较高,流行学习方法可以自主发现高维数据中潜在低维结构的规律性,提出采用流形学习的方法对高维数据降维来进行汉语数字语音识别。采用流形学习中的局部线性嵌入算法提取语音频域上高维数据的低维流形结构特征,再将低维数据输入动态时间规整识别器进行识别。仿真实验结果表明,采用局部线性嵌入算法的汉语数字语音识别相较于常用声学特征MFCC维数要少,识别率提高了1.2%,有效提高了识别速度。
- 高文曦于凤芹
- 关键词:流形学习局部线性嵌入算法动态时间规整
- 基于改进循环观测的线性预测语音压缩感知
- 2014年
- 利用语音信号线性预测残差的稀疏性特点可对语音信号进行压缩感知,但需要信号的线性预测系数来构造稀疏变换矩阵,从而增加预测系数传输的数据量。为此,提出将线性预测系数存入对角阵向量中构造循环矩阵,由此得到循环观测矩阵,再对语音信号进行观测。提取该循环矩阵中的线性预测系数构造残差域稀疏变换矩阵,利用正交匹配追踪算法对观测信号进行重构。仿真实验结果表明,与传统线性预测方法相比,该方法减少了3.9%以上的数据量,且比将高斯随机矩阵作为观测矩阵的方法具有更高的帧平均重构信噪比。
- 徐皓波于凤芹
- 关键词:压缩感知正交匹配追踪
- 基于负熵最大化改进的语音音乐信号分离被引量:3
- 2015年
- 负熵是一种重要的非高斯性度量方法,最大化负熵使随机变量的非高斯性达到最大,从而使输出的各分量之间相互独立。负熵最大化算法以负熵作为目标函数,牛顿迭代法作为优化算法,针对牛顿迭代法中对初始值选择敏感的问题,用牛顿下山法代替牛顿迭代法,通过改变下山因子,使目标函数呈下降趋势,降低算法对初始值的依赖性。实验结果表明,改进后的算法在不同初始值下均能较好地分离语音音乐混合信号,改善了初值敏感问题。
- 郭伟于凤芹
- 小波匹配追踪的语音信号时频建模被引量:1
- 2012年
- 小波多分辨率的正弦模型对正弦成分含量较低的语音信号不能较好建模,提出小波匹配追踪的瞬时建模方法。建立小波原子词典,利用多样性变异算子匹配追踪寻找最佳匹配小波,最后将语音信号表示成一系列匹配最佳小波的累加。仿真实验针对正弦成分含量较低的语音信号对两种模型作比较,结果显示提出模型的信号重构残差值较小波变换的正弦模型有明显降低。
- 孙艳于凤芹金银燕