公共文化服务平台

2024年11月6日星期三

|

欢迎来到营口市图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

国家自然科学基金(61075008): 作品数：28 被引量：62H指数：5; 相关作者：于凤芹杨松何艳韩德亮屠彬彬更多>>; 相关机构：江南大学更多>>; 发文基金：国家自然科学基金更多>>; 相关领域：电子电信自动化与计算机技术语言文字更多>>

相关作品
相关人物
相关机构
相关资助
相关领域

文献类型

28篇中文期刊文章

领域

24篇电子电信
6篇自动化与计算...
1篇语言文字

主题

9篇语音
7篇倒谱
7篇倒谱系数
7篇谱系数
6篇汉语
5篇MEL频率倒...
5篇MFCC
4篇信号
4篇支持向量
4篇支持向量机
4篇时频
4篇向量
4篇向量机
3篇原子
3篇说话人识别
3篇小波
3篇傅里叶
3篇傅里叶变换
2篇短时傅里叶变...
2篇信号分离

机构

28篇江南大学

作者

28篇于凤芹
3篇何艳
3篇韩德亮
3篇杨松
2篇屠彬彬
2篇高文曦
2篇董帅飞
2篇金银燕
2篇庄严
2篇杜晓青
1篇孙艳
1篇李亚文
1篇刘俊良
1篇王玉静
1篇王斌斌
1篇郭伟

传媒

15篇计算机工程与...
5篇计算机工程
5篇计算机系统应...
2篇计算机工程与...
1篇计算机应用与...

年份

3篇2015
7篇2014
3篇2013
14篇2012
1篇2011

共 28 条记录，以下是 1-10

全选清除导出

排序方式：

基于Chirp原子改进的声母时频特征提取研究: 2013年; 对比了传统时频方法对汉语声母的分析精度,针对其中所存在的各种缺陷,提出首先利用Chirp原子对声母进行匹配追逐分解,然后利用原子魏格纳威利分布重构方法对声母进行时频特征提取。仿真实验结果表明,该方法与短时傅里叶变换相比具有较高的时频聚集性;与直接魏格纳威利分布相比无交叉项干扰,且降低了时频表示数据量;与Gabor原子分解相比,使用原子数量更少,重构精度更高,证实了该方法的有效性。; 董帅飞于凤芹; 关键词：汉语声母短时傅里叶变换

对MFCC进行GMM聚类的汉语数字识别方法被引量：1: 2011年; 汉语数字识别常用MFCC作为特征,针对0-9十个数字MFCC样本特征数据量大的问题,提出了用GMM模型对提取的特征参数MFCC的数据进行聚类来减少数据量,以GMM模型参数中的均值作为新的特征,采用动态规划算法进行汉语数字语音识别。仿真实验表明,进行GMM特征变换后的新特征数据为MFCC的30.9%,系统运行时间减少了237.18s,识别率降低1.11%。; 高文曦于凤芹; 关键词：MFCC

基于PCA和LDA的方言辨识: 2012年; 针对PCA没有有效利用样本的类别信息而导致方言识别率低的问题,采用PCA和LDA组合方法进行特征提取。首先用PCA对普通话、上海话、广东话和闽南话四种方言进行降维,然后在降维后的空间中用LDA进一步特征提取,最后将该特征向量送入BP神经网络进行辨识。仿真实验结果表明,基于PCA和LDA的方言识别的平均识别率高达85%。; 何艳于凤芹; 关键词：方言辨识主成分分析线性鉴别分析 BP神经网络

基于发声机理与人耳感知特性的说话人识别被引量：3: 2013年; Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱-感知线性预测倒谱系数(RASTA-PLPCC)融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8.0%。; 杜晓青于凤芹; 关键词：说话人识别 RELATIVE

基于样本熵的语音/音乐识别被引量：4: 2012年; 传统的MFCC及短时能量特征只反映了信号序列的静态特征,目前基于这些特征的语音/音乐识别率为79%～86%。样本熵可以反映信号序列中的新信息量的大小以及新信息量的变化程度。以样本熵作为特征对语音/音乐进行分类识别,提取混合信号的样本熵,计算每段信号样本熵的均值和方差,采用k均值聚类进行识别。仿真实验结果表明,基于样本熵的语音/音乐识别的识别率可提高到88.073%。; 杨松于凤芹; 关键词：K均值聚类

基于Chirp原子MP分解的汉语声母时频结构分析被引量：1: 2014年; 针对汉语声母语音呈现的非平稳特性,提出一种基于Chirp原子MP分解的汉语声母时频结构分析方法。实验仿真结果表明,该方法与直接WVD相比,无交叉项干扰,与Gabor原子分解相比,在重构声母信号90%能量情况下,不仅更加准确地提取了声母的时频特征参数,且采用原子个数和耗费时间分别为Gabor原子分解的30.77%和24.53%,证实了该方法的优越性。; 董帅飞于凤芹; 关键词：汉语声母 MATCHING

基于局部线性嵌入算法的汉语数字语音识别被引量：1: 2012年; 语音信号转换到频域后维数较高,流行学习方法可以自主发现高维数据中潜在低维结构的规律性,提出采用流形学习的方法对高维数据降维来进行汉语数字语音识别。采用流形学习中的局部线性嵌入算法提取语音频域上高维数据的低维流形结构特征,再将低维数据输入动态时间规整识别器进行识别。仿真实验结果表明,采用局部线性嵌入算法的汉语数字语音识别相较于常用声学特征MFCC维数要少,识别率提高了1.2%,有效提高了识别速度。; 高文曦于凤芹; 关键词：流形学习局部线性嵌入算法动态时间规整

基于改进循环观测的线性预测语音压缩感知: 2014年; 利用语音信号线性预测残差的稀疏性特点可对语音信号进行压缩感知,但需要信号的线性预测系数来构造稀疏变换矩阵,从而增加预测系数传输的数据量。为此,提出将线性预测系数存入对角阵向量中构造循环矩阵,由此得到循环观测矩阵,再对语音信号进行观测。提取该循环矩阵中的线性预测系数构造残差域稀疏变换矩阵,利用正交匹配追踪算法对观测信号进行重构。仿真实验结果表明,与传统线性预测方法相比,该方法减少了3.9%以上的数据量,且比将高斯随机矩阵作为观测矩阵的方法具有更高的帧平均重构信噪比。; 徐皓波于凤芹; 关键词：压缩感知正交匹配追踪

基于负熵最大化改进的语音音乐信号分离被引量：3: 2015年; 负熵是一种重要的非高斯性度量方法,最大化负熵使随机变量的非高斯性达到最大,从而使输出的各分量之间相互独立。负熵最大化算法以负熵作为目标函数,牛顿迭代法作为优化算法,针对牛顿迭代法中对初始值选择敏感的问题,用牛顿下山法代替牛顿迭代法,通过改变下山因子,使目标函数呈下降趋势,降低算法对初始值的依赖性。实验结果表明,改进后的算法在不同初始值下均能较好地分离语音音乐混合信号,改善了初值敏感问题。; 郭伟于凤芹

小波匹配追踪的语音信号时频建模被引量：1: 2012年; 小波多分辨率的正弦模型对正弦成分含量较低的语音信号不能较好建模,提出小波匹配追踪的瞬时建模方法。建立小波原子词典,利用多样性变异算子匹配追踪寻找最佳匹配小波,最后将语音信号表示成一系列匹配最佳小波的累加。仿真实验针对正弦成分含量较低的语音信号对两种模型作比较,结果显示提出模型的信号重构残差值较小波变换的正弦模型有明显降低。; 孙艳于凤芹金银燕

全选清除导出

共3页<1 2 3>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@营口市图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张