您的位置: 专家智库 > >

万玉龙

作品数:7 被引量:4H指数:1
供职机构:中国科学院声学研究所更多>>
发文基金:中国科学院战略性先导科技专项国家自然科学基金国家高技术研究发展计划更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 3篇会议论文

领域

  • 6篇电子电信
  • 1篇自动化与计算...

主题

  • 3篇音乐
  • 3篇语种
  • 3篇识别方法
  • 2篇低能
  • 2篇音符
  • 2篇音素
  • 2篇语音
  • 2篇语音分段
  • 2篇语支
  • 2篇侦测
  • 2篇矩阵
  • 2篇矩阵分解
  • 2篇非负矩阵
  • 2篇非负矩阵分解
  • 2篇钢琴
  • 1篇性能评价
  • 1篇语种识别
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇谱包络

机构

  • 7篇中国科学院
  • 1篇国家互联网应...

作者

  • 7篇周若华
  • 7篇颜永红
  • 7篇万玉龙
  • 5篇王宪亮
  • 2篇杨琳
  • 1篇包秀国
  • 1篇袁庆升
  • 1篇张健

传媒

  • 3篇网络新媒体技...
  • 2篇中国科学院声...
  • 1篇清华大学学报...

年份

  • 1篇2015
  • 4篇2014
  • 2篇2013
7 条 记 录,以下是 1-7
排序方式:
快速准确的自动音乐/语音分段方法被引量:2
2013年
自动音乐/语音分段是语音识别技术的重要部分。该文采用回声器时频分析计算平均能量谱及定长片段的优化短时低能量比,用Bayes分类器判定类型,并根据内容连续性对分段结果修正;最后采用振幅包络匹配滤波器求所有起始点,对分段结果进一步优化。实验基于多语种电视电台录音和国内电话录音数据展开,结果显示该方法的性能FMeasure可达0.987,较已有分类系统性能有大幅提升,同时处理速度也有大幅度改进。
万玉龙周若华颜永红
关键词:音乐语音分段
基于非负矩阵分解的钢琴多音符估计被引量:1
2014年
提出了一种基于能量谱包络非负矩阵分解的钢琴多音符估计算法。首先对钢琴88个单音片段进行RTFI时频分析,求得对应平均能量谱,经过时序平均、归一化求得平均能量谱包络,拼接成钢琴的单音能量谱包络基矩阵。之后对测试的多音片段,采用同样处理方法求得多音平均能量谱包络,通过非负矩阵分解求得各音符的权重系数,最后通过阈值限定求得多音符估计结果。性能评估实验基于MAPS数据集的UCHO集和RAND集展开,与MIREX中最好的钢琴音乐自动记谱系统相比,本文提出的钢琴多音符估计算法性能有很大幅度的提升。
万玉龙王宪亮周若华颜永红
关键词:钢琴音乐非负矩阵分解
基于语支鉴别性的音素相关语种识别方法被引量:1
2014年
提出一种音素相关特征,并将语言学中语支的思想引入语种识别。结合音素相关特征和因子分析方法,提出音素层语支变化量(PLBV)方法。通过对音素后验概率进行降维和均值方差规整,得到音素相关特征。使用因子分析技术将各语支变化量空间的低维变化量因子进行拼接得到音素层语支变化量因子,然后在语支内部和语支间分别对语支变化量因子进行支持向量机(SVM)建模。实验基于俄语音子识别器,在美国国家标准技术署(NIST)2011年语种识别评测(LRE)30s数据集上的实验表明,提出的方法与传统的ivector系统相比,在EER、minDCF和NIST2011年LRE评价指标上相对提升29.9%-54.6%。
王宪亮万玉龙杨琳周若华颜永红
基于谱包络非负矩阵分解的钢琴多音符估计算法
提出了一种基于能量谱包络非负矩阵分解的钢琴多音符估计算法.首先对钢琴88个单音片段进行RTFI时频分析,求得对应平均能量谱,经过时序平均、归一化求得平均能量谱包络,拼接成钢琴的单音能量谱包络基矩阵.之后对测试的多音片段,...
万玉龙王宪亮周若华颜永红
关键词:性能评价
文献传递
一种快速准确的自动音乐/语音分段方法
本文提出了一种快速准确的音乐/语音分段方法。该方法采用回声器时频分析计算平均能量谱,计算定长片段的优化短时低能量比,用贝叶斯分类器进行类型判定,并根据内容连续性进行修正,最后采用振幅包络匹配滤波器求所有起始点位置,对分段...
万玉龙周若华颜永红
文献传递
基于语支鉴别性的音素相关语种识别方法
本文提出一种音素相关特征,并将语言学中语支的思想引入语种识别.结合音素相关特征和因子分析方法,提出音素层语支变化量(PLBV)方法.通过对音素后验概率进行降维和均值方差规整,得到音素相关特征.使用因子分析技术将各语支变化...
王宪亮万玉龙杨琳周若华颜永红
关键词:语种识别
文献传递
基于SVM一对多得分规整的语种识别方法
2015年
提出一种支持向量机(SVM)一对多得分规整的语种识别方法。通过对SVM得分进行规整,提高了各语种得分间的区分性,同时对分类效果较差的SVM分类器更鲁棒。仿真实验基于音素层特征的并行音素识别器后接向量空间模型(PPRVSM)的语种识别系统上进行,在美国国家标准技术署(NIST)2011年语种识别评测(LRE)30s数据集上的实验表明,提出的规整方法在语种识别性能评价指标EER和min DCF上相对提升2.6%-10.9%。
王宪亮袁庆升包秀国张健万玉龙周若华颜永红
关键词:支持向量机
共1页<1>
聚类工具0