杨鉴
- 作品数:121 被引量:169H指数:7
- 供职机构:云南大学信息学院更多>>
- 发文基金:国家自然科学基金云南省自然科学基金云南省应用基础研究基金更多>>
- 相关领域:电子电信自动化与计算机技术文化科学语言文字更多>>
- 一种新的基于分段排序裁剪的分层构筑DTW识别算法
- 分层构筑DTW识别算法是连接词识别的一种有效算法。本文提出一种分段排序裁剪的新方法, 在减少DTW算法运算量方面有显著效果,并将其用于一个连续数字的识别系统中,经测试,可以明显缩短识别时间,具有很强的实时性,有较高的识别...
- 安镇宙杨鉴王红余映
- 关键词:语音识别
- 文献传递
- 信号处理类课程探究式教学方案研究被引量:1
- 2017年
- 针对数字信号处理课程教学中理论与实践相互脱节、重理论介绍、多验证性实验、缺乏实践相关的实验,提出信号处理类课程的探究式教学方法,指出结合教师的科研实践,应用实例引导学生学习相关知识,推动以学生为主体亲历探究的研究性学习活动,促进学生解决问题和创新能力的培养。
- 周浩丁海燕杨鉴梁虹
- 关键词:探究式教学实践教学
- 基于贝叶斯网络的云南民族口音说话人识别
- 介绍了贝叶斯网络的基本知识及其在说话人识别中的应用。构造了用于说话人识别的贝叶斯网络并介绍了网络参数的估计方法。针对文本无关的说话人识别任务,在云南少数民族口音汉语普通话语音数据库上进行了识别实验。比较了贝叶斯网络参数、...
- 普园媛徐洪杨鉴徐丹
- 关键词:说话人识别贝叶斯网络
- 文献传递
- 面向语音合成的傣语文本罗马化方法
- 传统的傣语语音学主要研究语言的语音描写,本文从语言工程学的角度,并面向傣语语音合成系统开发,研究傣语文本罗马化问题。本文详细分析了西双版纳傣语语音系统,制订了傣语字母到罗马字母的转写表;根据傣文的拼写规则,制定了傣语音节...
- 胡湘兴杨鉴李诗心王昱
- 关键词:傣语音位系统语音合成
- 文献传递
- 语种辨识的多特征信息应用被引量:2
- 2010年
- 提取动态的高层语言学特征建立了改进的语种相关的、联合的GMM-LM语种辨识方案。该方案减小了不同语种的高斯混合模型和语言模型之间的相关性,也降低了训练的复杂度。还提出了基于特征提取层和判决层融合技术的语种辨识系统。该系统利用了不同类型的特征对区分不同语种的贡献来增加不同语种语料之间的差异,并使相同语种的语料之间的差异减小。实验表明,设计的语种辨识系统具有较好的扩展性;基于特征提取层和判决层的融合系统能够有效地提高系统识别率。
- 曾秀花杨鉴徐永华
- 关键词:语种识别高斯混合模型
- 基于MATLAB的“信号与系统”计算机辅助教学系统设计被引量:9
- 2001年
- 对课程“信号与系统”的计算机辅助教学进行研究 ,提出了以MATLAB为平台开发的“信号与系统”计算机辅助教学软件模型 ,并介绍了重点知识演示子系统的具体实现 .
- 梁虹杨鉴普园媛
- 关键词:矩阵实验室MATLAB计算机辅助教学《信号与系统》教学软件软件设计
- 基于多特征和多分类器融合的语种识别被引量:2
- 2010年
- 多分类器协同合作克服了单个分类器识别效果不理想,适用范围较窄或对使用环境要求较高的不足。提取多层面的特征则增加了输入样本的多样性。本文提出了一种基于SVM分类器融合的语种识别系统,该系统采用了SVM作为子分类器,参数选取包括MFCC、LPCC,基音频率和第一共振峰,采用投票法,加权平均法和决策模板法三种不同的融合方法对汉语,英语,日语,白族语和纳西语进行识别研究,达到了预期的识别效果。
- 陈瑶玲杨鉴
- 关键词:语种识别多分类器
- 基于频域多尺度分析的显著性检测被引量:2
- 2020年
- 针对现有显著性检测方法得到的显著区域不完整以及缺乏生物学依据的不足,提出一种基于频域多尺度分析的图像显著性检测方法.首先利用小波变换将输入图像的离散余弦变换(DCT)系数的幅度谱进行多尺度分解,计算得到多尺度下的空间域视觉显著图,然后依据显著性评价函数选出较优显著图,最后以自适应权重合成输入场景的视觉显著图.对不同类型数据集进行实验,包括心理物理学模板数据集、人眼注视轨迹数据集及显著目标分割数据集(包括ASD和ECSSD数据集),该方法对于多类型数据集在P-R曲线、ROC曲线及AUC指标等客观评价标准上均取得较高精确度,且在计算速度统计中计算较快,表明该方法优于其他经典的显著性检测方法.
- 吴青龙余映杨鉴邵凯旋康迂星
- 关键词:视觉注意显著性检测离散余弦变换小波变换
- 基于音频信号的检索定位自适应方法
- 2007年
- 音频信息的检索是多媒体检索技术中的一个重要方面。本文讨论一种基于音频信号的广告条目检索和定位的一种自适应方法,它利用短时平均过零率和互相关函数从实时音频数据流中快速检测和定位广告条目.
- 刘磊杨鉴宋晓玲
- 关键词:互相关函数
- 基于BERT预训练语言模型的印尼语语音合成被引量:2
- 2021年
- 基于深度神经网络并利用大规模高质量“〈文本,音频〉”语料库训练的端到端语音合成系统已能够合成出高质量的语音,因受限于语料库规模,低资源非通用语言端到端语音合成系统性能仍有待提升.近年来,自然语言处理领域实现了利用海量无标记文本数据以弱监督方式训练语言模型,BERT等预训练的语言模型被证明显著改进了许多自然语言处理任务.论文基于预训练语言模型探索提升印尼语端到端语音合成系统性能的方法,首先利用上下文信息拼接和词向量拼接方法将BERT预训练词向量信息嵌入语音合成系统,然后在此基础上进一步研究编码器结构对语音合成性能的影响,最后从主观和客观两方面对文中阐述的各种方法所合成的语音进行测评.实验结果表明,新方法与基线语音合成系统相比,客观评测结果显示系统性能提升近15%,有效降低了合成语音的梅尔倒谱失真和基频帧错误率,主观评价平均意见得分达到4.15,远高于基线系统的3.72.
- 赵立铉杨鉴
- 关键词:印尼语语音合成端到端