戴礼荣
- 作品数:205 被引量:566H指数:12
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划安徽省自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术语言文字机械工程更多>>
- 一种应用于SVM说话者确认系统的新型序列核
- 本文提出了一种应用于SVM说话者确认系统的新型序列核,主要思想是首先通过高斯混合模型训练出每个说话人模型超向量作为支持向量机(Support Vector Machine,SVM)的输入样本,然后根据高斯混合模型之间的K...
- 龙艳花郭武戴礼荣
- 关键词:SVM
- 文献传递
- 远程图像和语音自动传输监控系统
- 本发明涉及一种远程图像和语音自动传输监控系统,该系统由装在监控中心的一套(或两套)控制中心装置和分别安装在不同远端监控站点的多个远端图像和语音处理装置构成,且控制中心装置和远端图像/语音处理装置分别与电话交换网的电话线相...
- 赵成武戴礼荣蓝先春郭武宋彦张鹰宋军华
- 文献传递
- 基于单片DSP的嵌入式视频监控终端及系统的实现被引量:5
- 2005年
- 针对大范围分布、多监控点的视频监控需求,设计和实现了基于宽带网的具有分布式体系结构的监控系统,该系统允许视频监控终端、监控中心客户机和监控服务器在大范围内灵活、方便地组网。同时,介绍基于单片DSP的嵌入式视频监控终端的设计和实现中的关键技术,包括监控终端的软、硬件结构以及MPEG-4视频编码算法在DSP上实时实现的算法级和代码级优化。该监控系统已在实际中应用。
- 岳嵩戴礼荣宋彦
- 关键词:DSPMPEG-4
- 一种带双端发声检测的回声消除改进算法
- 首先对传统的回声消除中的双端发声检测机制进行了分析,指出这些检测算法都存在一定的延时,导致在检测到双端发声之前滤波器已经一定程度地发散,从而影响双端发声段中的回声消除效果。本文提出了一种新的带有滤波器缓存的回声消除算法。...
- 宋彦汪萌戴礼荣
- 文献传递
- 基于音素评分模型的发音标准度评测研究被引量:4
- 2011年
- 在计算机辅助语言学习系统中,后验概率是普通话水平测试(PSC)电子化系统衡量考生发音标准程度的重要指标,但后验概率与人工的主观评分存在着显著差别。该文提出了"音素评分模型"的思想,对后验概率进行变换。该文研究了线性和非线性的sigmoid音素评分模型,并发现线性音素评分模型有闭式全局最优解,非线性音素评分模型可用梯度下降法求解。在全国采集的498人的普通话考试现场数据集上的实验表明该策略能使系统评分性能有明显的提升:当后验概率在全音素概率空间中计算时,可使系统性能提升约42%;当后验概率在优化的概率空间中计算时,能使系统性能提升约23%~27%。
- 严可戴礼荣
- 关键词:后验概率普通话水平测试
- 极低速率MELP语音编码器及其实时实现
- MELP语音编解码算法是一种码速率为2.4 kbps的极低码速率语音编码算法。文章中,首先,对MELP语音编解码算法进行了简要讨论,进而介绍基于DSP的MELP语音编码器的硬件设计原理及软件实现时算法结构的优化及实验结果...
- 戴礼荣赖伟王仁华
- 关键词:语音编码DSP
- 文献传递
- 基于PSTN的远程多媒体监控系统被引量:16
- 2001年
- 基于 PSTN网的远程多媒体监控技术 ,其关键是针对监控应用要求 ,在保证一定的图象和语音质量的同时 ,对图象与语音以尽量高的压缩率进行压缩 ,以及对图象与语音压缩进行实时处理 ;在所介绍的基于 PSTN的远程多媒体监控系统中 ,图象和语音压缩处理是采用 H.2 6 3和 G.732 .1协议 .首先介绍了该系统组成结构 ;然后在简要介绍基于 H.2 6 3和 G.732 .1协议的图象与语音压缩算法的基础上 ,进一步讨论了针对远程多媒体监控的应用要求 ,基于图象与语音压缩的若干考虑 ,着重讨论和介绍了该系统的关键组成部分 ,即多媒体远程监控终端机的设计与实现 ,提出了基于高速 DSP技术的图象与语音压缩实时处理的关键技术及所采取的措施 。
- 戴礼荣李枫王仁华
- 关键词:图象压缩语音压缩数字信号处理器PSTN公众电话网远程多媒体
- 基于音素绑定码本映射的说话人声音转换方法被引量:1
- 2006年
- 介绍说话人声音转换系统框架,并对传统的基于码本映射的说话人声音转换方法进行讨论.指出传统的码本映射方法由于对谱的转换采用所有码本加权叠加,因此会产生转换后语音频谱平滑效应过重的问题,从而使转换后语音音质较差.为了克服这种问题,本文提出基于音素绑定的码本加权叠加方法来完成语音谱的转换,同时利用决策树来完成韵律的转换.实验表明,即使在数据量较少的情况下,该方法也能较好地完成说话人声音转换,并能得到较高的语音音质.
- 王子祥戴礼荣王玉平王仁华
- 关键词:声音转换码本映射决策树
- 声纹识别中合成语音的鲁棒性被引量:3
- 2011年
- 随着以隐马尔科夫模型为基础的语音合成技术的发展,冒认者很容易利用该技术生成具有目标说话人特性的合成语音,这对现有的声纹识别系统构成巨大威胁.针对此问题,文中从统计学的角度分析自然语音与合成语音在实倒谱上的区别,并提出对合成语音具有鲁棒性的声纹识别系统.实验结果初步表明,相比于传统的声纹识别系统,在对自然语音的等错误率不变的情况下,该系统对合成语音的错误接受率由99.2%降为0.
- 陈联武郭武戴礼荣
- 关键词:声纹识别
- 结合模型混淆度和BIC准则的语种识别精细建模方法被引量:3
- 2011年
- 提出了一种基于语种模型混淆度的模型参数估计方法,并结合贝叶斯信息准则(Bayesian informationcriterion,BIC)来进行模型的选取,避免了大量标注信息的需求。在NIST-07语种识别30,10和3s的测试任务中,分别给出了在最大似然(Maximum likelihood,ML)准则和最大互信息(Maximum mutual information,MMI)准则下性能比较,所提出的方法相对于基线系统,性能都有明显的提升,而且达到了利用标注信息进行细化建模相同的水平。
- 徐颖宋彦戴礼荣
- 关键词:语种识别贝叶斯信息准则高斯混合模型