公共文化服务平台

韵律特征在概率线性判别分析说话人确认中的应用被引量：6: 2015年; 研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准技术研究院2010年说话人识别评测扩展核心测试集5的基础上加入噪声构造测试集,并分别对韵律特征和传统Mel频率倒谱系数进行测试。结果显示,随着信噪比的逐渐减小,Mel频率倒谱系数性能出现大幅度下降,而韵律特征性能相对比较稳定,两种特征融合后能使系统性能得到进一步提升,等错率和最小检测错误代价相对于Mel频率倒谱系数单系统最多能分别下降9%和11%。实验表明,韵律特征应用于说话人识别中具有较强的噪声鲁棒性,且与传统的Mel频率倒谱系数存在较强的互补性。; 梁春燕杨琳周若华颜永红; 关键词：线性判别分析说话人确认韵律特征 MEL频率倒谱系数说话人识别

基于遗传算法的网络处理器任务分配问题被引量：2: 2015年; 流水线模式是网络处理器常用的一种编程模式,将任务映射到处理器处理引擎上去是NP-完全问题。针对以往基于遗传算法的解决方案过早收敛的局限性,提出m Ga Pipe算法。该算法采用优化交叉算子IMX和混合变异算子Hybrid M,避免遗传算法出现过早收敛,从而显著提高遗传算法解决此类问题的准确度。仿真结果显示m Ga Pipe算法在同等条件下将收敛到最优解的比率从传统遗传算法的解决方案的9.25%提升到52.25%。; 刘孝圣刘磊邓浩江; 关键词：遗传算法网络处理器流水线

汉语连续语音识别系统中三音子模型的优化被引量：4: 2013年; 为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。; 齐耀辉潘复平葛凤培颜永红; 关键词：三音子模型最大后验概率

一种基于群组推荐的用户隐私保护方法被引量：6: 2015年; 针对现有协同过滤推荐系统中存在的用户隐私泄露问题,提出一种基于群组推荐的用户隐私保护方法,利用群组的天然匿名特性,实现用户身份和个人数据的保护,具体方法包括:用户通过自组织或系统聚类形成群组后,在组内选举管理节点并构建Crowds网络,组内成员通过构建好的Crowds网络将推荐所需数据提交至管理节点,管理节点对收集的数据汇总后提交至推荐服务器;推荐服务器以群组为单位,采用基于群组—项目—标签三部图的物质扩散方法进行推荐,并将推荐结果返回至各管理节点;管理节点将结果分发至组内成员,各成员修正后生成最终推荐结果。实验结果表明,所提算法框架能够在保护用户隐私的同时,保证推荐结果质量。; 彭飞曾学文邓浩江刘磊; 关键词：推荐系统隐私保护群组匿名

谐波显著度的基频提取方法被引量：5: 2015年; 我们提出的谐波显著度的基频提取方法,目的是从语音信号中自动获取人声基频,该方法利用抑制因子计算出基频的谐波显著度谱,对各次谐波显著度加权求和之后进行基频轨迹跟踪确定语音的基频序列。在TIMIT掺噪数据集和音乐信息检索评测2005主旋律数据集上,谐波显著度方法的准确率分别达到了88.5%和73.3%,使倍频、半频错误相对降低了80%。实验表明,基于谐波显著度的基频提取方法增强了系统的抗噪性能以及抗倍半频错误的能力。; 宋黎明李明颜永红; 关键词：语音信号基音周期抗噪性能基音检测

中文口语理解弱监督训练方法被引量：2: 2015年; 标注数据的获取一直是有监督方法需要面临的一个难题,针对中文口语理解任务中的意图识别研究了结合主动学习和自训练、协同训练两种弱监督训练方法,提出在级联框架下,从关键语义概念识别中获取语义类特征子集和句子本身的字特征子集分别作为两个"视角"的特征进行协同训练。通过在中文口语语料上进行的实验表明:结合主动学习和自训练的方法与被动学习、主动学习相比较,可以最大限度地降低人工标注量;而协同训练在很少的初始标注数据的前提下,利用两个特征子集进行协同训练,最终使得单一字特征子集上的分类错误率平均下降了0.52%。; 李艳玲颜永红; 关键词：意图识别

具有选择注意能力的语音拾取技术被引量：4: 2015年; 随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以及同时存在的其他声源等.如果不采用近讲的拾音方式,那么这些因素都会对传播中的语音声波造成干扰.特别是当多个语音系统和多个说话人处于同一环境时,如何确保系统正确接收语音信息,决定了语音系统能否走向实用.本文参考人类的听觉注意机理,提出充分利用对目标语音及干扰声源的先验知识,检测和提升目标语音,并通过将传声器阵列、语音唤醒、目标语音检测、语音增强、混响抑制等一系列技术相结合,实现抗干扰的目标语音拾取.; 王晓飞国雁萌葛凤培吴超付强颜永红; 关键词：传声器阵列语音增强

面向语音增强的序贯隐马尔可夫模型时频语音存在概率估计被引量：6: 2014年; 语音存在概率的估计是语音增强的核心技术之一,针对传统的存在概率估计方法是启发式的,没有把存在概率的估计统一到一个理论框架之中,不能保证估计最优,提出了一种基于序贯隐马尔可夫模型(SHMM)的存在概率估计方法,在每一子带上构建一个SHMM模型描述对数功率谱包络的时间序列,把谱包络序列看作一个在语音和噪声状态之间转移的动态一阶马尔可夫链,采用单高斯函数构建每一状态的概率模型,语音状态的后验概率即为语音信号的存在概率。为了满足算法实时性要求,SHMM参数估计简化为一阶回归过程,根据极大似然准则逐帧更新模型参数。实验表明:SHMM所描述的时序相关性对存在概率的估计起到关键作用,它优于一般的启发式估计方法;SHMM算法的语音增强分段信噪比(SegSNR)和对数谱失真(LSD)性能优于经典的改进型最小统计量控制递归平均(IMCRA)算法。; 许春冬夏日升应冬文李军锋; 关键词：隐马尔可夫模型语音增强序贯时频估计方法

基于卷积神经网络的连续语音识别被引量：70: 2015年; 在语音识别中,卷积神经网络(convolutional neural networks,CNNs)相比于目前广泛使用的深层神经网络(deep neural network,DNNs),能在保证性能的同时,大大压缩模型的尺寸.本文深入分析了卷积神经网络中卷积层和聚合层的不同结构对识别性能的影响情况,并与目前广泛使用的深层神经网络模型进行了对比.在标准语音识别库TIMIT以及大词表非特定人电话自然口语对话数据库上的实验结果证明,相比传统深层神经网络模型,卷积神经网络明显降低模型规模的同时,识别性能更好,且泛化能力更强.; 张晴晴刘勇潘接林颜永红; 关键词：卷积神经网络连续语音识别

基于扩展ARP协议的EPON+EoC+IPQAM网络寻址设计: 2013年; 针对EPON+EoC+IPQAM网络中,基于应用层协议交互下行QAM通道信息时,数据封装开销大、交互次数多的问题,设计一种基于扩展ARP协议的网络寻址方案。E-ARP采用TLV编码格式,在标准ARP协议中扩展EEQAM网络中调制解调和QAM通道的描述信息,并增加调制解调器和QAM通道交互过程,以实现EEQAM的网络寻址。数值分析证明E-ARP相比应用层的HTTP/XML、SOCEKT通讯,交互次数少,封装开销低,通讯效率更高,且具有良好的扩展性。; 杨中臻王劲林刘学郑艳伟; 关键词：网络寻址地址解析协议

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

中国科学院重点部署项目(KGZD-EW-103-2)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

中国科学院重点部署项目(KGZD-EW-103-2)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈