国家自然科学基金(60472094)
- 作品数:28 被引量:117H指数:6
- 相关作者:张雪英马建芬侯雪梅白静王华奎更多>>
- 相关机构:太原理工大学更多>>
- 发文基金:国家自然科学基金山西省自然科学基金山西省回国留学人员科研经费资助项目更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 一种基于听觉模型的抗噪语音识别特征提取方法被引量:13
- 2005年
- 提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过计算语音的上升过零率作为频率信息并通过非线性幅度加权相结合来获取语音特征。仿真实现了中小词汇量、孤立词的语音识别,得到了较好的实验结果,证明了此方法具有较强的抗噪声性能。
- 焦志平张雪英赵姝彦
- 关键词:语音识别特征提取听觉模型
- The Speech Recognition System Based On Bark Wavelet MFCC
- <正>Bark wavelet is a new wavelet which is especially designed for speech signal.Its base function satisfies ti...
- Xue-ying ZhangJing BaiWu-zhou Liang
- 关键词:MFCC
- 文献传递
- A Noise-Robust Speech Recognition Based on Digital Wavelet Transform
- the current successful feature parameterization,based on cepstral coefficients using the Fourier Transformatio...
- Hou Xuemei College of automation Xi’an Institute of Post and Telecommunication Xi’an
- 关键词:MFCC
- 一种新的用于语音分离的盲源分离算法被引量:2
- 2007年
- 提出了一种基于自然梯度的语音盲分离改进算法。该算法首先使用奇异值分解(SVD)的方法对观测信号进行预白化处理,而后使用自然梯度算法对预白化处理后的观测信号进行分离。通过计算机模拟试验,结果显示该算法能够有效地分离随机混合的自然语音信号。
- 职振华马建芬张雪英
- 关键词:自然梯度算法盲源分离
- 盲源分离在单通道语音增强算法中的应用被引量:3
- 2006年
- 提出一种单通道语音增强算法。首先由接收到的单声道语音信号的含噪部分构造一个假想噪声源,将这一噪声源和含噪的信号作为多通道自适应去相关(MAD)盲分离算法的输入,得到增强的语音信号。进一步将这一增强的语音作为输入,利用Daubechies小波对其进行分解,在小波域中选取合适的阈值函数进行滤波,然后合成时域语音信号。根据以上步骤得到的增强语音有较高的信噪比及可懂度。
- 马建芬李鸿燕张雪英王华奎
- 关键词:语音增强盲源分离小波变换
- 一种鲁棒性音素分段算法
- 2006年
- 基于小波变换的鲁棒性因素分段算法的基本思想是在运用传统的参数滤波方法进行音素分段之前首先将语音信号在小波域中进行滤波,提出对听觉感知有效的语音分量,然后用传统的参数滤波方法进行分段。参数滤波是以一个变化的参数对信号进行滤波,得到信号在不同频带中的分量,可以证明,若滤波参数以一定的规律变化,则这些滤波分量的一阶自相关表示了信号的相关结构。利用新方法进行分段并测试其鲁棒性,实验证明新方法分段效果好且鲁棒性强,是一种有效的音素分段算法。
- 马建芬李鸿燕张雪英王华奎
- 关键词:语音信号处理小波变换
- 一种基于快速噪声估计的MMSE语音增强算法被引量:2
- 2007年
- 提出一种基于快速噪声估计的MMSE语音增强算法,实验表明这种算法比起谱相减法和基于语音短时对数谱的最小均方误差(MMSE-LSA)算法能更显著地提高算法的客观性能,在非平稳噪声环境中能快速估计出变化的噪声功率谱。
- 陈照平马建芬张雪英
- 关键词:噪声估计最小均方误差语音增强
- 基于加权组合过零峰值幅度特征的抗噪语音识别被引量:3
- 2006年
- 基于人耳听觉特性提出一种新的抗噪音识别特征:加权组合过零峰值幅度特征,是对过零峰值幅度特征的一种改进。加权组合过零峰值幅度特征以语音数据和差分语音数据作为处理对象,通过计算它们的上升过零率获得频率信息,经幅度非线性压缩获得密度信息,并根据人耳对声音的感知特点对其进行加权,形成最终的输出特征,识别网络使用HMM。仿真实现了使用新特征与原特征的算法识别结果,证明了新特征具有较高的识别率和优良的抗噪性能。
- 梁五洲张雪英
- 关键词:特征提取过零率语音识别
- 基于TMS320C5409的语音识别系统
- 2007年
- 介绍了一个实时语音识别系统的设计与实现。该系统硬件以TI生产的TMS320C5409 DSP为核心,配置编解码器、外部存储器和逻辑控制电路等。软件算法采用了由能量和过零率相结合的端点检测、Mel频率倒谱系数特征提取和径向基函数神经网络构成的语音识别算法。对汉语数字孤立词进行了实时识别实验,识别结果通过异步通信串口送到PC上实时显示。实验结果证明了系统的有效性。
- 闫文娟张雪英
- 关键词:数字信号处理语音识别径向基函数
- 一种抗噪语音识别算法的DSP实现被引量:2
- 2006年
- 数字信号处理技术的迅速发展,为语音识别的实时实现提供了可能。采用TI公司的DSP芯片TMS320VC5409,建立一个汉语数字的语音实时识别系统。DSP的多通道缓冲串口与模数转换芯片的连接实现语音信号的采样;分别使用64k的程序和数据存储空间;系统的输出是使用TL16C550实现异步通信串口并使之与计算机RS232串口连接以观察识别结果。系统运行算法主要有字端点检测、特征提取和识别算法。实验结果表明,该系统基本能实现预期识别目标。
- 梁芳泉张雪英
- 关键词:语音识别DSPRBF