同济大学人工智能研究室
- 作品数:9 被引量:280H指数:6
- 相关作者:柴佩琪谢崇文更多>>
- 相关机构:宁波大学信息科学与工程学院宁波大学信息科学与工程学院纵横智能软件研究所上海交通大学电子信息与电气工程学院图像处理与模式识别研究所更多>>
- 发文基金:教育部科学技术研究重点项目国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术交通运输工程理学更多>>
- 一种易损性音频数字水印技术被引量:9
- 2003年
- 利用变换域嵌入水印是音频水印的主流技术,一般的嵌入方法是通过调整所选变换系数实现。谱弯折方法实现整段频谱的非线性位移,可将水印嵌入整个频谱。该文在Choi犤1犦的谱弯折音频数字水印算法基础上,研究了算法的鲁棒性,通过大量实验验证,认为谱弯折算法对信号处理类攻击相当脆弱,不具备鲁棒性,是一种易损性音频水印。
- 王让定柴佩琪
- 关键词:数字水印音频水印
- 一个基于谱熵的语音端点检测改进方法被引量:46
- 2004年
- 本文提出了基于谱熵和谱减法相结合的带噪语音端点检测改进算法以及端点检测的判决准则 .仿真实验表明 ,在语音信号受到强噪声的干扰后 (5dB≤SNR≤ 15dB) ,所提方法可检测到准确的语音端点 .
- 王让定柴佩琪
- 关键词:谱熵谱减法端点检测带噪语音自动语音识别
- 语音倒谱特征的研究被引量:101
- 2003年
- 语音倒谱特征是语音识别中最常用的特征参数,它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,提出了一级、二级差分倒谱特征参数的提取算法。识别实验验证了MFCC参数的鲁棒性优于LPCC参数。
- 王让定柴佩琪
- 关键词:LPCCMFCC特征提取语音识别
- 一种基于改进谱减法的语音增强方法被引量:11
- 2003年
- 谱减法是最常用的一种语音增强技术,其特点是计算复杂度低、实时性强、易于实现。谱减法的主要目的是去除语音信号中的噪声干扰,提高语音信号质量。本文在研究基于改进谱减法的基础之上,提出了利用带噪语音的高频区估计噪声谱以及由短时过零率和短时能量组合而成的加权函数去除背景噪声及音乐噪声的语音增强方法。实验表明,这种时频结合的语音增强方法对背景噪声下的语音质量的增强效果明显。
- 王让定柴佩琪
- 关键词:语音增强谱减法加权函数语音信号处理噪声谱
- 中文文语转换系统中基于决策树的基频模型提取被引量:3
- 2004年
- 普通话是有调语言,基频曲线是中文文语转换系统中选择单元时一个非常重要的参数。目前,许多文语转换系统都是通过人工的方法得到一些基频曲线的变化规则,并通过应用这些规则来指导单元的选择。然而,一方面由于基频曲线的变化十分复杂,人工总结的规则十分有限,另一方面规则只能是定性的,这也造成了单元选择时的不确定性。为了能更好地根据基频这个声学参数来选择语音单元,我们就必须建立文本上下文环境信息与基频曲线之间的映射关系,即基频模型,以定量地描述基频曲线的变化规律。本文从统计学的角度出发,通过决策树的方法来建立这个模型,并将这个模型应用到普通话的文语转换系统中。实验结果表明,通过本文提出的方法建立起来的基频模型基本上反映了基频曲线的变化规律,在语音合成中取得比较理想的效果。
- 谢崇文柴佩琪
- 关键词:文语转换聚类分析决策树
- 中文文语转换系统中基于决策树的基频模型提取
- 2007年
- 普通话是有调语言,基频是TTS系统中选择单元时一个非常重要的参数。为了能根据基频这个声学参数来选择语音单元,就必须建立文本上下文环境信息与基频曲线之间映射关系,即基频模型。本文将通过决策树的方法来提取这个模型,并将这上模型应用到普通话的文—语转换系统中。
- 谢崇文柴佩琪
- 关键词:文语转换聚类分析决策树
- 基于时频结合的背景噪声下语音增强方法被引量:7
- 2003年
- 本文在研究基于改进谱减法的基础之上 ,提出了在频域利用谱减法去除宽带加性噪声 ,在时域利用短时过零率和短时能量组合而成的加权函数去除谱减法后产生的“音乐噪声”的方法 .实验表明
- 王让定柴佩琪
- 关键词:语音增强噪声消除音乐噪声权函数
- 对谱弯折DCT音频水印算法的再研究被引量:4
- 2003年
- 近几年,音频数字水印技术越来越引起了人们的极大兴趣,各种新方法和技术不断提出,如何将这些方法和技术应用于实际音频作品的版权保护中,并非易事。文章在借助Choi等犤1犦的谱弯折音频水印算法解决版权保护的实际问题时,经大量的实验验证和理论分析,认为谱弯折方法对信号处理类(包括MP3压缩、重采样等)的攻击相当脆弱,不具备鲁棒性。
- 王让定柴佩琪
- 关键词:DCT音频水印算法音频压缩音频信号处理版权保护
- 车辆牌照字符识别被引量:103
- 2000年
- 介绍了一个牌照字符识别系统的字符串图像提取部分和字符识别部分 .前者采用基于纹理的分割阈值选取方法 ,即先对牌照图像进行纹理分析 ,然后对取得的直方图采用模式识别中的最大最小准则决定分割阈值 ,其效果优于传统的直方图方法 .后者采用多个简单识别器融合方法进行字符识别 .这一方法根据不同类型识别器的特性 ,采用串、并联混合的方案将它们组合在一起 .与单一识别器相比 ,不仅大幅提高了识别率而且缩短了识别耗时 .这一系统对牌照汉字、数字和字母的识别率均大于 96%,总的牌照识别率为 82 %.
- 叶晨洲杨杰宣国荣
- 关键词:字符识别模式识别车辆牌照纹理分析分割阈值