您的位置: 专家智库 > >

国家自然科学基金(60272037)

作品数:10 被引量:169H指数:7
相关作者:徐柏龄栗学丽丁慧林志斌沙丹青更多>>
相关机构:南京大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:电子电信理学自动化与计算机技术更多>>

文献类型

  • 10篇期刊文章
  • 1篇会议论文

领域

  • 10篇电子电信
  • 1篇自动化与计算...
  • 1篇理学

主题

  • 9篇语音
  • 6篇耳语音
  • 3篇信号
  • 2篇信号处理
  • 2篇音长
  • 2篇语音识别
  • 2篇语音增强
  • 2篇声调
  • 2篇汉语耳语音
  • 1篇单音
  • 1篇单音节
  • 1篇端点
  • 1篇端点检测
  • 1篇心理声学
  • 1篇信号分离
  • 1篇音节
  • 1篇语音合成
  • 1篇语音信号
  • 1篇语音信号处理
  • 1篇阵列

机构

  • 11篇南京大学

作者

  • 11篇徐柏龄
  • 4篇栗学丽
  • 3篇丁慧
  • 2篇杨莉莉
  • 1篇叶骏
  • 1篇戴明扬
  • 1篇陈锴
  • 1篇周毅
  • 1篇樊星
  • 1篇沙丹青
  • 1篇卢晶
  • 1篇林志斌
  • 1篇林玮

传媒

  • 3篇声学学报
  • 3篇电声技术
  • 2篇应用声学
  • 1篇数据采集与处...
  • 1篇南京大学学报...
  • 1篇中国声学学会...

年份

  • 1篇2006
  • 4篇2005
  • 3篇2004
  • 3篇2003
10 条 记 录,以下是 1-10
排序方式:
自适应降噪系统的语音分离研究被引量:6
2004年
对抑制干扰语音的自适应降噪系统(CTRANC)进行了语音分离算法的研究。利用CTRANC抑制干扰信号的特性及语音信号的短时稳定性,借助最优控制相关理论,得到了新的语音分离方法及其自适应滤波迭代步长的计算公式。实验结果表明在双话者的情况下,这种语音分离算法能够保证自适应语音分离系统具有良好的稳定性,较好的实时跟踪能力和收敛性能,且分离出来的语音具有令人满意的清晰度。
丁慧徐柏龄
汉语耳语音转换为正常音的研究被引量:16
2005年
耳语音转换为正常音,可应用于公共场所的通信、失语者的语音恢复和司法工作的某些特殊需要等方 面。由于耳语发音和正常音在激励源和声道传递函数上存在差异,所以一般的语音合成方法不再适用。分析了耳语 音的发音及声学特点,初步建立了一个基于同态信号处理方法并结合相对熵声韵分割的耳语音重建系统,人耳对 恢复出的正常音可以正确分辨。
樊星卢晶徐柏龄
关键词:耳语音语音合成
混响声场中语音识别方法研究被引量:14
2003年
免提式话筒语音识别系统是语音识别走向实用的目标之一,实现这一系统,首先要解决房间效应引起的混响问题。通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化,识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%。提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率。该方法不仅识别率高,而且运算量小、所需内存空间小,易于做成小型实用的快速识别系统。
栗学丽徐柏龄
关键词:语音识别矢量量化
汉语耳语音孤立字识别研究被引量:11
2006年
耳语音识别有着广泛的应用前景,是一个全新的课题。但是由于耳语音本身的特点,如声级低、没有基频等,给耳语音识别研究带来了困难。本文根据耳语音信号发音模型,结合耳语音的声学特性,建立了一个汉语耳语音孤立字识别系统。由于耳语音信噪比低,必须对其进行语音增强处理, 同时在识别系统中应用声调信息提高了识别性能。实验结果说明了MFCC结合幅值包络可作为汉语耳语音自动识别的特征参数,在小字库内用HMM模型识别得出的识别率为90.4%。
杨莉莉林玮徐柏龄
关键词:耳语音语音识别语音增强
基于占格率的实时盲信号分离系统设计及实现被引量:1
2005年
以占格率理论为基础 ,提出搜索分离阵权值的盲分离算法。该算法采用统计估计权值分布的方法 ,并通过约束权值的搜索范围 ,有效地去除了伪权值估计带来的干扰 ,适用于各种瞬时混合信号的分离。通过对该盲分离算法进一步简化与改进 ,设计了一种适合于语音盲分离的实时处理系统 ,并且使其在 DSP系统上得以实现。计算机仿真与 DSP系统的实验证明 ,该系统搜索准确率高 ,占用资源少 ,实时性好 。
陈锴叶骏徐柏龄
关键词:权值搜索范围DSP系统盲分离算法盲信号分离混合信号
汉语耳语音声调识别研究
杨莉莉徐柏龄
基于听觉模型的耳语音的声韵切分被引量:9
2004年
本文分析了耳语音的特点,并根据生理声学及心理声学的基本理论与实验资料,提出了一种利用听觉模型来进行耳语音声韵切分的方法。这种适用于耳语音声韵切分的听觉感知模型主要分为四个层次:耳蜗对声音频率的分解机理;听觉系统的时域和频域非线性变化;中枢神经系统的侧抑制机理。这种模型能反映在噪声环境下人对低能量语音的听觉感知特性,因而适于耳语音识别,在耳语音声韵母切分实验中得到了满意的结果。
丁慧栗学丽徐柏龄
关键词:生理声学心理声学听觉模型
基于熵函数的耳语音声韵分割法被引量:43
2005年
耳语音声韵分割是耳语音识别和转换的前期工作。由于耳语发音不同于正常音,一般用于正常音的声韵分割法对耳语音不再适用。通过分析耳语音的发音及声学特点,利用宽带语谱图的声韵变化规律,提出了适用于耳语音的信息熵端点检测法,以及相对熵、音长和谱重心相结合的声韵分割法。并对两组信噪比为2-10 dB的380个汉语单音节耳语音进行声韵分割,女声的正确率为87.9%,男声的正确率为90.3%,高于频域法、聚类法和谱平坦度声韵分割法。实验表明,相对熵法可做为耳语音识别和转换的预处理,它改善了汉语耳语音转换为正常音的音质。
栗学丽丁慧徐柏龄
关键词:声韵单音节音长端点检测
耳语音声调特征的研究被引量:31
2003年
介绍了耳语音的声学特性,在没有基频的情况下,通过人耳听觉实验验证了孤立的耳语音节是带有声调信息的,并得出幅值包络和音长都是耳语音声调的重要特征。
沙丹青栗学丽徐柏龄
关键词:耳语音声调音长
基于传声器阵列的声源定位被引量:75
2004年
概括了利用传声器阵列进行语音声源定位几种方法,同时分析了几种声达时间延迟的相关算法,并给出了几种搜索算法,给出了基于互功率谱相位加权延迟估计的声源定位实验结果。
林志斌徐柏龄
关键词:传声器阵列声源定位阵列信号处理
共2页<12>
聚类工具0