栗学丽
- 作品数:13 被引量:94H指数:5
- 供职机构:山东大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金山东大学自主创新基金国家科技支撑计划更多>>
- 相关领域:电子电信文化科学自动化与计算机技术理学更多>>
- 混响声场中语音识别方法研究被引量:14
- 2003年
- 免提式话筒语音识别系统是语音识别走向实用的目标之一,实现这一系统,首先要解决房间效应引起的混响问题。通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化,识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%。提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率。该方法不仅识别率高,而且运算量小、所需内存空间小,易于做成小型实用的快速识别系统。
- 栗学丽徐柏龄
- 关键词:语音识别矢量量化
- 基于Pd的“语音信号处理”教学探索
- 2013年
- 本文将实时的图形编程语言Pd引入"语音信号处理"课程的教学中。笔者介绍了Pd的编程要素,并结合语音信号处理实例说明Pd的简易编程方法,列出Pd在"语音信号处理"教学中的应用,通过语音生成实验说明它具有较强的实时交互性,可以让学生从视听两方面感受参数变化带来的影响。这有助于将抽象的概念形象化,促进学生深刻理解理论,提高教学质量。
- 栗学丽
- 关键词:语音信号处理实时交互
- 汉语耳语音转换为正常音的研究
- 耳语音转换为正常音,在可应用于公众场合下的通讯、失音者的语音恢复和公安司法工作的某些特殊需要等方面。它是一个全新的课题,有许多问题亟待解决。
本文介绍了耳语音的生理、声学和感知特点,指出耳语发音与正常发音生理的...
- 栗学丽
- 关键词:汉语耳语音语音识别声学声调识别
- 文献传递
- “数字信号处理”中分段卷积的教学探讨被引量:4
- 2011年
- 本文对"数字信号处理"课程中难以理解的分段卷积进行解析,并对使用中常见问题进行解答。重叠相加法和重叠保留法是分段卷积的两种易混淆方法,通过举例法、质疑法和实践法等多种教学方法对它们进行分析比较,说明它们的用法,加深概念的理解,以达到学以致用的目的。
- 栗学丽刘琚
- 关键词:数字信号处理
- 基于熵函数的耳语音声韵分割法被引量:43
- 2005年
- 耳语音声韵分割是耳语音识别和转换的前期工作。由于耳语发音不同于正常音,一般用于正常音的声韵分割法对耳语音不再适用。通过分析耳语音的发音及声学特点,利用宽带语谱图的声韵变化规律,提出了适用于耳语音的信息熵端点检测法,以及相对熵、音长和谱重心相结合的声韵分割法。并对两组信噪比为2-10 dB的380个汉语单音节耳语音进行声韵分割,女声的正确率为87.9%,男声的正确率为90.3%,高于频域法、聚类法和谱平坦度声韵分割法。实验表明,相对熵法可做为耳语音识别和转换的预处理,它改善了汉语耳语音转换为正常音的音质。
- 栗学丽丁慧徐柏龄
- 关键词:声韵单音节音长端点检测
- 一种改善喉振话筒语音音质的方法
- 本发明提供一种改善喉振话筒语音音质的方法,提出由STRAIGHT语音模型得到完全去除激励影响的精确幅度谱,并加重此幅度谱中对喉振语音听觉感知起重要作用的第一、二共振峰区域,得到适用于语音转换的共振峰加权Mel倒谱参数加增...
- 栗学丽冯大伟
- 文献传递
- 汉语口呼数字识别系统研究
- 该文概述了语音识别的发展历史与现状,通过研究汉语数字音的特点及常用特征参数,提出了一种新的描述语音信号特征的非线性规整多门限过零率特征矢量及一种基于时域波形匹配的基音快速算法.识别时,利用基音、清音音长的信息,进行分类判...
- 栗学丽
- 关键词:基音BP神经元网络
- 基于听觉模型的耳语音的声韵切分被引量:9
- 2004年
- 本文分析了耳语音的特点,并根据生理声学及心理声学的基本理论与实验资料,提出了一种利用听觉模型来进行耳语音声韵切分的方法。这种适用于耳语音声韵切分的听觉感知模型主要分为四个层次:耳蜗对声音频率的分解机理;听觉系统的时域和频域非线性变化;中枢神经系统的侧抑制机理。这种模型能反映在噪声环境下人对低能量语音的听觉感知特性,因而适于耳语音识别,在耳语音声韵母切分实验中得到了满意的结果。
- 丁慧栗学丽徐柏龄
- 关键词:生理声学心理声学听觉模型
- 基于多特征的颅内脑电癫痫检测方法被引量:4
- 2013年
- 自动癫痫检测对癫痫病发作的诊断及减轻医务人员繁杂的工作有着重大的意义。本研究提出一种基于多特征的长程颅内脑电癫痫检测的新算法。该算法首先对颅内脑电信号进行小波分解和半波处理,然后提取脑电信号的微分方差、相对能量和波动指数组成特征向量,利用贝叶斯原理求得待检信号特征向量的后验概率,通过阈值判断达到癫痫检测的目的。利用德国弗莱堡长程脑电数据进行实验,检测灵敏度为94.2%,特异性为95.6%,误检率为每小时1.16次。实验表明,该算法能够有效检测出长程颅内脑电中的癫痫信号,并具有较低的运算复杂度,有利于实时脑电检测。
- 陈爽爽周卫东袁琦袁莎莎栗学丽
- 不定人汉语数字音实时识别方法的研究被引量:1
- 1997年
- 提出用非线性规整的多门限过零率矢量及过零幅度差来识别0~9十个数字,通过加入自适应算法,提高了识别率.这种方法计算简单、快速,易于用单片机做成实时语音识别系统。
- 栗学丽
- 关键词:语音识别单片机