简志华
- 作品数:27 被引量:39H指数:4
- 供职机构:杭州电子科技大学通信工程学院更多>>
- 发文基金:国家自然科学基金浙江省自然科学基金江苏省“青蓝工程”基金更多>>
- 相关领域:电子电信自动化与计算机技术文化科学更多>>
- 基于双字典的噪声环境下的语音转换方法被引量:1
- 2020年
- 现实有噪环境下,传统的语音转换系统性能会激剧下降,为此该文提出了一种具有噪声鲁棒性的语音转换算法.在训练阶段,除了生成纯语音字典,还要用背景噪声获得噪声字典,然后将两者联合起来匹配含噪语音.在转换阶段,利用含噪语音所对应的纯语音字典的权值矩阵和目标语音字典,实现语音转换.实验结果表明,在信噪比较低时,该文算法比传统的转换算法具有更好的抗噪性能;并且在多种不同噪声环境下本文算法都具有明显的优势.
- 周迪简志华胡伟通汪云路
- 关键词:语音转换噪声鲁棒性
- 一种用于语音转换的区域最近邻迭代训练算法被引量:1
- 2012年
- 针对非对称语音库情况下的语音转换,该文提出一种新的改进的语音转换训练算法ILNCA。与原有的训练算法INCA不一样的是,ILNCA首先利用高斯混合模型(GMM)分别对源、目标语音特征参数空间进行分类。然后根据Kullback–Leibler(KL)距离最小原则对源、目标GMM模型的子空间进行匹配,最后利用最近邻准则在相对应的子空间中进行源、目标语音特征参数矢量的对齐。客观测试和主观听觉实验都表明由于该文算法采用了更加精确的矢量对齐方法,能取得比INCA算法更优异的转换性能。
- 简志华王向文
- 关键词:语音转换
- 基于联合特征与随机森林的伪装语音检测被引量:4
- 2022年
- 为了能较为全面地描述语音信号的特征信息,提高伪装检测率,提出了一种基于均匀局部二值模式纹理特征与常数Q倒谱系数声学特征相结合,并以随机森林为分类模型的伪装语音检测方法。利用均匀局部二值模式提取语音信号语谱图中的纹理特征矢量,并与常数Q倒谱系数构成联合特征,再用所获得的联合特征矢量训练随机森林分类器,从而实现了伪装语音检测。实验中,分别对其他特征参数以及支持向量机分类器模型所构建的几种伪装检测系统进行了性能对照,结果表明,所提联合特征与随机森林模型相结合的语音伪装检测系统具有最优的检测性能。
- 于佳祺简志华徐嘉游林汪云路吴超
- 关键词:声学特征纹理特征
- 语声转换系统的关键技术研究
- 在现代语音通信中,说话人的个性特征信息越来越得到了人们的重视,在通信中发挥着重要的作用,比如人们仅仅通过声音就可以清楚地辨别出对方,可以说声音是一个人的“语音名片”。语声转换是一种以说话人个性特征为主要研究对象的新兴的语...
- 简志华
- 关键词:语音通信特征参数谱包络语音频谱
- 文献传递
- 基于混合线性变换的语声转换算法被引量:3
- 2007年
- 针对在没有对称语音库的情况下,该文提出了一种基于混合线性变换的语声转换算法,在最大似然估计准则下,使用EM迭代算法计算变换函数的参量。为了减小线性加权对语音谱包络的平滑作用,使用线性调频Z变换来调节语音信号的LPC系数。客观评测和主观感受的实验结果都表明,基于混合线性变换的语声转换算法也可以取得与传统语声转换技术相当的转换效果,解除了传统语声转换技术需要对称语音库的要求。
- 简志华杨震
- 关键词:最大期望算法线性调频Z变换
- 基于维特比算法的语声转换被引量:2
- 2009年
- 本文提出了一种基于Viterbi搜索的语声转换算法,利用目标语音帧的转移概率矩阵来描述语音帧的时序信息,通过Viterbi搜索算法来寻找每帧语音的最佳GMM分量,它避免了传统的基于GMM的语声转换算法因丢失语音帧的时序信息所造成的频谱帧间不连续,同时也减少了因加权求平均所带来的语音频谱过于平滑,增强了共振峰.客观评测和主观测试的实验结果都表明,本文算法改善了传统的基于GMM的语声转换算法的性能.
- 简志华杨震
- 关键词:语音处理维特比算法
- 基于非因果先验信噪比估计的语音增强算法研究
- 针对传统的对数域最小均方误差(Minimun mean square error short time log spectral amplitude estimation,MMSE-LSA)算法的噪声功率谱估计不适应实际...
- 王旭贞应娜简志华
- 关键词:语音增强最小均方误差
- 文献传递
- 采用表示分离自编码器的任意说话人语音转换
- 2024年
- 针对非平行语料库下任意说话人之间的语音转换存在语言内容信息和说话人个性特征难以分离,从而导致语音转换的性能不佳的问题,提出了一种采用表示分离自编码器的语音转换方法RSAE-VC。该方法将语音信号的说话人个性特征视为时不变,而将内容信息视为时变,利用编码器中的实例归一化和激活引导层将两者进行分离,再由解码器将源语音的内容信息与目标语音的个性特征进行合成,从而生成转换后的语音。实验结果表明,RSAE-VC在梅尔倒谱距离上比现有的AGAIN-VC转换方法平均降低了3.11%,在基音频率均方根误差上降低了2.41%,MOS分和ABX值分别提升了5.22%和8.45%。RSAE-VC方法通过自内容损失进行约束使语音更好地保留内容信息,通过自说话人损失将说话人个性特征更好地从语音中分离,可以确保说话人个性特征尽少地遗留在内容信息中,从而提高语音转换性能。
- 简志华章子旭
- 关键词:语音转换
- 采用圆周局部三值模式纹理特征的合成语音检测方法
- 2023年
- 为了进一步提高合成语音检测的准确率,提出了一种采用圆周局部三值模式(CLTP)纹理特征的合成语音检测方法。该方法利用圆周局部三值模式提取语谱图中的纹理信息并作为语音的特征表示,采用深度残差网络作为后端分类器来判决语音真伪。实验结果表明,在ASVspoof 2019数据集上,与传统的常量Q倒谱系数(CQCC)和线性预测倒谱系数(LPCC)两种特征相比,该方法在等错误率(EER)上分别降低了54.29%和2.15%,与局部三值模式(LTP)纹理特征相比,该方法在等错误率上也降低了17.14%。圆周局部三值模式由于综合考虑了邻域内中心像素与周边像素之间以及各周边像素之间的差异,更加全面地获取了语谱图的纹理信息,提高了合成语音检测的准确率。
- 金宏辉简志华杨曼吴超
- 语声转换技术发展及展望被引量:4
- 2007年
- 语声转换通过改变语音信号的声学特征参数来调整语音的个性特征,从而使得转换后的源说话人语音听起来就像是目标说话人的声音一样。系统地介绍了当前语声转换技术的发展状况,在描述语声转换技术的应用场景和系统框架的基础上,着重阐述了系统的转换模块,即声道特性的转换和韵律转换,特别是重点介绍了声道特性的转换算法。简要地介绍了系统性能的测试方法,最后对全文进行了总结,并针对当前语声转换技术还存在的一些问题,对未来的发展进行了展望。
- 简志华杨震
- 关键词:语音处理