广西壮族自治区自然科学基金(2012GXNSFAA053221) 作品数:19 被引量:145 H指数:6 相关作者: 景新幸 杨海燕 周萍 杨青 赵靖 更多>> 相关机构: 桂林电子科技大学 更多>> 发文基金: 广西壮族自治区自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 自然科学总论 更多>>
基于运动目标检测的视频水印算法研究 被引量:1 2014年 深入研究视频序列的基本特性,并在此基础上提出一种改进的DCT(离散余弦变换)域的分块视频水印方案。提出的方案中,通过结合人类视觉感知系统和运动目标检测技术,从视频图像序列中实时地发现并提取运动目标,确定运动目标所在区域,选取视频图像中的运动区域和高细节纹理复杂度区域作为视频水印的嵌入区域,并在水印的嵌入的过程中,通过细分像素块来减少像素分类带来的分块效应。通过仿真实验结果显示,该算法具有较好的不可感知性和鲁棒性。 周萍 刘岩 陈希 景新幸关键词:离散余弦变换 人类视觉系统 运动目标检测 帧间差分法 全钢轮胎仿形缠绕过程的模型预测控制 2015年 为提高轮胎仿形缠绕控制系统的稳定性及控制的快速性,根据缠绕系统数学模型,提出噪声不确定系统的基于动态输出反馈预测控制算法。通过缠绕模型的估计状态与误差集合,建立误差离线数据库;在线时,估计误差在辅助优化中实时更新,计算实时控制器与预测控制器。实验结果表明,改进后的控制方法可行、有效,大幅提升了控制的快速性,并且误差可控制在稳定的范围内,适合实际生产。 陶越 陈乐庚关键词:预测控制 数学模型 动态输出反馈 深度信念网络的Bottleneck特征提取方法 被引量:3 2016年 为了提升连续语音识别系统的识别率,提出一种基于深度信念网络的Bottleneck特征提取方法。该方法使用对比散度算法,采用无监督的预训练堆叠限制玻尔兹曼机得到网络初始化参数,进而采用反向传播算法,以最大化帧级交叉熵作为训练准则,反向迭代对网络参数进行微调。采用上下文相关的三音素模型,以音素错误率大小作为评价系统性能的准则。实验结果表明,所提出的基于深度信念网络提取的Bottleneck特征相对于传统特征更具优越性。 谈建慧 景新幸 杨海燕关键词:连续语音识别 混合MFCC特征参数应用于语音情感识别 被引量:19 2013年 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 周萍 李晓盼 李杰 景新幸关键词:特征提取 先验知识增强的三维CT腰椎骨图像分割 被引量:1 2018年 为提高三维CT图像分割精度,提出先验知识增强的GrabCut分割方法。对一组事先手动精确分割的CT图像进行训练,利用主动形状模型(ASM)获得平均形状模型和形状变化量等统计形状先验知识;利用先验知识定义形状项,将目标的形状和位置信息融入GrabCut分割框架,增强待分割图像信息,约束能量函数获得全局最优解。对比实验结果表明,相比主动形状模型和传统GrabCut算法,该算法具有较高的分割精度,在训练集较小的情况下,能比主动形状模型获得更好的分割结果。 颜杰 杨海燕 周萍关键词:先验知识 图割 主动形状模型 一种1V低电压全数字3.1~10.6 GHz IR-UWB发射机 被引量:1 2014年 基于延迟生成并合成窄脉冲方法,采用标准0.18μm CMOS工艺设计了一种3.1~10.6GHz全频段IRUWB发射机.通过对数据及时钟信号进行适当地延迟并用于控制脉冲形成单元电路,使其在不同的时钟沿产生对应于不同数据电平的0°和180°五阶高斯脉冲,实现BPSK调制及高斯脉冲同时产生的功能,从而有利于简化电路结构,降低功耗.版图后仿真实验结果表明:在电源电压为1V的情况下,输出脉冲峰-峰值为200mV,宽度为280ps,其功率谱密度符合FCC的UWB频谱规范;其最高数据率可达400 Mb/s,功耗仅为12.5pJ/b. 景新幸 莫培思 韦保林 徐卫林 段吉海关键词:IR-UWB BPSK调制 一种简单的噪声鲁棒性语音端点检测方法 被引量:9 2015年 语音端点检测是语音识别系统非常重要的组成部分,一种理想的语音端点检测方法,在噪声环境中要具有较强的鲁棒性。为了提高检测方法在噪声环境中的鲁棒性,在短时能量的基础上,结合谱平度和幅度谱的主频率特征,分别进行判决,再采用投票决策机制确定端点检测结果,提出了一种比较理想的语音端点检测方法。实验结果表明,与传统的短时能量法和短时TEO能量法相比,该算法在各种加性噪声下具有良好的鲁棒性,在较低信噪比下仍能准确地区分有用信号和噪声,验证了该算法的有效性。 韦国刚 周萍 杨青关键词:语音端点检测 噪声 鲁棒性 基于改进PNCC和i-vector的说话人识别鲁棒性 被引量:3 2017年 针对传统的梅尔频率倒谱系数(MFCC)在说话人识别系统中鲁棒性不足的问题,提出一种基于改进幂率归一化倒谱系数(PNCC)特征算法和身份向量(i-vector)训练模型的方法。与传统的MFCC不同,PNCC利用长时帧估计背景噪声;在此基础上,通过多窗谱估计、平滑幅度谱包络和均值方差归一化(MVA)等技术进一步提升其鲁棒性。以i-vector为基准模型,在TIMIT语音库上进行说话人识别实验,实验结果表明,在不同噪声、不同信噪比下,所提算法相比其它特征有最低的等错误率,鲁棒性最强,在信噪比低于10dB的噪声环境中具有更大优势。 史小元 景新幸 曾敏 杨海燕关键词:多窗谱估计 说话人识别 差分和加权Mel倒谱混合参数应用于说话人识别 被引量:14 2014年 说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权特征参数与反映语音帧间变化的差分Mel频率倒谱系数进行维度筛选,再进行参数混合.实验结果表明,通过改进加权函数提取得到的特征参数与差分Mel频率倒谱系数的混合参数在矢量量化的说话人识别系统中,码本容量为16和32时可以达到100%的识别率. 柯晶晶 周萍 景新幸 杨青关键词:说话人识别 矢量量化 基于TEO能量谱减法的语音增强技术的研究 被引量:2 2014年 谱减法是目前减少噪声干扰、提高语音质量的一种有效方法。为了进一步提高谱减法的去噪性能,提出一种基于TEO(Teager Energy Operator)能量的改进谱减法。该方法利用TEO能量对带噪语音进行语音活动检测,区别出噪声段和语音段,对噪声段和语音段分别进行谱减处理,既保证了语音质量,又尽可能地消除了噪声干扰。在F16战斗机噪声环境中对算法性能进行测试,结果表明,该方法提高了输出信噪比,抑制了音乐噪声,具有良好的语音增强效果。 崔兆国 周萍关键词:谱减法