您的位置: 专家智库 > >

国家自然科学基金(60971098)

作品数:19 被引量:53H指数:6
相关作者:吴镇扬蔡卫平李拟珺程旭吴海洋更多>>
相关机构:东南大学中国科学院九江职业技术学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 19篇期刊文章
  • 3篇会议论文

领域

  • 14篇电子电信
  • 8篇自动化与计算...

主题

  • 5篇语音
  • 5篇阵列
  • 5篇麦克风
  • 5篇麦克风阵列
  • 4篇噪声
  • 4篇声源
  • 3篇矢量
  • 3篇泰勒级数
  • 3篇鲁棒
  • 3篇级数
  • 2篇语音编码
  • 2篇语音识别
  • 2篇声源定位
  • 2篇时延
  • 2篇时延估计
  • 2篇说话人识别
  • 2篇自适应
  • 2篇粒子滤波
  • 2篇滤波
  • 2篇基于矢量

机构

  • 17篇东南大学
  • 3篇九江职业技术...
  • 3篇中国科学院
  • 2篇安徽师范大学
  • 1篇佛山科学技术...

作者

  • 17篇吴镇扬
  • 5篇蔡卫平
  • 4篇李拟珺
  • 3篇吕勇
  • 3篇吴海洋
  • 3篇程旭
  • 2篇陆泽橼
  • 2篇汤一彬
  • 2篇张索非
  • 2篇周琳
  • 2篇王仕奎
  • 2篇万新旺
  • 1篇倪志莲
  • 1篇张怡典
  • 1篇孙明
  • 1篇周同驰
  • 1篇黄印君
  • 1篇殷侠
  • 1篇郭海燕
  • 1篇徐健

传媒

  • 6篇东南大学学报...
  • 2篇声学学报
  • 2篇计算机应用与...
  • 2篇Journa...
  • 1篇电子与信息学...
  • 1篇中国科学技术...
  • 1篇计算机工程与...
  • 1篇佛山科学技术...
  • 1篇电子测量与仪...
  • 1篇天津大学学报
  • 1篇重庆邮电大学...
  • 1篇中国通信学会...

年份

  • 1篇2018
  • 1篇2015
  • 3篇2014
  • 3篇2013
  • 3篇2012
  • 3篇2011
  • 8篇2010
19 条 记 录,以下是 1-10
排序方式:
一种基于粒子滤波的鲁棒声源跟踪算法被引量:7
2010年
为了提高噪声和混响环境中声源跟踪的精度,提出一种基于粒子滤波的鲁棒声源跟踪算法。在基于麦克风阵列的粒子滤波声源跟踪算法框架下,该方法分别采用常规可控波束形成和相位变换加权的可控响应功率两种声源定位函数来构造似然函数,并且分别用这两种似然函数评价粒子权重,再将各自的粒子权重归一化并对两种粒子权重做加权平均得到新的粒子权重。仿真结果表明,在高信噪比或弱混响条件下,该方法的跟踪性能与传统方法接近;在信噪比低于10dB,混响时间大于300ms条件下,该算法的跟踪误差比传统算法减小15%~20%。文中提出的声源跟踪算法结合了两种定位函数的优点,在低信噪比,较强混响环境下有好的鲁棒性。
蔡卫平吴镇扬
关键词:麦克风阵列粒子滤波
基于子带可控响应功率的多声源定位方法被引量:6
2013年
为了提高多个说话人情况下麦克风阵列的定位性能,提出基于子带可控响应功率的多声源定位算法。该算法将语音信号频域分为7个子带,在每个子带计算相位变换加权的可控响应功率函数,在声源空间搜索其最大值得到声源位置的初始估计。根据语音信号频率的稀疏性,这些初始估计包含多个声源的位置,运用会聚聚类算法得到最终的声源位置估计。仿真和实验表明,在有2个说话人,10 dB信噪比,较强混响的条件下,该算法比传统算法的定位正确率提高了约4%,额外率降低了约7%。
倪志莲蔡卫平张怡典
关键词:麦克风阵列聚类
基于矢量泰勒级数的模型自适应算法被引量:2
2010年
在实际环境中,由于测试环境与训练环境的不匹配,语音识别系统的性能会急剧恶化。模型自适应算法是减小环境失配影响的有效方法之一,它通过测试环境下的少量自适应数据,将HMM模型的参数变换到测试环境下。该文将矢量泰勒级数用于模型自适应,同时对HMM模型的均值向量和协方差矩阵进行变换,使其与实际环境相匹配。实验证明,该文算法优于MLLR算法和基于矢量泰勒级数的特征补偿算法,在低信噪比环境中性能提高尤为明显。
吕勇吴镇扬
关键词:语音识别模型自适应隐马尔可夫模型
基于自适应频率选择的鲁棒时延估计算法被引量:7
2010年
为了增强相位变换加权广义互相关方法(GCC-PHAT)这一常用时延估计方法对噪声的鲁棒性,提出了一种基于频率自适应选择的改进算法.该算法利用较短的语音数据(32ms)估计出每个频率的协方差矩阵,从而计算出每个频率的信噪比(SNR),然后自适应地选择SNR较大的频率用于时延估计.仿真实验结果表明,不论是在中等混响(混响时间T60=0.3s)还是在强混响(T60=0.6s)条件下,相对于GCC-PHAT方法,该算法对噪声的鲁棒性更强.
万新旺吴镇扬
关键词:麦克风阵列时延估计
An Adaptive Filtering Algorithm for Noisy Speech Using Walsh-Hadamard Transform
In the process of speech signal processing and analysis, the cancellation of noise is very important procedure...
Ming SunZhenyang Wu
基于多特征融合和分层反向传播增强算法的人体动作识别被引量:6
2014年
为了推广神经网络在人体动作识别中的应用,设计了一种基于分层识别框架和增强算法的动作识别系统,该系统融合了光流直方图、有向梯度直方图、Hu的矩特征、分块剪影和自相似矩阵等多种特征.为了与反向传播网络的增强相匹配,将传统的二分类增强算法扩展到多分类版本.此外,系统采用了包含预判决和后判决的分层识别框架,前者通过分析运动显著区域的位置,把动作粗分为几个子类,后者则利用额外的特征进一步提高识别准确率.基于Weizmann和KTH数据库的实验结果表明:神经网络相对于常用的支持向量机具有明显的优越性;结合分层识别的反向传播增强算法可以极大减少运算代价与动作类间的混淆,识别准确率较高.
李拟珺程旭郭海燕吴镇扬
关键词:特征提取神经网络
Action recognition using a hierarchy of feature groups
2015年
To improve the recognition performance of video human actions,an approach that models the video actions in a hierarchical way is proposed. This hierarchical model summarizes the action contents with different spatio-temporal domains according to the properties of human body movement.First,the temporal gradient combined with the constraint of coherent motion pattern is utilized to extract stable and dense motion features that are viewed as point features,then the mean-shift clustering algorithm with the adaptive scale kernel is used to label these features.After pooling the features with the same label to generate part-based representation,the visual word responses within one large scale volume are collected as video object representation.On the benchmark KTH(Kungliga Tekniska H?gskolan)and UCF (University of Central Florida)-sports action datasets,the experimental results show that the proposed method enhances the representative and discriminative power of action features, and improves recognition rates.Compared with other related literature,the proposed method obtains superior performance.
周同驰程旭李拟珺徐勤军周琳吴镇扬
A Particle Swarm Optimization Algorithm with Local Sparse Representation for Visual Tracking
Handling appearance variations caused by the occlusion or abrupt motion is a challenging task for visual track...
Xu ChengNijun LiTongchi ZhouLin ZhouZhenyang Wu
基于非负矩阵分解的1kbit/s波形内插语音编码算法
2010年
为了进一步降低编码速率,提出了一种基于非负矩阵分解的1kbit/s波形内插语音编码算法.该算法对特征波表面的幅度矩阵进行非负矩阵分解,以获得局部特征矩阵,并对该局部特征矩阵进行约束和改进,使优化后局部特征更加突出.对应的基矢量进一步稀疏,从而有利于对权矢量的量化,以实现对特征波表面的高效编码.该算法同时加入清浊音标志,对特征波表面的相位谱进行估计,以更好地提高合成语音质量.实验表明,该算法能够在1kbit/s的低编码速率条件下,获得与1.2kbit/s混合激励线性预测语音编码算法相近的合成语音质量,取得了较好的效果.
汤一彬吴海洋吴镇扬
关键词:非负矩阵分解波形内插
AMR-WB到AMR转码中合成滤波器转换算法
2010年
提出AMR-WB到AMR转码中的2种合成滤波器转换算法.第1种是基于采样率转换和Prony算法的转换,首先将AMR-WB合成滤波器的单位采样响应进行采样率转换,然后根据最小二乘法,使得新的滤波器的单位采样响应和采样率转换后的响应的误差最小化.第2种是基于自相关值内插的转换算法,首先由AMR-WB语音的LPC参数倒推出自相关,然后采用三次样条内插出AMR语音的自相关,最后利用Levinson-Durbin算法计算LPC参数,即得到解码端的合成滤波器.算法复杂度分析表明,2种算法的计算复杂度都低于Tandem转码.实验结果表明,2种算法都可以得到比较小的谱失真.第2种算法的谱失真在浊音帧比第1种算法略大,在清音帧谱失真有时较大,但是由于清音激励的随机性,对合成清音质量影响不大.
王仕奎蔡卫平杨志鸿吴镇扬
关键词:转码PRONY算法自相关
共3页<123>
聚类工具0