国家自然科学基金(61271349) 作品数:15 被引量:57 H指数:5 相关作者: 陈宁 朱煜 萧海东 袁文浩 王雨 更多>> 相关机构: 华东理工大学 中国科学院上海高等研究院 上海大学 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 上海市科学技术委员会资助项目 更多>> 相关领域: 自动化与计算机技术 电子电信 经济管理 化学工程 更多>>
基于结构稀疏的图像修复实验设计 2016年 对于自然图像稀疏先验的大量研究工作,为利用图像的结构稀疏性实现图像的修复奠定了基础。为了使学生了解结构稀疏的概念,并将这一特征应用于图像修复,本文设计了基于结构稀疏的图像修复实验。通过本实验,旨在使学生了解结构稀疏性及图像块稀疏表达的概念及应用,通过图像块稀疏实现图像修复,比较结构稀疏实现图像修复与经典图像修复的不同。文中提供不同算法在修复过程中的实现方式的不同以及每种方法的优缺点,帮助学生更好理解算法的实现过程和图像修复的意义。 胡晨 于文静 张晓宇 方成 杨尊涵 陈宁关键词:图像修复 基于深度图像HOG特征的实时手势识别方法 被引量:6 2015年 手势识别是模式识别领域的一个热点研究方向。提出了一种利用Kinect传感器深度图像进行手势分割的方法,并研究了基于灰度图像HOG特征的手势识别模型;深入研究了HOG特征,分析其特征向量特点,探讨了不同特征维数对训练机的影响及处理效率;通过SVM机器学习方法实现手势的分类识别,经过对大量实验样本的优化训练,获得了最优SVM参数,并进行分析、对比识别率。本文方法维数少、识别率高、运行速度快、性能稳定,能满足实时性手势识别的要求。 VanBang L E 朱煜 赵江坤 陈宁关键词:KINECT 深度图像 HOG特征 手势识别 基于混合判别受限波兹曼机的音乐自动标注算法 被引量:4 2017年 对于音乐自动标注任务,在很多情况下,未标注的歌曲量远远超过已标注的歌曲数据,从而导致训练结果不理想。生成模型能够在某种程度上适应少量数据集的情况,得出较为满意的结果,然而,在有充分数据集的情况下生成模型的效果却劣于判别模型。本文提出了一种结合生成模型与判别模型两者优势的面向音乐自动标注的混合判别波兹曼机模型,该模型可明显提升音乐自动标注的准确率。实验结果表明,混合波兹曼机的效果不仅好于传统的机器学习模型,同时,模型在拥有足够训练数据量的情况下与判别模型效果相当,且在训练集较少的情况下效果也好于判别模型。另外,为了防止模型过拟合,还引入了Dropout规则化方法以进一步加强模型的性能。 王诗俊 陈宁关键词:人工智能 X-ray Astronomical Point Sources Recognition Using Granular Binary-tree SVM The study on point sources in astronomical images is of special importance, since most energetic celestial obj... Zhixian Ma Weitian Li Lei Wang Haiguang Xu Jie Zhu关键词:GRANULE 基于HOG3D描述器与稀疏编码的异常行为检测方法 被引量:2 2016年 提出了一种基于稀疏编码理论的视频异常行为检测方法,并使用HOG3D空-时描述器表征视频序列的形态及运动信息。首先,从正常视频序列中提取空-时兴趣点,获得其特征向量作为训练样本。通过K-SVD字典训练算法构建过完备字典,使得正常样本在所构建字典上的表达具有很好的稀疏性。在稀疏编码过程中,按视频段读取测试视频序列,求解特征信息在字典上的关于其稀疏系数的凸优化问题,然后根据稀疏编码改进公式求得重构误差数值。最后的判断阶段,计算视频段的相对重构误差,相对重构误差为正表明为异常视频段,否则为正常视频段。在UMN数据库3个场景及Weizmann数据库上进行实验,验证了本文算法的有效性。将实验拓展到现实监控视频中,结果表明本文方法在实践中同样具有较好的应用价值。 何聪芹 朱煜 陈宁关键词:异常行为检测 重构误差 基于Gammachirp耳蜗能量谱特征提取的音频指纹算法 被引量:2 2015年 提出了基于Gammachirp耳蜗能量谱的音频时频域特征表示方法,并在此基础上进一步构造了一种音频指纹算法。首先利用非负矩阵分解(Non-negative Matrix Factorization,NMF)提取Gammachirp耳蜗能量谱的局部特征,然后对该局部特征进行差分和量化,以提高算法的鲁棒性,并降低检索的计算复杂度。实验结果表明:在经受音频编辑软件多种攻击和实际环境中录音检索时,本文算法都具有很好的鲁棒性和识别率。 孟建华 陈宁关键词:非负矩阵分解 基于降噪自动编码器特征学习的音乐自动标注算法 被引量:4 2017年 目前,音乐自动标注模型大多采用手动设计模式,因而存在最佳特征难以选择的问题。提出了一种基于非监督学习的特征学习算法,该算法能自动学习特征的潜在结构而不需要依赖先验知识。首先,预处理阶段主要提取音乐的音级轮廓频率谱并进行PCA白化降维处理;然后,采用深度学习中的降噪自动编码器算法对降维后的特征进行无监督的学习,并采用最大值池化和取均值来聚合得到新的特征向量;最后,将特征向量和标签送入多层感知机中进行有监督的学习。基于Magnatagatune和GTZAN数据库的实验结果表明,本文算法在一定程度上提高了音乐自动标注的准确率。 黎鹏 陈宁关键词:多层感知机 基于深度学习和手工设计特征融合的翻唱歌曲识别模型 被引量:2 2018年 在翻唱歌曲识别中,手工设计的特征虽然具有高可定制性,但其采用的浅层线性结构难以表现音乐的非线性长效结构,而采用基于深度学习的特征提取算法分析音乐的非线性动力学特性可以弥补这一缺陷。本文在研究两者互补性的基础上,提出了一种融合手工特征和深度特征的翻唱歌曲识别算法。该算法分别采用深度学习模型和手工设计算法提取歌曲的音级轮廓特征和旋律特征,然后将基于这两种特征的相似度组合成相似度向量输入到改进的SVM模型中,并将输入歌曲属于翻唱组合的概率作为融合相似度。为了验证算法性能,以两个公开的数据库(covers80,covers1212)作为测试对象进行测试,实验结果表明该算法比基于单个特征的算法和基于相似度融合的算法取得了更高的识别率和分类准确率。 杨妹 陈宁关键词:SVM 一种基于噪声分类的语音增强方法 被引量:5 2014年 为了提高噪声估计的准确性,改进语音增强方法性能,在改进的最小控制递归平均算法(Improved Minima Controlled Recursive Averaging,IMCRA)的基础上提出了一种基于噪声分类的语音增强方法。该方法首先对含噪语音进行噪声类型的判断,然后根据判定的噪声类型选取相应的最优参数进行噪声估计,最后采用最优修正的对数谱幅度语音估计计算增强后的语音。该方法相对于传统IMCRA算法,在语音信号的还原和背景噪声的抑制两方面都有较好的性能。 袁文浩 林家骏 王雨 陈宁关键词:语音增强 噪声估计 基于计算听觉场景分析的改进清音分离方法 被引量:3 2014年 基于计算听觉场景分析(CASA)的单通道语音分离方法在浊音分离领域已发展得较为成熟,然而由于清音信号具有较小的能量且不包含周期性基音特征,因此清音分离具有较大的困难。根据噪声信号分布的不确定性和不稳定性,提出了基于CASA和谱减的改进清音分离方法。改进方法在剔除了浊音块后,通过基于距离加权的残余噪声估计算法得到每个清音单元中所包含的噪声能量,对每个清音单元进行谱减算法并标记,进一步剔除残余噪声单元,提取出清音信号。实验结果证明:与传统清音分离方法相比,改进方法对时变性残余噪声能量的估计结果更加精确,更能提高清音分离的有效性。 王雨 林家骏 袁文浩 陈宁关键词:计算听觉场景分析 谱减