许鹏飞 作品数:12 被引量:46 H指数:3 供职机构: 哈尔滨工业大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 教育部“新世纪优秀人才支持计划” 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 更多>>
深度学习中的自编码器的表达能力研究 学习框架和非监督学习方法近年来越来越流行,吸引了很多机器学习和人工智能领域研究者们的兴趣.最近的研究结果也证明了深度学习方法确实能够取得非常好的结果,无论是在图像、语音或是自然语言处理领域.虽然深度学习方法取得了很好的结... 王雅思 姚鸿勋 孙晓帅 许鹏飞 赵思成关键词:数据降维 基于LHBP多尺度向性滤波的文字检测算法 被引量:3 2010年 复杂光照条件和文字—背景的交融是自然场景图像中文字检测的主要难点。为解决该问题,提出了基于LHBP(local Haar binary pattern)多尺度向性滤波的文字检测算法。该算法首先采用对光强变化不敏感并具文字特征显式描述特点的LHBP模式的纹理描述算子;并在LHBP模式上采用多尺度向性滤波器MDF(multi-scaledirectional filtering)来确定候选文字区域;最后使用基于LHBP直方图的支持向量机法精确定位文字区域。实验结果表明,与其他主流算法相比,该算法能够去除复杂光照条件和文字—背景交融的影响,具有更好的性能。 许鹏飞 姚鸿勋 纪荣嵘 王积成 孙晓帅关键词:文字检测 HAAR小波 支持向量机 图像结构化特征表达方法研究 对多媒体数据进行管理、分类和检索具有广泛的应用价值和迫切的实际需求。有效的图像特征表达是完成上述计算机视觉任务的基础。然而,现有的方法仍然存在语义表达能力弱和判别能力不足等问题。本文以构建高表达力和高判别力的图像表达为研... 许鹏飞关键词:特征提取 视觉系统 面向图像超分辨率的上下文字典学习 被引量:3 2014年 基于稀疏表示理论,提出了一种面向单张图片超分辨率的字典学习方法。通过对训练数据进行分类,期望在每一类训练数据训练字典的过程中,增强类内的上下文信息。与之前的面向图像分类的字典学习方法所不同的是,训练数据集由高分辨率图像块和对应的低分辨率图像块共同组成,这使训练得到的字典更适用于图像重构。利用有限的训练数据集,基于上下文的字典学习方法能够提高字典表示的拓展能力,消除由多重训练数据子集带来的冗余。 于伟 姚鸿勋 孙晓帅 刘先明 许鹏飞基于判别力分析和结构约束的Logo检测方法 2013年 图像中的Logo检测对于分析图像的内容、进行品牌广告投放和广告推荐具有重要的意义。针对现有的Logo检测方法存在的准确率低、处理速度慢的问题,提出了基于特征判别力分析和结构约束的Logo检测方法。首先,提出了基于出现频率的判别力分析方法;其次,提出了基于特征之间相对距离、相对主方向和相对尺度的结构关系表示方法,并构建出Logo表示模型;最后,提出了由粗到精的Logo检测方法,采用视觉单词判别力分析获得候选区域,并采用结构关系来进行精确匹配,确定最终的Logo区域。在一个包含100种Logo的10,000张图像的Logo数据集上的Logo检测实验中表明,所提出的方法在准确率、召回率和处理速度上均明显优于当前主流的Logo检测方法,证明了所提出方法的有效性和高效性。 许鹏飞 姚鸿勋基于空间相关性特征的目标识别方法 随着信息技术的发展,越来越多的图像和视频出现在人们的生活中和互联网上。如何有效的管理和组织这些多媒体数据成为一个亟待解决的问题。对多媒体内容进行分析与理解,进而对多媒体数据进行基于内容的分类为有效的管理和组织这些数据提供... 许鹏飞关键词:图像处理 目标识别 文献传递 深度学习中的自编码器的表达能力研究 被引量:35 2015年 近年来,深度学习框架和非监督学习方法越来越流行,吸引了很多机器学习和人工智能领域研究者的兴趣。从深度学习中的"构造模块"入手,主要研究自编码器的表达能力,尤其是自编码器在数据降维方面的能力及其表达能力的稳定性。从深度学习的基础方法入手,旨在更好地理解深度学习。第一,自编码器和限制玻尔兹曼机是深度学习方法中的两种"构造模块",它们都可用作表达转换的途径,也可看作相对较新的非线性降维方法。第二,重点探究了对于视觉特征的理解,自编码器是否是一个好的表达转换途径。主要评估了单层自编码器的表达能力,并与传统方法PCA进行比较。基于原始像素和局部描述子的实验验证了自编码器的降维作用、自编码器表达能力的稳定性以及提出的基于自编码器的转换策略的有效性。最后,讨论了下一步的研究方向。 王雅思 姚鸿勋 孙晓帅 许鹏飞 赵思成关键词:数据降维 一种视频中的人物动作检测方法 一种视频中的人物动作检测方法,它涉及一种基于内容的视频检测方法,以解决现有的多媒体信息检索方法不能够检测视频素材中的动作信息的问题。本发明通过基于Graph Partition Model的镜头边界检测方法对视频的镜头进... 姚鸿勋 纪荣嵘 孙晓帅 许鹏飞文献传递 基于互训练的流形对图像资源和文字进行融合的方法 基于互训练的流形对图像资源和文字进行融合的方法,涉及图像检索和模式识别技术。它解决了现有的图像检索方法存在的检索精度较差的问题。本发明的步骤为:步骤一、根据图像资源和文字特征构建原始流形;步骤二、通过ISOMAP方法对原... 姚鸿勋 刘先明 纪荣嵘 许鹏飞 孙晓帅 刘天强文献传递 自然场景图像文字检测方法 自然场景图像文字检测方法,它涉及一种通过采用纹理描述子LHBP来描述图像纹理特征并采用多尺度向性滤波的方法进行图像中的文字检测的方法,以解决基于纹理的文字检测方法存在的对光照的要求较复杂、文字与背景对比度变化对检测影响较... 姚鸿勋 许鹏飞 纪荣嵘 孙晓帅 刘天强 刘先明文献传递