江苏省自然科学基金(BK2012437)
- 作品数:8 被引量:26H指数:3
- 相关作者:刘天亮戴修斌邵叶秦杨新徐高帮更多>>
- 相关机构:南京邮电大学南通大学上海交通大学更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金国家留学基金更多>>
- 相关领域:自动化与计算机技术电子电信医药卫生更多>>
- 融合信息化边界和多模态特征的室内空间布局估计
- 2019年
- 为感知室内空间布局,提出一种基于信息化边界和多模态特征的场景布局估计方法.首先,采用VGG-16全卷积神经网络预测蕴含空间布局先验的信息化边界图.其次,采用Canny边缘检测和投票策略估计水平和竖直方向消失点,从消失点等角度间隔引出射线细采样信息化边界能量高的区域.接着,采用VGG空间多尺度卷积神经网络估计几何深度和法向特征.然后,积分几何求和候选布局多边形中多模特征描述一元共生,候选布局的表面法向平滑和位置关系确定二元标记约束.最后,采用结构化支持向量机学习模型,最大布局候选得分以推理布局.实验结果表明,与经典方法相比,本估计方法可以有效改善布局的完整度.
- 刘天亮陆泮宇戴修斌刘峰罗杰波
- 关键词:卷积神经网络
- 基于随机森林的CT前列腺分割被引量:4
- 2015年
- 由于低的图像对比度、不可预测的前列腺位置和不确定的肠道气体,CT图像中自动和准确的前列腺分割是一个具有挑战性的问题。本文提出了一个基于随机森林的前列腺分割方法。利用自动上下文模型训练一系列的随机森林分类器,然后迭代地把这些训练好的分类器应用在测试图像上以改进前列腺的分类结果。实验结果表明,相比于其他最新方法,我们的方法性能更好。
- 邵叶秦杨新
- 关键词:CT图像前列腺
- 一种由粗至精的室内场景的空间布局估计方法被引量:5
- 2019年
- 为有效标注室内场景的布局关系,提出一种由粗至精的空间布局估计方法.首先,采用局部不连续自适应阈值检测场景的长直线段,根据直线段的方向将其分为竖直和水平直线段;基于投票机制和正交准则估计垂直与水平消失点,由这两个消失点等角度间隔地引出成对射线生成场景候选布局.其次,采用VGG-16全卷积神经网络估计相应场景的几何上下文和信息化边界,采用softmax分类器决策其fc7层特征以获取布局类别,融合信息化边界和布局类别生成全局特征以粗选取场景候选布局.接着,基于VGG空间多尺度卷积神经网络估计相应场景的法向图和深度图以提取法向特征和深度特征.然后,利用消失点射线夹角参数化3D盒式布局模型,利用几何积分图聚集候选布局中的直线段成员、几何上下文、法向量和深度等区域级特征,采用割平面法学习结构化模型参数.最后,对候选布局的结构化预测得分进行排序,将得分最高者选取为最终空间布局.Hedau和LSUN数据集实验表明,该方法能获得空间布局的精准区域面划分个数和精确边界位置.
- 刘天亮顾雁秋曹旦旦戴修斌罗杰波
- 关键词:卷积神经网络
- 基于伪Zernike矩模糊不变量的图像识别算法被引量:3
- 2013年
- 为了提高模糊图像的识别率,提出了一种新的基于正交伪Zernike矩模糊不变量的图像识别算法。该算法首先推导出模糊图像的伪Zernike矩和原始图像的伪Zernike矩之间的线性关系,然后利用该关系构造出伪Zernike矩的模糊不变量,最后将该不变量作为描述算子对模糊图像进行识别。实验表明,与Zernike矩模糊不变量相比,伪Zernike矩不变量具有更好的模糊不变性,并且基于伪Zernike矩模糊不变量的图像识别算法能获得更高的识别率,特别是当图像含有较大噪声时。
- 戴修斌刘天亮
- 稀疏字典驱动高阶依赖的RGB-D室内场景语义分割被引量:1
- 2017年
- 为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视觉特征,构建超像素标签池并用于训练支持向量机分类器。接着,计算超像素一元势能和相邻超像素成对项势能;同时,以每一类超像素区域内关键点特征的稀疏编码子之和的直方图统计作为高阶势能。最后,利用融合自顶向下的判别性类别成本的条件随机场模型推理实现语义标注。实验表明,与其他方法相比,该方法能得到视觉表现力更强、准确率更高的语义标签图。
- 刘天亮徐高帮戴修斌曹旦旦罗杰波
- 关键词:条件随机场模型
- 融合空间-时间双网络流和视觉注意的人体行为识别被引量:12
- 2018年
- 该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚合给定时间窗口视频中外观图像和相应光流特征。接着,利用长短时记忆多层递归网络交叉感知即得含高层显著结构的时空流语义特征序列;解码时间窗口内互相依赖的隐状态;输出空间流视觉特征描述和视频窗口中每帧标签概率分布。其次,利用相对熵计算时间维每帧注意力置信度,并融合空间网络流感知序列标签概率分布。最后,利用softmax分类视频中行为类别。实验结果表明,与其他现有方法相比,该文行为识别方法在分类准确度上具有显著优势。
- 刘天亮谯庆伟万俊伟戴修斌罗杰波
- 关键词:人体行为识别光流卷积神经网络
- 融合RGB-D多模特征和半径边缘约束超限学习的动作识别被引量:1
- 2018年
- 针对单模态特征鉴别行为动作类别的能力有限问题,提出基于RGB-D视频中多模态视觉特征融合和实例化多重核超限学习(Exemplars-MKL-ELM)的动作分类方法.首先,利用骨架表面拟合和密集轨迹提取稳健的密集运动姿态特征,以稠密点云法平面感知人体3维几何的稀疏化有向主成分直方图特征,提取外观纹理嵌入身体节点空-时邻域的三维梯度直方图特征.然后,采用半径边缘约束多重核超限学习机融合多模态视觉特征,并利用对比数据法挖掘每个行为类别的代表性实例集合.最后,每个样本结合融合视觉特征和即得实例集合,采用Exemplars-MKL-ELM模型和贪婪预测思想分层分类识别行为.实验表明,文中方法在分类准确度和计算效率上都较优.
- 刘天亮陈克虎戴修斌罗杰波
- 关键词:多核学习
- 正交Fourier-Mellin矩模糊不变量的构造及应用
- 2013年
- 为了有效识别含有模糊形变的图像或特征,构造了正交Fourier-Mellin矩模糊不变量.通过获得形变图像和理想图像正交Fourier-Mellin矩之间的关系,推导出基于正交Fourier-Mellin矩函数的模糊不变量,然后利用该模糊不变量识别形变图像.实验表明,在不同模糊形变和不同强度噪声作用下,正交Fourier-Mellin矩模糊不变量的不变性均优于其他不变量,且对模糊形变图像的正确识别率更高.
- 戴修斌刘天亮舒华忠罗立民