北京信息科技大学网络文化与数字传播北京市重点实验室开放课题(ICDD201303)
- 作品数:3 被引量:2H指数:1
- 相关作者:吕学强李卓肖诗斌张丹更多>>
- 相关机构:北京信息科技大学北京拓尔思信息技术股份有限公司更多>>
- 发文基金:北京市教委科技发展计划国家自然科学基金北京信息科技大学网络文化与数字传播北京市重点实验室开放课题更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于轮廓线法的汽车类外观专利图像三维重建被引量:1
- 2015年
- 对立体产品的外观设计专利图像进行三维重建是外观设计专利三维检索的基本前提。结合汽车类外观专利图像的特点,提出汽车类外观专利图像三维重建方法。该方法利用三视图理论及汽车模型的对称性,根据俯视图信息确定主视图与后视图之间在不同高度的距离,进而获取三维空间点坐标;对车轮部分的连接进行特殊处理,并按照子轮廓线连接法构造四角面片,实现三维模型的重建。实验结果表明:1)与传统方法相比错误面片数降低了19.4%;2)重建效果图在外形上与实际物体更为接近。
- 张丹吕学强肖诗斌刘坤
- 关键词:三维重建
- 视频中滚动字幕的检测与跟踪
- 2015年
- 视频中滚动字幕通常表达一段完整信息,对其进行检测与跟踪是字幕识别与应用的重要前提.通过分析视频中滚动字幕的特征,在Sobel边缘检测的基础上,提出规则和统计结合的字幕检测方法及垂直边缘特征最小差平方和的字幕跟踪方法.从视频全局角度出发,对相邻帧的边缘图像进行差分,选取水平边缘特征并根据规则检测字幕区域的候选边界,通过统计边界出现频数,定位滚动字幕区域;计算相邻滚动字幕条在不同偏移值下垂直边缘特征差平方和,取其最小值作为相邻字幕的偏移量,从而实现字幕的跟踪.实验结果显示,该文方法从含有多种字幕类型的视频中检测出滚动字幕的准确率可达96.61%、字幕跟踪的准确率达99.43%,充分说明文中方法的有效性.
- 李钦瑞吕学强李卓刘坤
- 关键词:滚动字幕字幕检测
- Logistic视频字幕增强模型被引量:1
- 2014年
- 目的为提高复杂背景下的视频字幕在光学字符识别(OCR)中的识别率,需要对提取的视频字幕进行有效地字幕增强。首次将Logistic模型应用到视频字幕增强中,提出了基于Logistic模型的融合多帧信息的视频字幕增强方法。方法对字幕进行检测与跟踪,将出现在连续多帧中的同一字幕片段进行对齐;通过分析字幕片段在多帧中信息,提出字幕背景在时域上的变化特征、背景和字幕文本的固有特征,并将3个特征进行量化与融合,构建适用于字幕增强的Logistic模型,实现对视频字幕的增强。结果对含阴影或描边效果的特殊复杂背景字幕、普通复杂背景字幕、单一背景字幕分别进行实验,增强后的字幕在OCR软件中的识别正确率分别为81.76%、97.13%、98.19%,与对比方法比较均有一定的提高。结论实验结果表明,本文方法既可以降低字幕背景的复杂度,又可以提高字幕背景与文本的对比度,从而可以对复杂背景和单一背景下的视频字幕进行有效地增强。
- 李钦瑞吕学强李卓刘坤
- 关键词:LOGISTIC模型