上海市青年科技启明星计划(10QA1403700) 作品数:8 被引量:22 H指数:4 相关作者: 蒋兴浩 孙锬锋 巢娟 林志高 王琬 更多>> 相关机构: 上海交通大学 上海市信息安全综合管理技术研究重点实验室 更多>> 发文基金: 上海市青年科技启明星计划 国家自然科学基金 教育部“新世纪优秀人才支持计划” 更多>> 相关领域: 自动化与计算机技术 更多>>
基于语义绑定的分层视觉词汇库的图像检索 2011年 提出了一种解析复杂图像语义的模型——分层语义模型,给出了解析复杂语义和构造模型的方法.提出了基于分层语义模型的语义绑定的分层视觉词汇库的概念,给出了构造词汇库的具体方法和步骤,同时对词汇库细节问题给出了解决的方法.将提出的分层视觉词汇库应用于基于内容和语义的图像检索中,并给出了构建图像检索系统的方法和检索图像的步骤.该模型在图像检索中可同时满足基于图像内容的检索方式和基于图像语义的检索方式.实验结果表明,该方法比基于SIFT(Scale Invariant Feature Transform)特征向量的图像检索方法具有更好的性能. 傅光磊 孙锬锋 蒋兴浩关键词:图像语义 图像检索 一种基于音频词袋的暴力视频分类方法 被引量:4 2011年 针对网络视频的监管需求,提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口(MPEG-7)音频特征(包括音频频谱质心,音频频谱带宽等低层音频特征.)及MPEG-7高层特征——音频签名,来构造每段视频特有的音频词汇,采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中,对于不同音频词汇量采用了独特的词汇权重分配机制,同时借助特有的针对暴力视频的分类策略,以提高分类效果.通过3组实验,对不同的音频特征的准确率、不同词汇的分类效果、以及对视觉特征粗分类的精确分类进行了研究.实验结果表明,该方法有较好的查全率. 李荣杰 蒋兴浩 孙锬锋关键词:支持向量机 一种基于空-时快速鲁棒特征的视频词汇的人行为识别方法 被引量:1 2011年 提出了一种空-时快速鲁棒特征(SURF)描述子,并且结合视频词汇概念,应用于人行为识别.这种新的描述子在行为识别应用中能很好地体现视频的时空本质,通过词袋(Bag of Words)模型来表征视频,且在表征过程使用了非硬性权重.实验以瑞典皇家理工学院的行为识别数据集作为测试对象,使用了相关领域传统的分类策略,同时引入了包含二次判断的投票系统.实验结果证明,结合特征描述子和视频词汇的行为识别框架在速度和准确率上均优于已有的一些方法,同时该分类策略在某些行为类型上优于传统的分类方法,能有效地应用于行为识别领域. 冯冰 蒋兴浩 孙锬锋压缩域视频水印的失真漂移补偿算法 2012年 针对H.264/AVC压缩域视频,提出一种新的带有失真漂移补偿机制的鲁棒视频水印算法.该算法通过采用新的漂移补偿机制补偿由于水印嵌入所带来的解码误差,即视频播放时的失真,并针对由水印嵌入可能引起参考块改变的情况进行特殊考虑,避免了失真漂移的进一步扩散.通过选取宏块内尺寸最小的区块进行水印嵌入,利用离散余弦变换的能量集中效应保证受到攻击时的稳定性.实验结果证明,所提出的算法既具有良好的水印不可感知性,又具有良好的抗压缩攻击性,即有损压缩攻击下仍能达到平均80%的检测正确率. 周悦 孙锬锋 蒋兴浩关键词:H.264/AVC 视频水印 漂移补偿 运动矢量 鲁棒性水印 基于融合MPEG-7描述子和二次预测机制的视频自动分类算法 被引量:1 2010年 针对互联网上日益增长的视频数量,提出了一种大量融合MPEG-7描述子并启用二次预测机制的视频自动分类方法.研究了颜色、纹理、形状、运动等9种MPEG-7描述子,从5类视频中提取并融合这些描述子作为视频的整体特征,输入支持向量机(SVM)中进行模型训练和预测.在传统支持向量机的1-1方法中,通过启用二次预测机制来提高分类的准确率.实验结果表明,该方法与其他方法相比有较高的准确率,适合大规模、复杂环境下的视频自动分类任务. 陈斌 蒋兴浩 孙锬锋关键词:视频分类 支持向量机 基于双重检测模型的视频镜头分割算法 被引量:7 2011年 提出一种基于自适应双重检测模型的视频镜头分割算法.该算法分为初检和复检两阶段,初检提出了基于人类视觉特征的非均匀分块的概念,并结合滑动窗口自适应二分查找算法进行镜头边界检测;复检过程利用尺度不变特征变换算法对初检得到的镜头边界进行匹配,排除初检中的误检.视频测试结果表明,该算法对多种不同类型的视频能同时提高切变和渐变镜头边界检测的效果. 巢娟 孙锬锋 蒋兴浩关键词:镜头分割 尺度不变特征变换算法 基于首位数字特征的双重MPEG压缩检测算法 被引量:4 2012年 视频双重压缩检测是检测视频篡改的有效方法,可用于鉴定视频的真实性与可靠性。该文针对离散余弦变换交流系数首位数字的概率分布与对数定律的拟合关系,选取了一种12维的首位数字特征,并采用支持向量机进行双重MPEG压缩的检测。对比实验证明该算法具有较高的准确率和效率。 王琬 蒋兴浩 孙锬锋关键词:数字视频 篡改检测 支持向量机 基于VLC域的H.264/AVC视频流内容级认证水印算法 被引量:5 2011年 针对低比特率的H.264/AVC(Advanced Video Coding)视频流,提出一种新颖的基于VLC(Variable-Length Coding)域的内容级的半脆弱水印认证算法.利用视频VLC域中I宏块的预测方式、CBP(Coded Block Pattern)块编码模式,自适应选取提取特征码的宏块,并根据子宏块上量化后系数的低频能量之间的关系,构建基于宏块级别的内容特征码;鉴于子宏块中拖尾系数的特点,通过修改拖尾系数的编码方式实现半脆弱认证水印的嵌入.实验证明,该算法能保持特征码嵌入前后视频良好的不可感知性以及视频流码率的基本恒定;能有效提高视频水印嵌入容量;可有效实现针对视频内容篡改的宏块级别的检测和定位.该算法可应用于视频内容鉴定,版权保护等领域. 林志高 孙锬锋 蒋兴浩关键词:视频水印 半脆弱水印