北京信息科技大学网络文化与数字传播北京市重点实验室开放课题
- 作品数:26 被引量:38H指数:4
- 相关作者:吕学强李卓蔡英施运梅张伟更多>>
- 相关机构:北京信息科技大学北京拓尔思信息技术股份有限公司清华大学更多>>
- 发文基金:北京市教委科技发展计划国家自然科学基金北京市教委科技计划面上项目更多>>
- 相关领域:自动化与计算机技术自然科学总论电子电信更多>>
- Logistic视频字幕增强模型被引量:1
- 2014年
- 目的为提高复杂背景下的视频字幕在光学字符识别(OCR)中的识别率,需要对提取的视频字幕进行有效地字幕增强。首次将Logistic模型应用到视频字幕增强中,提出了基于Logistic模型的融合多帧信息的视频字幕增强方法。方法对字幕进行检测与跟踪,将出现在连续多帧中的同一字幕片段进行对齐;通过分析字幕片段在多帧中信息,提出字幕背景在时域上的变化特征、背景和字幕文本的固有特征,并将3个特征进行量化与融合,构建适用于字幕增强的Logistic模型,实现对视频字幕的增强。结果对含阴影或描边效果的特殊复杂背景字幕、普通复杂背景字幕、单一背景字幕分别进行实验,增强后的字幕在OCR软件中的识别正确率分别为81.76%、97.13%、98.19%,与对比方法比较均有一定的提高。结论实验结果表明,本文方法既可以降低字幕背景的复杂度,又可以提高字幕背景与文本的对比度,从而可以对复杂背景和单一背景下的视频字幕进行有效地增强。
- 李钦瑞吕学强李卓刘坤
- 关键词:LOGISTIC模型
- 基于Hadoop平台的并行特征匹配算法研究被引量:5
- 2014年
- 很多大企业采用Hadoop分布式文件系统来存储海量数据,而传统的病毒扫描主要针对单机系统环境。研究如何并行化病毒扫描中的核心特征匹配算法来处理分布式海量数据。在Hadoop平台下,基于MapReduce并行编程模型来实现大数据高效的病毒扫描,特别是针对Hadoop处理海量小文件效率低的问题,通过将小文件合并,再利用索引来提高海量小文件的处理效率。实验结果表明,提出的并行特征匹配算法可以显著降低处理时间,适用于大数据的病毒扫描。
- 李宝禄张伟
- 关键词:分布式文件系统大数据
- 具有时空约束的强制访问控制模型被引量:3
- 2012年
- 传统的访问控制通过逻辑的方法来防止未授权的信息访问,忽略了物理位置的作用,从而容易遭受地址欺骗类攻击.将位置信息引入访问控制可以提供更好的安全性.在强制访问控制中客体的安全属性与时间密切相关,访问控制模型中应反映客体的安全属性随时间的变化.以经典的Bell-Lapadula模型为基础,提出一个具有时空约束的强制访问控制模型,综合考虑时间和空间约束,在增加访问控制模型灵活性的基础上提高访问控制模型的安全性.
- 范艳芳蔡英耿秀华
- 关键词:强制访问控制
- 个性化搜索中用户兴趣模型匿名化研究被引量:7
- 2013年
- 为了解决个性化搜索技术所潜在的用户隐私信息泄露的问题,提出了用户兴趣模型匿名化方法。首先根据用户兴趣模型之间的相似性将其聚类为满足p-链接性的等价组,然后计算聚类后兴趣条目的权值。所谓的p-链接性是指攻击者根据背景知识链接确定某一用户的概率不超过p。该方法可实现用户兴趣模型匿名化以及兴趣倾向不发生改变,既保护了用户隐私信息,同时也保证了个性化检索性能。实验表明:随着相关结果个数的增多,匿名化后搜索结果的查全率基本能保证在50%以上,另外p-链接性的减小对于查全率的影响并不是太大。
- 李清华康海燕苑晓姣X10NG Li任俊玲
- 关键词:个性化搜索用户兴趣模型隐私保护信息安全
- 基于随机路径点移动模型的MANET容量及延迟分析被引量:1
- 2014年
- 针对已有移动自组网容量、延迟闭解分析在移动模型方面的局限性,提出了新的概率理论框架,将无记忆的独立同分布移动模型推广至更为真实的满足特定记忆条件的随机路径点移动模型,解决了局部移动方式带来的一系列复杂概率描述问题.对多副本两跳中继算法进行了研究,得出该中继模式下基于随机路径点移动模型的移动自组网的容量、延迟上限的精确闭解表达式.仿真实验结果证明了该概率理论框架的有效性及闭解表达式的准确性.
- 王晓菲蔡英范艳芳
- 关键词:移动自组网
- DPENet:轻量化文档姿态估计网络被引量:1
- 2022年
- 现有的用于矫正透视倾斜变形文档的深度学习模型存在空间泛化性差、模型参数量大、推理速度慢等问题。从姿态估计的角度出发,提出一种轻量化文档姿态估计网络DPENet(lightweight document pose estimation network),以优化上述问题。将文档图像中的单一文档视为一个姿态估计对象,将文档的四个角点视为文档对象的四个姿态估计点,采用兼具全连接回归与高斯热图回归优点的DSNT(differentiable spatial to numerical transform)模块实现文档图像角点的高精度定位,并通过透视变换处理实现透视变形文档图像的高精度矫正。DPENet采用轻量化设计,以面向移动端的MobileNetV2为主干网络,模型体量只有10.6 MB。在SmartDoc-QA(仅取148张文档图像)数据集上与现有的三种主流网络进行了对比实验,实验结果表明,DPENet的矫正成功率(96.6%)和平均位移误差(mean displacement error,MDE)(1.28个像素)均优于其他三种网络,同时其平均矫正速度也有良好的表现。在保持轻量化和速度快的条件下,DPENet网络具有更高的变形文档矫正成功率和矫正精度。
- 韩晶吕学强张祥祥郝伟张凯
- 基于用户行为的文档关键词提取方法被引量:1
- 2018年
- 对文档提取关键词时忽略在文档中出现频率不高但对文章具有关键意义的词语的问题,提出一种基于用户行为的文档关键词提取方法。利用结构熵权法为用户对文档的用户行为建模,在提取关键词时,考虑用户行为的影响和文档关键词的位置,并通过实验验证了提出的方法所提取出的关键词具有更高的准确性。
- 王燊施运梅
- 基于轮廓线法的汽车类外观专利图像三维重建被引量:1
- 2015年
- 对立体产品的外观设计专利图像进行三维重建是外观设计专利三维检索的基本前提。结合汽车类外观专利图像的特点,提出汽车类外观专利图像三维重建方法。该方法利用三视图理论及汽车模型的对称性,根据俯视图信息确定主视图与后视图之间在不同高度的距离,进而获取三维空间点坐标;对车轮部分的连接进行特殊处理,并按照子轮廓线连接法构造四角面片,实现三维模型的重建。实验结果表明:1)与传统方法相比错误面片数降低了19.4%;2)重建效果图在外形上与实际物体更为接近。
- 张丹吕学强肖诗斌刘坤
- 关键词:三维重建
- ODQ编译器的设计与优化
- 2015年
- 针对流式办公文档查询语言ODQ(Office Document Query)中,流式办公文档格式繁多,其配套的API依赖于开发平台,且不同版本之间差异较大的问题,对不同流式办公文档格式和版本的API进行封装,为查询不同格式的文档提供了一个简单、统一的查询接口。为了编译ODQ命令,设计了ODQ编译器对ODQ命令进行语法检查、编译、生成执行计划。最后,通过查询结果重用技术和执行计划重用技术对ODQ编译器进行优化。实验证明,这些技术可以有效提高查询效率。
- 刘旭红施运梅
- 关键词:编译器查询优化
- 网络编码中抗污染攻击研究被引量:1
- 2013年
- 网络编码能够达到网络的最大理论容量,由于中间节点的可编码性,使得恶意节点有更多的机会对网络进行污染攻击,扩大了污染信息在网络中蔓延的程度,最终导致网络瘫痪。简要介绍了网络编码和污染攻击的概念,针对网络中采用了网络编码的抵抗污染攻击的研究方案进行了论述,并分别从3个不同的角度对已有研究成果进行了对比和分析。最后,讨论了网络编码中污染攻击研究仍存在的问题,提出了对未来的展望。
- 张玉洁蔡英李卓
- 关键词:网络编码