北京拓尔思信息技术股份有限公司
- 作品数:180 被引量:332H指数:10
- 相关作者:都云程王弘蔚房祥林春雨付成睿更多>>
- 相关机构:北京信息科技大学北京大学中国电子技术标准化研究院更多>>
- 发文基金:国家自然科学基金北京市教委科技发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学经济管理哲学宗教更多>>
- 图像处理方法、装置、电子设备和存储介质
- 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:获取含有非空白图像区域的待处理图像;对所述待处理图像执行二值化处理,获得二值化图像;自所述二值化图像的一个顶点像素点开始,分别沿相互垂直的两个...
- 程涛肖诗斌李渝勤
- 文献传递
- 基于特征补偿的视频字幕识别研究被引量:2
- 2010年
- 视频中的字幕对多媒体检索技术提供了重要的信息,主要介绍视频字幕识别技术中的特征提取方法。根据字幕不同于印刷体和手写体中常出现的问题,提出了字符位置特征和字符区域笔画分布特征、字符笔画密度特征两种修改过的特征提取方法与传统的字符外围特征结合使用,并进行了实验测试,结果表明这些方法对字幕识别是可行的。
- 梁松涛吕学强施水才王涛
- 关键词:视频字幕特征相似度
- 中文专利文献术语抽取被引量:10
- 2013年
- 为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合。实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%。
- 徐川施水才房祥吕学强
- 基于多尺度条件随机场的文本图像二值化
- 2009年
- 提出一种基于多尺度条件随机场(简称mCRF)的图像二值化算法。该算法将对图像的二值化看作一个标注过程,利用mCRF模型对图像中每个像素点进行标记,从而实现对整幅图像的二值化。mCRF模型属于判别式模型,可以容纳任意的非独立特征,从而充分利用图像本身信息。实验结果表明,本算法比常用的阈值法效果有很大提高。
- 刘坤吕学强王涛施水才
- 关键词:文本图像二值化特征函数
- 基于特征分选策略的中文共指消解方法被引量:2
- 2011年
- 针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的"噪声"。实验结果表明,该中文共指消解方法能提高共指消解的性能,F值达到80.72%。
- 李渝勤甘润生杨永红施水才
- 关键词:共指消解自然语言处理支撑向量机数据词典
- 基于融合词性的BiLSTM-CRF的期刊关键词抽取方法被引量:10
- 2021年
- 【目的】利用CRF模型处理序列标注问题的优势,通过将词性信息和CRF模型融入BiLSTM网络,实现期刊关键词的自动抽取。【方法】将关键词抽取问题视为一个序列标注问题。对期刊文本进行分词和词性标注的预处理;对预处理后的文本使用Word2Vec模型进行Word Embedding向量化,获取字词的向量表达式;使用BiLSTM-CRF模型进行关键词的自动抽取。【结果】使用融合词性的BiLSTM-CRF网络,在采集的知网期刊文本上进行实验,在简单关键词方面,准确率较原始的BiLSTM模型提升3%;在复杂关键词方面,准确率较原始的BiLSTM模型提升12%。【局限】期刊关键词抽取模型无法准确抽取复杂关键词,需要针对复杂关键词层面进一步提升模型性能。【结论】融合词性的BiLSTM-CRF模型与传统方法相比,具有较高的识别准确率,是一种有效的关键词抽取方法。
- 成彬施水才都云程肖诗斌
- 关键词:抽取条件随机场
- 一种音视频在线虚拟剪辑方法和系统
- 本发明提供一种精准的音视频在线虚拟剪辑方法,其包括:步骤S10,音视频对象获取;步骤S20,音视频对象转码;步骤S30,用户在线剪辑;步骤S40,音视频对象准确定位;步骤S50,剪辑关联。将剪辑工具嵌入浏览器,采用流媒体...
- 肖诗斌刘珅
- 文献传递
- C4S2-171:基于MapReduce的术语权重计算方法研究
- 识别在本体构建、词典构建等领域应用广泛,而术语权重计算是术语识别中的关键步骤.本文通过改进TF-IDF公式,将组成术语词条的长度作为权重因素之一,同时考虑术语在文档集中的领域相关性.整个过程基于MapReduce编程模型...
- 王锴施水才王涛吕学强
- 关键词:TF-IDFMAPREDUCE分布式
- 核心的转变——内容管理在传媒信息化中的作为
- 2004年
- 南方报业是我国第一家省级党委机关报组建的报业集团,1998年5日18日成立至今,已迅速形成以报业为主体,横跨出版、信息、印刷、广告、物流配送和实业拓展等产业的媒体军团。
- 施水才陈仕军陈一宏
- 关键词:内容管理传媒信息化信息技术
- 内容管理推动传统媒体与网络协调发展
- 2004年
- 2004年舂,国家提出了坚持以人为本,全面、协调、可持续的科学发展观,近日,江苏铁本事件的查处也充分体现了国家贯彻科学发展观的决心。今天,我们用科学的发展观来解读网络媒体的发展,豁然觉得这是一个非常适合指导网络媒体发展的科学理论。
- 郭军
- 关键词:内容管理网络网络媒体传统媒体传媒业