黎斯达
- 作品数:5 被引量:0H指数:0
- 供职机构:北京大学更多>>
- 发文基金:北京市自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种版式文档中脚注识别方法及脚注与脚注引用关联方法
- 本发明公开了一种版式文档中脚注识别方法及脚注与脚注引用关联方法。本方法为:1)从版式文档中抽取底层信息;2)根据底层信息从该版式文档中识别出候选脚注区域;3)将识别出的每一候选脚注区域构造一特征向量,然后对特征向量进行聚...
- 高良才黎斯达汤帜
- 文献传递
- 一种高效的动态类型转换的实现方法
- 本发明提供一种高效的动态类型转换的实现方法,其步骤包括:编译器对源代码进行解析并构建类继承图、首基类图和首基类链;根据类继承图构建交叉转换域;根据首基类链划分下行转换域;为每个类创建thread表,并存储到编译后的二进制...
- 张超韦韬黎斯达丁羽陈兆丰段镭张利华赵晓濛徐先栋李坤
- PDF文档中的脚注识别研究
- PDF文档的脚注识别问题,提出了一种识别脚注及其在文中的引用,并建立它们之间链接关系的方法.首先针对PDF 文档提取了脚注的一系列特征,包括页面布局、字体信息、语义信息等,然后基于文档部件风格一致性,利用聚类技术处理在不...
- 黎斯达高良才汤帜俞银燕
- 关键词:PDF文档
- 一种高效的动态类型转换的实现方法
- 本发明提供一种高效的动态类型转换的实现方法,其步骤包括:编译器对源代码进行解析并构建类继承图、首基类图和首基类链;根据类继承图构建交叉转换域;根据首基类链划分下行转换域;为每个类创建thread表,并存储到编译后的二进制...
- 张超韦韬黎斯达丁羽陈兆丰段镭张利华赵晓濛徐先栋李坤
- 文献传递
- PDF文档中的脚注识别研究
- 2015年
- 针对PDF文档的脚注识别问题,提出一种自动识别脚注及其引用,并建立它们之间匹配关系的方法。首先针对PDF文档提取脚注的一系列特征,包括页面布局、字体信息、语义信息等,然后基于文档部件风格一致性,利用聚类技术,处理在不同文档中相异但在同一文档中相似的特征,从而使得识别过程能够适应不同文档类型。此外,利用脚注与引用的匹配结果为识别过程提供反馈,进一步提高了识别准确性。在真实文档测试集上的实验结果表明,所提方法对于PDF文档的脚注识别取得较高的准确率和召回率。
- 黎斯达高良才汤帜俞银燕
- 关键词:脚注PDF文档