您的位置: 专家智库 > >

张蕾

作品数:5 被引量:0H指数:0
供职机构:重庆理工大学更多>>
相关领域:理学文化科学自动化与计算机技术更多>>

文献类型

  • 3篇专利
  • 1篇学位论文

领域

  • 1篇自动化与计算...
  • 1篇理学

主题

  • 3篇图像
  • 3篇文本
  • 3篇文本特征
  • 2篇多模态
  • 2篇智能技术
  • 2篇数据集
  • 2篇数据集中
  • 2篇文档
  • 2篇文档图像
  • 2篇门控
  • 2篇结构化文档
  • 1篇图像特征
  • 1篇主干网
  • 1篇主干网络
  • 1篇网络
  • 1篇网络模块

机构

  • 4篇重庆理工大学

作者

  • 4篇张蕾
  • 3篇王勇
  • 1篇张梅

年份

  • 3篇2024
  • 1篇2023
5 条 记 录,以下是 1-4
排序方式:
一种用于文档理解的多模态预训练方法
本发明涉及文档阅读技术领域,尤其涉及一种用于文档理解的多模态预训练方法。步骤如下:S1:通过ResNet‑50做主干网络对图像特征提取模块的CNN架构进行改进;S2:采用预训练模型Transformer作为主干模型,通过...
王勇张蕾张梅
基于多模态特征的表单理解研究
近年来,信息电子化已成为必然趋势。表单文档作为一种常见的信息载体,在各个领域得到广泛应用。然而人工完成实体纸质表单信息的处理不仅耗时、耗力,而且可复用性低。如何实现对表单文档的自动精准快速处理对于生产力的提升至关重要。因...
张蕾
一种结构化文档理解模型建立方法
本发明公开了一种结构化文档理解模型建立方法,涉及文档智能技术领域。本发明至少包括S1:将数据集中的图像通过OCR技术提取出文本信息和布局信息后,使用两个自注意力编码器分别单独处理每个模态的信息;S2:采用结合了残差思想的...
姜彬张蕾王勇
一种结构化文档理解模型建立方法
本发明公开了一种结构化文档理解模型建立方法,涉及文档智能技术领域。本发明至少包括S1:将数据集中的图像通过OCR技术提取出文本信息和布局信息后,使用两个自注意力编码器分别单独处理每个模态的信息;S2:采用结合了残差思想的...
姜彬张蕾王勇
共1页<1>
聚类工具0