苏劲松
- 作品数:68 被引量:69H指数:5
- 供职机构:厦门大学更多>>
- 发文基金:国家自然科学基金国家科技支撑计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于语义图的法律文本多跳阅读理解研究
- 2024年
- 目前基于图神经网络的机器阅读理解模型难以有效建模法律文书中的复杂关系。为此,该文提出了基于语义图的法律文书机器阅读理解方法(Semantic Graph Based Reader,SGB Reader)。其核心思想是通过语义依存分析构建以法律关键实体为中心的语义图和句子关系图,然后通过图嵌入来学习法律文书中的复杂关系。除此之外,SGB Reader还设计了两阶段的答案片段预测模块和答案类型联合预测模块来进一步提升模型的性能。实验结果表明,SGB Reader显著优于已有的图网络模型,在CJRC和CJRC 2.0数据集上分别取得了76.97%和65.39%的Joint F1分数。
- 林志强杨帆苏劲松吴旭阳
- 关键词:法律文本
- 基于跨模态检索模型的检索方法及装置
- 本发明提出了一种基于跨模态检索模型的检索方法及装置,该方法包括获取第一跨模数据和对应的第二跨模数据,以便得到成对的训练数据集;建立跨模态检索模型,并采用训练数据集对跨模态检索模型进行训练,其中,跨模态检索模型包括多模态编...
- 苏劲松宋佳庄婉如林渝杰张亮
- 基于图结构的跨文档关系抽取方法、装置、介质及设备
- 本申请的实施例提供了一种基于图结构的跨文档关系抽取方法、装置、介质及设备。该方法包括:针对包含有目标实体对的每一文档,确定各所述文档中每一句子对应的贡献度分数;将各所述文档中贡献度分数符合预定规则的句子输入至BERT编码...
- 苏劲松 岳皓 杨成义 赖少鹏张亮
- 缓解语言对差异冲突的多语言机器翻译模型的训练方法
- 本发明提出了一种缓解语言对差异冲突的多语言机器翻译模型的训练方法,该方法包括:获取训练语料,其中,训练语料包括多个语言对;建立多语言机器翻译模型,并根据训练语料的每个语言对对多语言机器翻译模型进行训练;在训练过程中,计算...
- 苏劲松周楚伦刘鑫王鸿吉
- 一种基于内部语义层次结构的词嵌入表示方法
- 一种基于内部语义层次结构的词嵌入表示方法,涉及基于深度学习的自然语言处理。使用开源工具获得输入文本中每个词语的内部层次结构:该结构类似于传统短语树结构,不同的是以字符为基本单位,并且标注每个字符在该结构中的层次位置和类别...
- 苏劲松杨静阮志伟张祥文
- 基于快速自动密度聚类的可变尺度红外小目标的检测方法
- 基于快速自动密度聚类的可变尺度红外小目标的检测方法,涉及图像分析与图像理解。利用SURF算子解决尺度可变小目标的特征提取。解决特征对于环境的敏感问题;快速自动化密度聚类算法,针对问题域,直接从空域完成轨迹的分割、提取,克...
- 张海英苏劲松刘昆宏白皎刘岩李正洁朱宽赵曌
- 文献传递
- 基于统计抽词和格律的全宋词切分语料库建立被引量:15
- 2007年
- 全宋词切分语料库的建立是计算机研究宋词的基础。本文对宋词中“词”的界定提出了自己的看法,并在综合考虑统计抽词方法和基于诗词格律切分方法各自优点的基础上,提出建立全宋词切分语料库的新方法。我们首先通过统计抽词来抽取结合程度较强的二字词,并结合相关资源建立词表;在此基础上,结合宋词的格律特点按照一定的规则来对全宋词进行了切分。实验证明,本文中的方法具有较好的效果。
- 苏劲松周昌乐李翼鸿
- 关键词:中文信息处理宋词语料库格律
- 基于迭代式双向迁移的神经网络机器翻译模型
- 基于迭代式双向迁移的神经网络机器翻译模型,涉及自然语言处理。通过建立源领域和目标领域之间的多次双向迁移,利用双方的有效交互和相关知识的有益流动,不断完善不同领域的模型能力,从而达到更佳的翻译效果。由一对一的领域迁移推广到...
- 苏劲松曾嘉莉罗斌尹永竞王安特辛春蕾
- 文献传递
- 一种基于层次结构的神经网络机器翻译模型
- 一种基于层次结构的神经网络机器翻译模型,涉及基于深度学习的自然语言处理。使用词语对齐工具GIZA++对训练平行句对进行词对齐,然后根据标点符号和词语对齐信息将源语言句子分为单调翻译的子句;使用上述得到的子句数据来训练子句...
- 苏劲松曾嘉莉尹永竞
- 文献传递
- 一种基于结构化语义嵌入的图像内容自动描述方法
- 一种基于结构化语义嵌入的图像内容自动描述方法,涉及图像内容理解领域。包括以下步骤:获取文本解析树;构建视觉解析树;嵌入视觉解析树。通过对图像进行语义解析获得视觉语义结构树,获取关键的实体以及它们之间的关系,通过新的结构化...
- 纪荣嵘陈福海苏劲松
- 文献传递