孙承杰
- 作品数:77 被引量:182H指数:8
- 供职机构:哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划哈尔滨市科技创新人才研究专项资金项目更多>>
- 相关领域:自动化与计算机技术文化科学一般工业技术经济管理更多>>
- 基于多任务层投影ERNIE的短文本实体链接及实体分类方法
- 针对中文短文本实体链接任务,将实体链接和NIL 实体概念分类作为两个子任务.基于百度ERNIE 和BERT-PALs,使用飞桨框架实现多任务模型层,即层投影ERNIE.该模型节省多任务场景下模型参数量的同时,提升模型在多...
- 何长鸿孙承杰林磊单莉莉张根宇
- 关键词:多任务
- 基于知识拷贝机制的生成式对话模型被引量:2
- 2021年
- 基于"编码—解码"结构的端到端生成式对话模型所生成的回复多样性差、信息量少,这在很大程度上阻碍了对话的进一步扩展和深入。而知识图谱作为一种高度结构化的知识,能够为对话提供相关知识以及话题转移关系,可以用来提升对话质量。因此,该文提出了一种基于知识拷贝机制的生成式对话模型,首先使用基于知识图谱的映射机制对对话内容进行处理,随后使用知识拷贝机制直接将知识图谱中的知识引入到生成的回复中,并使用注意力机制选择知识图谱中的信息来指导回复的生成。在"2019语言与智能技术竞赛"中的"知识驱动对话"数据集上,相较竞赛举办方提供的生成式基线模型,该文所提出模型生成的回复在字符级别的F1和多样性指标DISTINCT-1上分别有10.47%和4.6%的提升。
- 李少博孙承杰徐振刘秉权季振洲王明江
- 关键词:知识图谱端到端
- 基于查询路径排序的知识库问答系统被引量:6
- 2021年
- 该文提出了一种基于查询路径排序的知识库问答系统。为了将简单问题与复杂的多约束问题统一处理,同时提高系统的准确性,该系统采用基于LambdaRank算法构建的排序模型,对查询路径按照与问题的相关度大小进行排序,选择与问题相关度最高的路径用于抽取答案。同时,该系统还应用了一种融合方法以提高实体识别的准确性。该文所构建的系统在CCKS2019 KBQA任务与CCKS2020 KBQA任务上均取得了较好的效果。
- 宋鹏程单丽莉孙承杰林磊
- 关键词:知识库问答系统排序多约束
- 基于WEB的问答系统数据源构建技术研究
- 问答系统是信息检索的一个新的发展方向,是解决互联网上信息不断丰富与人们从互联网上获取自己需要的信息越来越难的矛盾的有效方法.数据源是问答系统的知识库,它是问答系统的物质基础.该文研究了基于互联网的在线自然语言问答系统中的...
- 孙承杰
- 关键词:问答系统网络爬虫包装器
- 文献传递
- 知识图谱嵌入向量确定方法、装置、电子设备及存储介质
- 本发明提供一种知识图谱嵌入向量确定方法、装置、电子设备及存储介质,涉及知识图谱技术领域,该方法包括:根据图卷积神经网络,确定第一属性节点知识图谱中属性节点的属性嵌入向量和属性节点关系嵌入向量、确定第一实体节点知识图谱的实...
- 刘秉权邱忠银单丽莉孙承杰刘远超林磊
- 面向大型关系型数据库的对话式数据模糊检索方法及装置
- 本发明提供了一种面向大型关系型数据库的对话式数据模糊检索方法及装置,面向大型关系型数据库的对话式数据模糊检索方法包括:获取查询指令;基于预先训练好的文本多标签分类模型,将所述查询指令分类到对应的目标数据库;基于预先训练好...
- 卜坤刘远超刘秉权孙承杰单丽莉林磊
- 文献传递
- 一种基于Top-n-gram的蛋白质远程同源性检测和折叠识别方法
- 一种基于Top-n-gram的蛋白质远程同源性检测和折叠识别方法,涉及一种蛋白质远程同源性检测和折叠识别方法。本发明为了解决现有的蛋白质远程同源性检测和折叠识别方法中,二进制谱无法找到最优阈值,无法区分氨基酸出现频率的差...
- 林磊刘滨孙承杰王晓龙刘秉权刘远超
- 文献传递
- 语句级智能拼音输入技术
- 王晓龙王轩刘秉权陈清财王文敏王平林磊刘远超单丽莉孙承杰汤步洲王磊
- 在本成果出现之前,国内外汉字输入(声音输入、键盘输入及文字识别)停留在以字词为输入单位的阶段。本项目研究以短语或句子为输入单位,采用人工智能最新技术,把国际上两项语言处理技术(统计方法和规则理解方法)在一个理论体系下实现...
- 关键词:
- 关键词:中文输入
- 基于论坛话题段落划分的答案识别被引量:7
- 2013年
- 在论坛话题中识别答案是面向论坛的问答对挖掘中的核心问题.在论坛话题的讨论中通常存在隐式的结构,这种结构信息非常有助于最佳答案的定位和识别.本文提出了一种基于中文论坛话题段落划分的答案识别方法:首先将论坛话题重新组织为若干段落的集合,并基于此划分提取一组能够反映话题讨论逻辑结构的特征.在此基础上给出了一种可以根据候选答案所在段落类别实现模型选择的答案识别策略,从而避免了噪声信息对模型预测的误导.实验结果表明本文的答案识别方法非常适用于面向在线论坛的问答资源挖掘工作.
- 王宝勋刘秉权孙承杰王晓龙孙林
- 基于双重知识交互和多任务学习的对话情绪识别网络模型系统、构建方法、设备及存储介质
- 本申请公开了一种基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质,属于自然语言处理技术领域。解决了现有Emotion Recognition in Conversation(ERC)模型忽...
- 孙承杰解云鹤刘秉权季振洲刘远超单丽莉林磊