刘康
- 作品数:116 被引量:357H指数:11
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学天文地球环境科学与工程更多>>
- 对齐增强语义解析方法、装置和计算机程序产品
- 本发明涉及自然语言处理技术领域,提供一种对齐增强语义解析方法、装置和计算机程序产品,所述方法包括:预测知识问答任务中对应对齐关系的短语,并基于对应对齐关系的短语的类型生成对应的查询片段,其中,对齐关系包括短语和对应的查询...
- 何世柱刘康赵军孙润鑫
- 事件抽取方法、装置、电子设备及存储介质
- 本发明提供一种事件抽取方法、装置、电子设备及存储介质,其中方法包括:获取待抽取文档;将所述待抽取文档输入至事件抽取模型,得到所述事件抽取模型输出的所述待抽取文档对应的预测结果;其中,所述预测结果包括多个预测事件,以及每一...
- 陈玉博赵军刘康杨航
- 基于图网络的答案句选择方法及装置
- 本发明涉及自然语言处理技术领域,具体涉及一种基于图网络的答案句选择方法和装置。为了解决现有技术未考虑候选句之间的关联度导致答案选择错误的问题,本发明提出一种基于图网络的答案句选择方法,该方法包括对预先获取的多个第一句子,...
- 赵军张元哲刘康田志兴
- 文献传递
- 基于对抗模仿学习的事件识别及分类方法、系统、装置
- 本发明属于自然语言处理领域,具体涉及了一种基于对抗模仿学习的事件识别及分类方法、系统、装置,旨在解决传统事件识别及分类方法语言处理工具存在错误累计导致事件识别准确率低的问题。本发明方法包括:获取不含标准标注信息的句子并输...
- 陈玉博刘康赵军刘健
- 文献传递
- 融合事实文本的知识库问答方法被引量:1
- 2021年
- 在自然语言问题中,由于知识库中关系表达的多样化,通过表示学习匹配知识库问答的答案仍是一项艰巨任务.为了弥补上述不足,文中提出融合事实文本的知识库问答方法,将知识库中的实体、实体类型和关系转换为事实文本,并使用双向Transformer编码器(BERT)进行表示,利用BERT丰富的语义模式得到问题和答案在低维语义空间中的数值向量,通过数值计算匹配与问题语义最相近的答案.实验表明,文中方法在回答常见的简单问题时效果较优,鲁棒性较强.
- 王广祥何世柱刘康余正涛高盛祥郭军军
- 关键词:问答系统知识库
- 基于大语言模型指导的无监督对话检索器的训练方法
- 本发明提供一种基于大语言模型指导的无监督对话检索器的训练方法,方法包括:获取样本对话查询数据,以及初始对话检索器;基于初始对话检索器,生成样本对话查询数据的回复参考文档;基于大语言模型,确定样本对话查询数据与回复参考文档...
- 曹鹏飞陈玉博刘康赵军金卓然
- 埋入源多道面波分析(MASW)中最小偏移距的估计方法被引量:4
- 2018年
- 多道面波分析(MASW)法是一种被广泛使用的浅层地震勘探方法.为解决埋入源近场效应对MASW法应用的影响,本文分析了埋入源产生的Rayleigh波传播机制,探讨了MASW法的排列参数对地震记录的影响,提出了确定最小偏移距的经验公式.通过对实际地质模型的有限元模拟,验证了经验公式的合理性.在以经验公式为指导的野外实测中,利用多种方法提取了相对可靠的频散曲线,采用基阶和高阶面波联合反演,所得的一维速度结构与钻孔资料具有很强的相关性,表明本文发展的最小偏移距估计方法具有一定的实际应用价值.
- 刘康刘康许强戴靠山许强赵逍游庆瑜
- 关键词:RAYLEIGH波射线理论
- 面向数据权限管理的大语言模型训练方法及装置
- 本发明提供一种面向数据权限管理的大语言模型训练方法及装置,所述方法包括:基于各领域数据,分别对预训练大语言模型进行训练,得到各领域的微调模块参数,并将各领域的微调模块参数存储至指定内存;基于目标用户对各领域数据的访问权限...
- 刘康赵军何世柱叶锦宇
- 信息处理方法及装置
- 本发明实施例公开了一种信息处理方法及装置;所述方法包括:利用评价对象种子、评价词种子以及评价关系种子对深度神经网络进行训练;在第一输入层对候选评价对象、候选评价词以及候选评价关系对应的向量进行连接得到第一输入向量,在第一...
- 刘康刘怀军路彦雄王巨宏刘婷婷徐立恒赵军
- 文献传递
- 基于Beta分布和半监督学习的非确定性知识图谱嵌入模型被引量:1
- 2022年
- 近年来,面向确定性知识图谱的嵌入模型在知识图谱补全等任务中取得了长足的进展,但如何设计和训练面向非确定性知识图谱的嵌入模型仍然是一个重要挑战。不同于确定性知识图谱,非确定性知识图谱的每个事实三元组都有着对应的置信度,因此,非确定性知识图谱嵌入模型需要准确地计算出每个三元组的置信度。现有的非确定性知识图谱嵌入模型结构较为简单,只能处理对称关系,并且无法很好地处理假负(false-negative)样本问题。为了解决上述问题,该文首先提出了一个用于训练非确定性知识图谱嵌入模型的统一框架,该框架使用基于多模型的半监督学习方法训练非确定性知识图谱嵌入模型。为了解决半监督学习中半监督样本噪声过高的问题,我们还使用蒙特卡洛Dropout计算出模型对输出结果的不确定度,并根据该不确定度有效地过滤了半监督样本中的噪声数据。此外,为了更好地表示非确定性知识图谱中实体和关系的不确定性以处理更复杂的关系,该文还提出了基于Beta分布的非确定性知识图谱嵌入模型UBetaE,该模型将实体、关系均表示为一组相互独立的Beta分布。在公开数据集上的实验结果表明,结合该文所提出的半监督学习方法和UBetaE模型,不仅极大地缓解了假负样本问题,还在多个任务中明显优于UKGE等当前最优的非确定性知识图谱嵌入模型。
- 徐遥何世柱刘康张弛张弛赵军
- 关键词:知识图谱半监督学习BETA分布