王序文 作品数:24 被引量:48 H指数:6 供职机构: 中国医学科学院北京协和医学院医学信息研究所 更多>> 发文基金: 中央级公益性科研院所基本科研业务费专项 国家科技支撑计划 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 医药卫生 文化科学 更多>>
一种医学影像报告生成方法及装置 本发明公开了一种医学影像报告生成方法及装置,包括:获取目标医学影像;基于目标医学影像语义关联模型对所述目标医学影像进行处理,得到与所述目标医学影像对应的多模态主题分布信息;基于所述多模态主题分布信息,生成所述目标医学影像... 王序文 李姣专业数据的标注人员遴选方法、装置和电子设备 本申请公开一种专业数据的标注人员遴选方法、装置和电子设备,本申请基于对标注人员的能力评测构建每一标注人员的用户特征,以及构建每种实体类型的实体类型特征和/或各篇测试文本分别对应的文本主题特征,并根据每一标注人员的用户特征... 李姣 马鹤桐 王序文 徐晓巍一种本体构建方法、装置及计算机可读介质 本申请公开一种本体构建方法、装置及计算机可读介质,本申请通过采用适合的模型自动为待构建的目标本体进行主题范围锁定,并自动在所锁定的主题范围内,对待构建的目标本体进行概念等内容范围的确定,以及通过概念术语的自动映射实现术语... 马鹤桐 李姣 王序文 沈柳 吴萌 王嘉阳机构知识库建设实践研究 被引量:7 2018年 对中国医学科学院/北京协和医学院机构知识库建设理念及阶段性成果进行介绍,通过开展机构知识库建设实践,完成具有医学领域特色的机构成果库以及满足基本功能需求的机构知识门户搭建,就相关支撑机制及未来工作进行讨论。 王序文 李军莲 黄利辉 黄利辉 夏光辉 夏光辉关键词:机构知识库 双语主题跨语言伪相关反馈 被引量:6 2013年 面向跨语言信息检索任务提出了一个引入双语主题的跨语言伪相关反馈模型.将潜在狄利克雷分配模型扩展为能同时对双语文档建模的主题模型,其中每个主题既可以生成源语言词项,也可以生成目标语言词项;为查询式选择相关的双语主题,并利用其中的相关词项对查询翻译进行优化扩展,获得用于二次检索的新查询.实验结果表明,基于该反馈模型的跨语言检索效果优于其他基于单语主题模型和向量空间模型等反馈策略. 王序文 王小捷 孙月萍关键词:跨语言信息检索 查询扩展 医学图像数据的信息标注方法、装置及系统 本发明公开了一种医学图像数据的信息标注方法、装置及系统,该方法获取待标注的医学图像数据;将待标注的医学图像数据输入至图像预标注模型,获得预标注信息,图像预标注模型用于对医学图像数据进行特征提取以获得预标注信息的神经网络模... 李姣 王序文 郭臻 徐晓巍本体融合的方法、装置、电子设备及存储介质 本申请提供了一种本体融合的方法、装置、电子设备及存储介质。其中,在本体融合的方法中,首先获取主本体和待融合本体的本体信息,其中,所述本体信息包括本体中各个节点的语义类型、概念、关系、其他属性。然后通过语义类型匹配、语义类... 马鹤桐 李姣 王序文 沈柳医学图像语义概念识别方法研究 被引量:1 2019年 医学图像语义概念识别是医学图像知识表示的重要技术环节。研究医学图像语义概念识别方法,有助于机器理解和学习医学图像中的潜在医学知识,在影像辅助诊断和智能读片等应用中发挥重要作用。将医学图像的高频概念识别问题转化为多标签分类任务,利用基于卷积神经网络的深度迁移学习方法,识别有限数量的高频医学概念;同时利用基于图像检索的主题建模方法,从给定医学图像的相似图像中提取语义相关概念。国际跨语言图像检索论坛ImageCLEF于2018年5月组织ImageCLEFcaption 2018评测,其子任务'概念检测'的目标是给定222 314张训练图片和9 938张测试图片,识别111 156个语义概念。上述两种方法的实验结果已被提交。实验结果表明,利用基于卷积神经网络的深度迁移学习方法识别医学图像高频概念,F1值为0.092 8,在提交团队中排名第二;基于图像检索的主题模型可召回部分低频相关概念,F1值为0.090 7,然而其性能依赖于图像检索结果的质量。基于卷积神经网络的深度迁移学习方法识别医学图像高频概念的鲁棒性优于基于图像检索方法的鲁棒性,但在大规模开放语义概念的识别技术研究上仍需进一步完善。 王序文 张宇 郭臻 李姣关键词:医学图像检索 主题模型 基于BiLSTM-CRF的中文生物医学开放式概念关系抽取 被引量:4 2018年 目的:利用深度学习方法自动抽取中文生物医学文本中的开放式概念关系,以增强生物医学文本理解及医学知识网络构建。方法:使用BiLSTM-CRF模型从中文生物医学文献数据中抽取以句子上下文短语描述的开放式概念关系,并与基于条件随机场(Conditional Random Fields,CRF)和基于长短时记忆网络(Long Short-Term Memory,LSTM)的方法进行对比分析。结果:基于BiLSTM-CRF的中文生物医学开放式概念关系抽取方法取得F1值为0.5221,显著高于基于CRF模型的方法(F1值为0.2353)和基于LSTM模型的方法(F1值为0.3355)。结论:与单独使用CRF模型或LSTM模型的方法相比,基于BiLSTM-CRF的开放式概念关系抽取方法具有更好的鲁棒性和泛化性,对于生物医学文本理解、医学知识网络构建等研究具有借鉴意义。 王序文 李姣 吴英杰 李军莲关键词:条件随机场 基于英文超级科技词表的文献主题标引系统设计与实现 被引量:7 2014年 针对海量英文文献信息自动化处理问题,构建了一个基于英文超级科技词表的文献主题概念自动标引系统,采用词典与规则方法相结合的术语提取机制,实现了英文文献术语提取、规范概念映射以及优选概念标引等功能,取得了较好的标引效果。 李军莲 夏光辉 王序文 李晓瑛 冀玉静 李赞梅关键词:主题标引