张坤丽 作品数:71 被引量:197 H指数:9 供职机构: 郑州大学 更多>> 发文基金: 国家自然科学基金 河南省科技攻关计划 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 语言文字 医药卫生 文化科学 更多>>
现代汉语虚词知识库的研究 被引量:30 2007年 现代汉语虚词在句法中所起的作用比较复杂,其个性较强,用法各异。目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于自然语言处理的研究。本文从计算语言学的观点出发,根据目前已有的虚词研究成果以及对真实语料中虚词用法规律的考察,着力构建面向机器的现代汉语虚词用法信息词典和虚词用法规则库,旨在为现代汉语虚词用法的机器识别打下一定的数据基础。 昝红英 张坤丽 柴玉梅 俞士汶关键词:计算机应用 中文信息处理 虚词 语言知识库 规则库 一种面向可重构网的Agent结构 本发明公开了一种面向可重构网的Agent结构,连接管理模块用于管理Agent与端系统、Agent与网络节点以及Agent与其它Agent的连接建立与通信;资源管理模块用于管理网络拓扑资源、节点计算资源、链路带宽资源和节点... 马丁 宋玉 周兵 胡宇翔 胡颖 王瑞民 张坤丽 王国卿 庄雷文献传递 汉语虚词相关的短语边界在句法分析中的应用研究 本文通过在构建汉英双语树库的工作中发现,包含虚词成分的短语边界错误能够影响到句法分析结果,因此本文使用基于规则、CRF 模型和CNN 模型进行虚词相关的短语边界识别研究.针对CTB8.0 的实验结果表明,基于CNN 模型... 冯晓波 穆玲玲 昝红英 张坤丽关键词:CNN 基于多源数据的中文产科知识图谱构建 被引量:4 2023年 以产科专业叙词表、临床路径和诊疗规范等为数据来源构建了中文产科知识图谱(Chinese obstetric knowledge graph,COKG)。以产科疾病为核心,依据术语标准及已有主题词表,确立了概念分类体系及关系描述体系,形成了COKG模式层;在Bi-LSTM-CRF和PCNN模型的基础上,通过医学专家的指导对多来源的200余万字非结构化文本进行人工校对,并对多源数据进行知识融合,形成了COKG数据层。所构建的COKG包括2343种疾病、15249个实体关系,可以为医疗问答系统和智能辅助诊疗等应用提供结构化的知识支持。 张坤丽 胡晨馨 宋玉 昝红英 赵悦淑 赵悦淑关键词:知识图谱 产科 命名实体识别 关系抽取 知识融合 面向数字孪生工程的水利知识图谱构建及应用 被引量:1 2024年 构建水利领域的知识图谱可为数字孪生水利工程建设提供结构化的知识支持。基于黄河小浪底、万家寨水利枢纽预报调度、工程安全、业务规则数据,使用实体识别和关系抽取模型构建面向数字孪生工程的水利知识图谱(KG4DT),并对图谱进行可视化展示。以水利枢纽为核心确定实体分类体系及关系分类体系,构建KG4DT的模式层。使用二次开发的标注平台对非结构化文本进行半自动标注和人工校对,构建KG4DT的数据层。以黄河小浪底和万家寨水利枢纽防洪、减淤、供水、发电业务为主线,结合AC自动机等技术设计知识检索、预案自动生成应用,可为工程运行提供智能决策支撑。 张军珲 张军珲 桂明宇 昝红英 昝红英基于特征融合的产科多标记辅助诊断研究 中文产科电子病历中蕴含着大量的医疗知识和健康信息,针对电子病历的信息抽取及辅助诊断对提高人口的生育健康水平具有重要意义.电子病历中首次病程记录的入院诊断是根据主诉、辅助检查、查体等信息得出的,通常情况下诊断中包含正常诊断... 马鸿超 张坤丽 赵悦淑 昝红英 庄雷关键词:数据清洗 面向医学文本的实体关系抽取研究综述 被引量:14 2020年 实体抽取和关系抽取作为信息抽取的重要子任务,近些年众多学者利用多种技术在该领域开展了深入研究。将这些技术应用于医学领域,抽取非结构化和半结构化的医学文本构建医学知识图谱,可服务于下游子任务。从医学领域实体关系抽取的相关概念出发,从不同角度对深度学习模型进行分类;进而依据数据集的构建方式,对监督学习和远程监督的多实例学习模型进行分析和讨论;最后展望了面向医学文本的实体关系抽取的未来研究方向。 昝红英 关同峰 张坤丽 张坤丽 穗志方关键词:实体关系抽取 脑卒中疾病电子病历实体及实体关系标注语料库构建 被引量:1 2022年 该文探讨了在脑卒中疾病中文电子病历文本中实体及实体间关系的标注问题,提出了适用于脑卒中疾病电子病历文本的实体及实体关系标注体系和规范。在标注体系和规范的指导下,进行了多轮的人工标注及校正工作,完成了158万余字的脑卒中电子病历文本实体及实体关系的标注工作。构建了脑卒中电子病历实体及实体关系标注语料库(Stroke Electronic Medical Record entity and entity related Corpus,SEMRC)。该文所构建的语料库共包含命名实体10594个,实体关系14457个。实体名标注一致率达到85.16%,实体关系标注一致率达到94.16%。 常洪阳 昝红英 马玉团 张坤丽关键词:语料库构建 基于规则的现代汉语常用助词用法自动识别 被引量:6 2011年 目前已有的助词研究成果很难直接应用于自然语言处理的机器识别。在现代汉语词典、规则库、语料库"三位一体"的助词知识库基础上,采用基于规则的方法进行了现代汉语常用助词用法的自动识别。对比规则优化前后的实验结果证明,对用法的规则进行细化、扩充和调序可以有效地提高助词用法识别的准确率和召回率,减轻人工标注的工作量,提高大规模语料库的质量。 韩英杰 昝红英 张坤丽 柴玉梅关键词:助词 知识库 用法 自动识别 面向儿科疾病的命名实体及实体关系标注语料库构建及应用 被引量:17 2020年 当前医学语料库实体及实体关系的分类体系难以满足精准医学发展需求的问题,该文针对儿科疾病开展研究。在医学领域专家的指导下制定了适合儿科学的命名实体和实体关系的标注体系及详细标注规范;融合国内外相关医学标准资源,利用标注工具对298余万字儿科医学文本中实体及实体关系进行机器预标注、人工标注及人工校对,构建了面向儿科疾病的医学实体及关系语料库。所构建的语料库包含504种儿科常见疾病,共标注命名实体23603个,实体关系36513个,多轮标注一致性分别为0.85和0.82。基于该语料库构建了儿科医学知识图谱,并开发了基于知识图谱的儿科医学知识问答系统。 昝红英 刘涛 刘涛 赵悦淑 牛常勇 穗志方关键词:儿科疾病 语料库建设 知识图谱