于江德
- 作品数:58 被引量:182H指数:9
- 供职机构:安阳师范学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金河南省高等学校青年骨干教师资助计划项目更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论农业科学更多>>
- 基于隐马尔可夫模型的中文文本事件信息抽取被引量:19
- 2007年
- 提出了一种基于隐马尔可夫模型的中文文本事件抽取方法,该方法首先通过触发词探测从文本中发现特定的候选事件语句,然后利用隐马尔可夫模型从这些语句中抽取每个候选事件的事件要素,为每一类事件要素构建一个独立的隐马尔可夫模型用于该类事件要素的抽取,构建模型的关键是模型结构的学习和参数估计。实验结果表明,该方法能较好地实现中文文本事件抽取,较其他方法有更好的抽取性能。
- 于江德肖新峰樊孝忠
- 关键词:隐马尔可夫模型事件信息抽取
- 中医方剂知识发现与症状鉴别智能诊断系统
- 王爱民杨新新朱石焕宋强睢丹连林芳张建军宋艳霞贾开文于小亿于江德薛笑荣葛文英王瑞庆栗青生
- 项目有安阳师范学院、安阳工学院、安阳中医院、安阳地区医院、安阳市第六人民医院等6个单位,39位研究人员经过近6年的努力联合开发的。课题组主要研究者有15人组成,其中教授(主任医师)7人、副教授(副主任医师)5人、中级职称...
- 关键词:
- 关键词:中医方剂中药理论
- 基于Ultra Search的桌面搜索设计与实现被引量:2
- 2007年
- 提出一种基于Ultra Search的桌面搜索设计和实现方案,简要介绍了Ultra Search体系架构和各个组件的功能,然后给出该桌面搜索的框架和各个组件的实现细节,并和多个桌面搜索工具在相同的数据源上进行测试,结果表明,该桌面搜索有不错的搜索性能。
- 于江德樊孝忠尹继豪
- 关键词:桌面搜索ULTRASEARCH个人计算机索引
- 基于条件随机场的汉语词性标注被引量:6
- 2011年
- 近年来条件随机场广泛应用于各类序列数据标注中,汉语词性标注中应用条件随机场对上下文建模时会扩展出数以亿计的特征,在深入分析特征产生机理的基础上对特征模板集进行了优化,采用条件随机场进一步研究了汉语词性标注中设定的特征模板集、扩展出的特征数、训练后模型大小、词性标注精度等指标之间的关系.实验结果表明,优化后的特征模板集在模型训练时间、训练后模型大小、标注精度等指标上达到了整体最优.
- 于江德葛彦强余正涛
- 关键词:汉语词性标注条件随机场上下文
- 三位一体字标注的汉语词法分析被引量:4
- 2015年
- 针对汉语词法分析中分词、词性标注、命名实体识别三项子任务分步处理时多类信息难以整合利用,且错误向上传递放大的不足,该文提出一种三位一体字标注的汉语词法分析方法,该方法将汉语词法分析过程看作字序列的标注过程,将每个字的词位、词性、命名实体三类信息融合到该字的标记中,采用最大熵模型经过一次标注实现汉语词法分析的三项任务。并在Bakeoff2007的PKU语料上进行了封闭测试,通过对该方法和传统分步处理的分词、词性标注、命名实体识别的性能进行大量对比实验,结果表明,三位一体字标注方法的分词、词性标注、命名实体识别的性能都有不同程度的提升,汉语分词的F值达到了96.4%,词性标注的标注精度达到了95.3%,命名实体识别的F值达到了90.3%,这说明三位一体字标注的汉语词法分析性能更优。
- 于江德胡顺义余正涛
- 关键词:汉语词法分析最大熵模型
- 基于组块分析技术的中文机构名称识别被引量:5
- 2006年
- 针对中文机构名称自动识别提出了简化的一体化N最佳层叠模型,该模型实现了从汉语切分、词性标注、组块分析一直到机构名称的自动识别.N最佳层叠方法既能够在一定程度上抑制前一个阶段的错误在后面的传播,又大大地缩小了搜索空间.在实验过程中依次加入启发信息和机构名称缩写处理,使得实验结果有显著提高.在IEER99测试集上,中文机构名称识别的最终准确率和召回率分别为92.31%和81.01%.
- 尹继豪樊孝忠赵攀超于江德
- 关键词:组块分析启发信息
- 一种八孔梨形埙
- 本实用新型涉及一种八孔梨形埙,包括埙体,在埙体顶端吹口处设有吹孔,音孔的边缘设有用于判断埙使用状态的压力传感器,埙体的下方设有依次连接的计时器、控制单元以及无线传输单元,计时器与压力传感器连接,用于记录学生练习的时间并将...
- 梁燕军史小松于江德张占豪
- 文献传递
- 一种汉语选词填空方法
- 本发明公开了一种汉语选词填空方法,包括以下步骤:S1、从一给定的训练语料中获得词语特征及其出现的频次;S2、切分要进行汉语填空的汉语句子:将待填空的汉语句子切分为词语序列;S3、计算比较待填空的汉语句子所对应的词语序列条...
- 于江德李学钰王希杰武宇浩武肖菡张春雨常银辉
- 受限领域中文文本内容主题概念识别研究被引量:1
- 2004年
- 该文尝试利用领域知识库,实现受限领域中文文本内容主题概念识别,并尝试利用领域概念建立特征向量,实现受限领域文本与主题概念的相关度计算。其中,利用领域知识库进行主题特征识别,利用知识库中概念间的关系进行特征项权重的计算,并利用knn算法进行文本与主题概念的相关度计算。实现了基于词汇分析技术和基于领域知识计算相结合的方式下,受限领域中文文本内容主题概念的识别和文本与主题概念的相关度计算。实验结果显示,主题识别平均正确率为79%文本与主题概念的相关度计算的正确率达到62%。
- 顾益军于江德刘群樊孝忠
- 关键词:向量空间模型主题领域知识
- 词位标注汉语分词中特征模板定量研究被引量:4
- 2012年
- 基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,得到如下结论:同等条件下,训练出的模型大小与扩展出的特征数成正比;不同的单字特征模板在同一语料中扩展出的特征数基本相同,单字特征模板对分词性能的贡献要比双字特征模板小得多;增加B特征模板之后,训练时间大大增加,模型大小基本不变,对分词性能都是正增长。
- 于江德王希杰樊孝忠
- 关键词:汉语分词词位标注条件随机场