张虎
- 作品数:110 被引量:172H指数:7
- 供职机构:山西大学更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信理学更多>>
- 法律文书命名实体识别研究进展
- 2024年
- 实现“数字法治,智慧司法”是我们一直以来的宗旨和目标,为了加速推进智慧法院建设工作,为后续相关研究提供参考与借鉴,本文归纳梳理了法律文书命名实体识别的相关研究成果。首先介绍了智慧司法的重要性及针对法律领域探索命名实体识别任务的必要性;然后对现有法律文书命名实体识别中的实体类型、实体标注方式、信息抽取评测任务中使用的数据集及常用评测指标等进行了整理;并从基于深度学习的命名实体识别方法、基本模型框架及基于命名实体识别的下游任务等多个方面总结了法律文书命名实体识别的发展历程;最后从命名实体识别数据集及研究方法等角度指出了现存问题和未来研究方向。
- 高海慧张虎
- 关键词:法律文书命名实体识别知识图谱
- 一种融合语义场景的摘要自动生成方法及系统
- 本发明属于自然语言处理研究领域,具体为一种融合语义场景的摘要自动生成方法及系统。具体内容如下:一、图构建单元,根据文章中的框架分别构建语义场景图和词关系图;二、文章编码单元,使用预训练模型获取文章的向量表示;三、图编码单...
- 关勇李茹郭少茹谭红叶张虎
- 文献传递
- 一种汉语自监督词义理解方法及系统
- 本发明公开了一种汉语自监督词义理解方法及系统,属于自然语言处理技术领域。通过生成式自监督与判别式自监督两种方式,提高模型对词语具体含义识别的准确性。生成式方式即设计面向词义理解的预训练任务,提升模型对文本中歧义词表示的能...
- 谭红叶金旭李茹张虎
- 规则与统计相结合的分词一致性检验被引量:7
- 2008年
- 建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处理方法相比,该方法更具针对性的对语料库中存在的各种不同的分词不一致现象分别进行处理,能够更加有效的解决分词不一致问题,进一步保证语料库的质量。
- 刘博郑家恒张虎
- 关键词:中文信息处理大规模语料库分词语料库加工
- 一种基于可解释因果模型的司法判决推理方法
- 本发明涉及机器学习、自然语言处理、因果推理等领域,具体涉及一种基于可解释因果模型的司法判决推理方法。包括分析与表示司法数据、定义司法判决推理框架、构建司法判决推理因果模型。其中定义司法判决推理框架包括:提取事实要素、认定...
- 张虎王鑫杨陟卓李茹谭红叶
- 文献传递
- 基于文本知识增强的问题生成模型
- 2024年
- 预训练语言模型在大规模训练数据和超大规模算力的基础上,能够从非结构化的文本数据中学到大量的知识。针对三元组包含信息有限的问题,提出利用预训练语言模型丰富知识的问题生成方法。首先,利用预训练语言模型中丰富的知识增强三元组信息,设计文本知识生成器,将三元组中的信息转化为子图描述,丰富三元组的语义;然后,使用问题类型预测器预测疑问词,准确定位答案所在的领域,从而生成语义正确的问题,更好地控制问题生成的效果;最后,设计一种受控生成框架对关键实体和疑问词进行约束,保证关键实体和疑问词同时出现在问题中,使生成的问题更加准确。在公开数据集WebQuestion和PathQuestion中验证所提模型的性能。实验结果表明,与现有模型LFKQG相比,所提模型的BLUE-4、METEOR、ROUGE-L指标在WebQuestion数据集上分别提升0.28、0.16、0.22个百分点,在PathQuestion数据集上分别提升0.8、0.39、0.46个百分点。
- 陈佳玉王元龙张虎
- 关键词:自然语言理解知识图谱
- 一种基于多层知识感知的地址实体识别方法
- 本发明属于自然语言处理领域,具体涉及一种基于多层知识感知的地址实体识别方法。本方法结合地址实体识别在知识图谱构建过程中需要面对的应用场景,设计并提供了基于多层知识感知的地址实体识别方法,从地址实体识别的角度出发,依据地址...
- 李茹高俊杰邵文远谭红叶张虎闫智超苏雪峰张越梁吉业
- 阅读理解中因果关系类选项的研究被引量:3
- 2018年
- 针对阅读理解选择题中因果关系类选项,该文提出了基于因果关系网的因果关系支持度分析方法。首先,通过线索短语从阅读材料中抽取因果事件对,并计算事件对之间因果关联强度,综合利用抽取到的因果事件对与其对应的因果关联强度构成因果关系网;其次,综合考虑了选项中的每个词在文档中的重要性和整个文档中的区分能力,采用词频一逆向文件频率(term frequency-inverse document frequency,TF—IDF)方法分别从原文中检索与选项中因事件和果事件相关的句子;最后,基于因果关系网和抽取到的相关句计算选项的因果关系支持度。为了验证该方法,实验采用了769篇模拟材料和13篇北京高考语文试卷材料(包括原文与选择题)作为测试数据集,实验结果表明该方法的准确率比Baseline方法提高了约11%。
- 王元龙李茹张虎王智强
- 关键词:自然语言处理语义相似度
- 内容增强与时间匹配的兴趣点推荐方法被引量:5
- 2020年
- 针对目前兴趣点推荐对影响用户签到决策因素的全面分析不足,很少将评论情感识别与时间因素分析同时融入推荐框架等问题,探索一种兴趣点推荐的改进方法。在分析地理位置与社交关系对用户签到行为影响的基础上,将评论内容与签到时间两个因素同时融入到推荐中,集成兴趣点的类别与流行度信息。使用自然语言处理技术挖掘评论文本的情感倾向,用于调整用户签到偏好估计;通过建模用户活动时间规律与兴趣点时间流行度,将时间因素融入推荐模型,向用户推荐Top-N兴趣点。基于Foursquare真实签到数据集的对比实验结果表明,与目前主流方法相比,该模型在精确率和召回率上均有明显提升。
- 陈炯张虎
- 关键词:情感倾向社交关系
- 一种基于事实检索和验证增强的可解释问答方法及系统
- 本发明公开了一种基于事实检索和验证增强的可解释问答方法及系统,属于自然语言处理技术领域。针对目前结构树生成面临的搜索空间较大和错误累积的问题,本发明提供了一种基于事实检索和验证增强的可解释问答系统包括事实检索模块、双向推...
- 范越张虎赵云肖王宇杰张广军李茹梁吉业