廖涛 作品数:61 被引量:134 H指数:6 供职机构: 安徽理工大学计算机科学与工程学院 更多>> 发文基金: 国家自然科学基金 安徽省自然科学基金 上海市教育委员会重点学科基金 更多>> 相关领域: 自动化与计算机技术 文化科学 电子电信 更多>>
中文事件触发词的自动抽取研究 被引量:14 2015年 随着自然语言处理领域中信息抽取技术的不断发展,越来越多的学者开始关注事件的识别和抽取研究,其中触发词的识别和抽取是事件识别和抽取的关键。针对目前中文触发词抽取结果的F值不够理想的情况,选用中文事件语料库CEC语料作为训练语料和测试语料,提出了一种基于触发词扩展表和机器学习相结合的触发词抽取方法,实验表明,该方法抽取效果比较理想,F值可达到69.7%。 轩小星 廖涛 高贝贝关键词:自动抽取 应用本体对特征向量降维研究 被引量:4 2010年 在应用SVM对文本进行分类时,用传统的TFIDF算法对文本特征进行选择会产生高维特征向量问题,这个问题干扰了SVM的效率和准确性,使SVM的性能下降。为了解决SVM文本分类过程中产生的这个问题,提出一种基于本体的特征项约简方法。该方法通过本体找出特征向量中具有同义关系、组成关系和上下位关系的冗余特征项,然后对它们进行合并降低特征向量的维数。试验结果表明,采用本体约简特征向量的方法改进了SVM分类器的性能。 孙荣 刘宗田 廖涛 王利关键词:文本分类 本体 支持向量机 特征向量 维数约简 Web表格信息抽取模型的设计与实现 被引量:1 2009年 Web表格作为一种简洁有效的数据信息表达方式,已广泛应用于Web页面中。现提出一种基于表格结构的Web表格信息抽取模型,该模型主要有表格定位模块、表格结构预处理模块和表格信息抽取与重构模块三个模块组成,根据Web表格的结构标记和自定义的启发式规则来抽取表格信息。实验结果表明该模型能够很好地应用于Web表格信息的抽取。 廖涛 刘宗田 孔庆苹关键词:抽取模型 启发式规则 预处理 基于交互式特征融合的嵌套命名实体识别 被引量:3 2022年 现有命名实体识别模型在字嵌入过程中多采用字符向量、字向量等不同单词表示向量的拼接或累加方式提取信息,未考虑不同单词表示特征之间的相互依赖关系,导致单词内部特征信息获取不足。提出一种基于交互式特征融合的嵌套命名实体识别模型,通过交互的方式构建不同特征之间的通信桥梁,以捕获多特征之间的依赖关系。采用交互机制得到包含不同单词表示信息的字嵌入向量,基于双向长短时记忆网络提取单词的表示特征,并对不同单词的表示特征进行交互,捕获特征之间的相互依赖关系。为进一步提取序列特征的上下文信息,采用基于特征交互的多头注意力机制捕获句子上下文的依赖关系。在此基础上,采用二元序列标记法过滤非实体区域,得到粗粒度候选区间,并对其进行细粒度划分以判断实体类别。实验结果表明,该模型的召回率和F1值为72.4%和71.2%,相比现有的嵌套命名实体识别模型,F1值平均提高了1.72%。 廖涛 黄荣梅 张顺香 段松松关键词:特征交互 基于改进YOLOv5的工程场景行人检测方法 被引量:1 2023年 针对复杂工程场景常用的行人检测方法(尤其在小目标检测方面)精度低、复杂度高的问题,提出一种基于YOLOv5网络的改进识别方法。在骨干网络与颈部网络引入ECA注意力机制,提升模型对通道特征的关注度以抑制背景噪声;使用加权双向特征金字塔结构BIFPN对颈部网络进行修改,加强模型对不同尺度特征融合;使用Ghost模块替换骨干网络与颈部网络的部分卷积,减少模型参数、缩小体积。结果表明:提出的改进模型检测精度达到了88.4%,同时,模型的复杂度(参数量与模型大小)仅为13.5×10^(6)与6.67 MB;与目前主流的深度学习方法相比,该算法在检测精度与复杂度上具有更好的性能,在复杂的场景下具有较好的识别效果。 耿帅帅 刘唤唤 廖涛 张顺香关键词:行人检测 多尺度 基于BERT-BiGRU-CRF的电子简历命名实体识别 被引量:6 2022年 针对现有的中文电子简历命名实体识别任务中,模型在训练过程中出现字向量表示单一和无法较好地处理字的多义性问题,提出了一种基于BERT的中文电子简历命名实体识别模型。该模型将电子简历的文本数据通过BERT进行字符级编码,根据上下文语境丰富字的语义信息,有效解决了一词多义的问题;将得到的字向量输入到双向门控循环单元进行特征提取,获取文本的上下文特征;利用条件随机场进行解码并生成标签序列,得到命名实体。实验结果表明,该模型能够有效提高中文电子简历命名实体识别的准确率。 马文祥 廖涛 张顺香关键词:命名实体识别 条件随机场 基于跨度和图卷积网络的篇章级事件抽取模型 2025年 为解决现有的事件抽取方法在实体抽取子任务中难以充分利用上下文信息,导致事件抽取精度较低的问题,提出了基于跨度和图卷积网络的篇章级事件抽取(document-level event extraction based on span and graph convolutional network, DEESG)模型。首先,设计中间线性层对编码的向量进行线性处理,并结合标注信息计算最佳跨度,通过提升对跨度开始位置和结束位置判断的准确度来提高实体抽取的精度;接着,提出异构图的构建方法,使用池化策略将实体与句子表示为图的节点,根据提出的建边规则构建异构图,以此建立全局信息的交互,并利用多层图卷积网络(graph convolutional network, GCN)对异构图进行卷积,获得具有上下文信息的实体表示和句子表示,以此解决上下文信息利用不充分的问题;然后,利用多头注意力机制进行事件类型的检测;最后,为组合中的实体分配论元角色,完成事件抽取任务。在中文金融公告(Chinese financial announcements, ChFinAnn)数据集上进行实验。结果表明,与拥有追踪器的异构图交互模型(graph-based interaction model with a tracker, GIT)相比,DEESG模型的F1分数提升了1.3个百分点。该研究证实DEESG模型能有效应用于篇章级事件抽取领域。 廖涛 牛冰宇关键词:事件抽取 上下文信息 基于篇章级信息特征增强的中文突发事件检测 2024年 事件检测旨在检测句子中的触发词并将其分类为特定的事件类型。针对目前大多数的中文事件检测方法存在篇章内句子间相互依赖信息利用不充分的问题,提出了基于篇章级信息特征增强的中文突发事件检测方法。首先,通过BERT(Bidirectional Encoder Representations from Transformers)预训练语言模型编码字向量,使用平均池化将字向量转换成句子表示信息;其次,利用双向门控循环神经网络(Bidirectional gated recurrent neural network,Bi-GRU)学习句子内和篇章内的上下文隐层信息,接着通过注意力机制(Attention Mechanism)分别得到句子级信息和由若干句子间的相互依赖信息生成的篇章级信息;最后,将篇章级信息融合到句子级信息上后与字向量拼接,再使用条件随机场完成对句子中触发词的识别和标注。实验结果表明,该方法有效的提升了中文突发事件检测效果,F1值达到79.95%。 廖涛 吕玉成 张顺香基于FinBERT和Bi-GRU的篇章级事件检测模型 2024年 现有的篇章级事件检测方法一般分为候选实体抽取和事件检测两个子任务,候选实体抽取任务的精度影响着事件检测任务的结果。针对现有方法候选实体抽取精度不足的问题,提出了基于FinBERT和Bi-GRU的篇章级事件检测模型。首先,采用FinBERT预训练模型提升词嵌入向量对金融语义的表示能力,从而增强模型对金融语义的感知。其次,将上一层获取到的语义表示输入Bi-GRU模型和多头注意力机制中捕获全局和局部特征,通过CRF进行解码并标注出候选实体和实体类型。最后,根据抽取的候选实体信息判断篇章中存在的预定义事件。实验结果表明,本文方法提升了候选实体抽取任务的精度,取得了较好的篇章级事件检测结果。 廖涛 王凯 张顺香一种车站智能存储柜 本发明提供的是一种车站智能存储柜,属于储物柜技术领域。一种车站智能存储柜,包括:指纹输入装置,显示装置,中央处理器,存储器,用户识别装置和柜体。所述中央处理器分别与输入装置,显示装置,存储器,重力传感器,用户识别装置和电... 王旭 廖涛 杨彬 宋杨 勾艳杰 赵猛文献传递