廖健
- 作品数:14 被引量:40H指数:4
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金山西省回国留学人员科研经费资助项目山西省高等学校科技创新项目更多>>
- 相关领域:自动化与计算机技术社会学文化科学更多>>
- 联合方面注意力交互的图文方面类情感识别
- 2024年
- 随着多媒体的快速发展,单纯采用文本的方面类情感分析,不能准确识别用户所表达的情感。而现有图文数据的方面类情感分析方法仅考虑图文模态间的交互,忽略图文数据的不一致性和相关性。因此,提出联合方面注意力交互网络(JAAIN)模型的图文方面类情感识别方法。所提方法针对图文数据的不一致性与相关性,通过多层次融合方面信息和图文信息,去除与给定方面无关的文本和图像,增强给定方面的图文模态数据的情感表示,将文本数据情感表示、图像数据情感表示及方面类情感表示进行拼接融合与全连接,实现图文方面类情感判别。在数据集Multi-ZOL上进行实验,实验结果表明:所提模型能够提升图文方面类情感判别的性能。
- 赵一成王素格廖健何东欢
- 关键词:多模态融合
- “大思政”理念下高校专业课程思政创新实践——“计算机在化学中的应用”课程被引量:1
- 2024年
- 思政教育框架与专业知识体系的交织交融是深化教育教学改革的关键之一。结合“计算机在化学中的应用”课程的特点,从4个方面进行课程思政创新实践:挖掘并整合相关的思想政治元素;在设计案例时注重强调德育才育相互渗透;在师资体系建设上加强培训和引导,提高师资队伍水平;在实践中不断探索推进多维度教学模式。更好地促进“大思政”改革理念在专业课程中落地生根。
- 马宏廖健
- 关键词:大学专业课程
- 基于观点袋模型的汽车评论情感极性分类被引量:8
- 2015年
- 该文针对网络评论倾向分级问题,提出了一种基于观点袋模型和语言学规则的多级情感分类方法。通过分析句子中的词性搭配关系,设计了12种抽取特征-观点搭配模式,并对存在问题给出了解决策略。依据汉语用词特点和词汇在汽车领域的特殊用法,提出搭配四元组的情感倾向极性值计算方法。在此基础上,利用获取的搭配四元组及其情感倾向极性,建立文本的向量化表示,并构造了权重计算公式。最后,利用文本余弦相似度计算方法实现对评论文本的五级情感极性分类。通过在COAE2012任务3的汽车数据集上进行的测试,取得了较好的分类结果。
- 廖健王素格李德玉张鹏
- 关键词:情感分类
- 融合CNN和结构相似度计算的排比句识别及应用被引量:3
- 2018年
- 排比句具有结构紧凑、句式整齐、富有表现力等鲜明的特点,广泛应用在各种文体之中,在近几年语文高考的鉴赏类问题中也多有考察,但在自动识别方面的研究还鲜有涉及。该文依据排比句结构相似、内容相关的特点,以句子的词性、词语作为基本特征,设计了融合卷积神经网络和结构相似度计算的排比句识别方法。首先将词向量和词性向量融入句子的分布式表示中,利用多个卷积核对其进行卷积操作,设计出基于卷积神经网络的排比句识别方法。利用分句之间的词性串构造相似度计算,设计了基于结构相似度计算的排比句识别方法。同时考虑句子内部的语义相关性和结构相似性,将卷积神经网络和结构相似度计算方法融合,用于排比句的识别。对文学作品数据集和高考题中的文学类阅读材料数据集进行排比句识别实验,验证了该文所提的方法是有效的。
- 穆婉青廖健王素格
- 关键词:排比句语义相关性卷积神经网络
- 基于增强字向量的微博观点句情感极性分类方法被引量:5
- 2017年
- 针对微博观点句识别及情感极性分类任务,提出了基于增强字向量的微博观点句情感极性分类方法.使用单字作为句子表示的基本单元,同时在单字中嵌入了该字所在的词信息以及该词的词性信息,以此训练得到字向量替代传统的词向量融合的句子表示方法.使用基于K-means的方法对向量化的句子进行情感判别,仅需要对文本进行分词和词性标注,无需额外的语言学资源.在COAE2015任务2的微博句子数据集上进行测试,取得了较好的结果.
- 廖健王素格李德玉王杰
- 融合句法信息的实体关系联合抽取
- 2024年
- 实体关系抽取是自然语言处理领域知识图谱构建的关键技术之一,有助于知识图谱自动化更新和扩充,并为下游任务提供重要的知识库支持。目前实体关系抽取方法大多从单一角度进行特征提取,导致特征表达能力不足,同时级联错误累积现象严重,无法较好针对实体关系重叠、实体嵌套现象进行适配,极大地影响实体关系抽取的精度和效率。为了同时解决这些问题,提出了一种融合语义和依存句法信息的实体关系联合抽取方法。该方法采用预训练语言模型BERT提取语义特征;然后利用句法注意力图卷积神经网络获取依存句法特征;最终,融合语义特征和依存句法特征对句子中多个关系的主客实体位置进行预测标记。实验结果表明,所提模型在NYT和WebNLG公共数据集上的F1值分别达到了92.8%和91.1%,与基线模型和其他深度学习模型相比,模型在重叠实体抽取上取得了较好的效果,验证了模型的有效性。
- 胡翼于海郭鑫陈千廖健郑建兴李艳红杨可涵
- 关键词:关系抽取
- 融合词语场景的隐喻情绪识别方法
- 2023年
- 从认知学角度,隐喻情绪由句子中“源语义场景-目标语义场景”词对的情绪场景融合而成。鉴于此特点,该文提出了融合词语场景的隐喻情绪识别模型。该模型借助情绪词典及大规模语料库,构建了词语情绪分布表示获取算法,用于捕获句子中映射词对的情绪分布表示。在此基础上,利用注意力机制与最大池化策略,编码句子的多情绪场景融合表示,以刻画句子情绪形成的诱因。最后,设计情绪分类器,联合句子情绪及上下文表示作为输入,多角度地构建句子的语义,以提升隐喻情绪识别性能。在隐喻情绪数据集上进行实验,与基线模型和最好评测模型进行对比,该文提出的模型在宏F1值上提升了5.74%与2.73%。另外,定性的实例分析解释了词语场景对隐喻情绪识别的作用。
- 陈鑫李旸王素格廖健李德玉
- 关键词:隐喻情绪
- 基于词语相关度的微博新情感词自动识别被引量:4
- 2016年
- 针对微博中新情感词的识别问题,提出了一种基于词语相关度的微博新情感词自动识别方法。首先,对于分词软件把一个新词错分成几个词的问题,利用组合思想将相邻词进行合并作为新词的候选词;其次,为了充分利用词语上下文的语义信息,采用神经网络训练语料获得候选新词的空间表示向量;最后,利用已有的情感词典作为指导,融合基于词表集合的关联度排序和最大关联度排序算法,在候选词上筛选,获得最终的情感新词。在COAE2014(第六届中文倾向性分析评测)任务3语料上,提出的融合算法与点互信息(PMI)、增强互信息(EMI)、多词表达距离(MED)、新词语概率(NWP)以及基于词向量的新词识别方法相比,准确率至少提高了22%,说明该方法自动识别微博新情感词效果优于其他五种方法。
- 陈鑫王素格廖健
- 融合反问特征的卷积神经网络的中文反问句识别被引量:5
- 2019年
- 反问是一种带有强烈情感色彩的表达方式,对其进行自动识别将提升隐式情感分析的整体效率。针对汉语反问句识别问题,该文分析了反问句的句式特点,将反问句的句式结构融入到卷积神级网络的构建中,提出一种融合句式结构的卷积神经网络的反问句识别方法。首先利用置信度大于70%的反问句的特征词、序列模式,对大规模未被标注的微博语料进行初步筛选,获取大量伪反问句。然后通过多个卷积核分别对句子的词向量和反问句的特征进行抽取,获取句子语义特征和反问词特征,将两者共同作用生成句子的表示。最后利用softmax分类器实现句子的分类。实验结果表明,利用该方法对微博中反问句的识别准确率、召回率和F1值分别达到了89.5%、84.2%和86.7%。
- 文治李旸王素格廖健陈鑫
- 关键词:反问句卷积神经网络情感分析
- 大学计算机《自然语言处理》课程思政元素挖掘与实践研究被引量:10
- 2022年
- 专业课程是大学教育核心内容组成,专业课程思政建设既是推进“三全育人”模式、全面落实立德树人教育任务的重要抓手,也是大学课程教学改革的核心要求。结合《自然语言处理》课程特点挖掘思政元素,归纳形成“学现状而强自信”“学发展而懂艰辛”“学前贤而知奋进”“学知识而报国家”等四个思政教育主题。在教学实施中,应着力强化思政元素的提炼与转化、思政渗透教学、全员价值共享以及多元化评价。
- 廖健王素格齐姗
- 关键词:三全育人计算机专业课程