您的位置: 专家智库 > >

教育部人文社会科学研究基金(10YJCZH247)

作品数:7 被引量:128H指数:6
相关作者:周咏梅阳爱民杨佳能林江豪周剑峰更多>>
相关机构:广东外语外贸大学广东省电信规划设计院有限公司更多>>
发文基金:教育部人文社会科学研究基金广东省科技计划工业攻关项目国家社会科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 6篇自动化与计算...

主题

  • 4篇情感词典
  • 3篇情感分类
  • 3篇中文
  • 2篇朴素贝叶斯
  • 2篇情感
  • 2篇情感分析
  • 2篇文本情感
  • 2篇贝叶斯
  • 1篇新闻
  • 1篇新闻评论
  • 1篇用语
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇上下文
  • 1篇排序
  • 1篇情感特征
  • 1篇中文文本
  • 1篇网络用语
  • 1篇文本情感分类
  • 1篇文本情感分析

机构

  • 6篇广东外语外贸...

作者

  • 6篇阳爱民
  • 6篇周咏梅
  • 2篇林江豪
  • 2篇杨佳能
  • 2篇周剑峰
  • 1篇陈锦
  • 1篇王璇璇
  • 1篇蔡泽键

传媒

  • 2篇山东大学学报...
  • 1篇计算机工程与...
  • 1篇计算机工程
  • 1篇计算机与数字...
  • 1篇计算机科学

年份

  • 4篇2014
  • 1篇2013
  • 1篇2012
7 条 记 录,以下是 1-6
排序方式:
面向文本情感分析的中文情感词典构建方法被引量:41
2013年
提出了构建基于HowNet和SentiWordNet的中文情感词典方法。将词语自动分解为多个义元后计算其情感倾向强度,并且使用词典校对方法对词语情感倾向强度进行优化。将所构建词典应用到文本情感分析任务中,使用支持向量机构建文本情感分类器进行实验。实验结果表明,该词典优于一般极性情感词典,为情感分析研究提供了有效的词典资源。
周咏梅杨佳能阳爱民
关键词:情感词典支持向量机情感分析中文文本
基于二元搭配词的微博情感特征选择被引量:6
2014年
分析和监测微博文本中所包含的情感信息,能够挖掘用户行为,为微博舆情监管提供借鉴。但微博文本具有长度较短、不规范、存在大量变形词和新词等特点,仅以情感词为特征对微博进行分类的方法准确率较低,难以满足实际使用。为此,基于微博语料构建二元搭配词库,并根据PMI-IR算法结合语料库统计信息,提出搭配词组情感权值的计算方法PMI-IR-P。结合情感词典,采用统计方法生成微博情感特征向量,利用机器学习中的C4.5算法构建分类模型,对微博文本进行情感倾向分类。分别使用不同的数据集用于构建搭配词库及分类模型,并与基于情感词典的分类方法以及朴素贝叶斯分类方法进行对比。实验结果表明,提出的情感特征通过运用C4.5算法对微博文本情感分类的准确率达到87%,具有较好的效果。
周剑峰阳爱民周咏梅王璇璇
关键词:C4
一种新闻评论情感词典的构建方法被引量:21
2014年
情感词典研究是文本情感分析领域的一个重要内容;基于情感词典的文本情感分析方法是一种非常有效的方法。互联网上的新闻评论包含评论人的情感,对其情感进行自动分析研究是非常有意义的。借鉴图排序模型的原理,提出一种新闻评论情感词典构建方法,该方法首先通过新闻评论语料和基础情感词典获得评论情感词集和种子词,然后根据提出的基于PageRank算法的方法判定评论情感词集的极性并计算其强度,进而构建新闻评论情感词典。实验从情感词判定的准确性和基于构建的情感词典的分类性能两个方面验证了所提方法的有效性。
周咏梅阳爱民杨佳能
关键词:情感词典PAGERANK算法新闻评论
基于中文微博的情感词典构建及分类方法被引量:6
2014年
微博情感研究已成为网络文本分析的重要研究领域,微博情感词典是进行微博情感分类的基础。提出一种在分析海量微博语料情感的过程中,自动构建情感词典的方法。方法自动从语料中获取情感词汇、筛选确定情感新词,使用SO-MB算法计算新情感词的情感极性及强度,构建微博情感词典,结合规则对中文微博进行无监督情感分类。实验证明提出的微博情感词典的构建方法及微博情感分类方法是有效的。
周剑峰阳爱民周咏梅
关键词:情感分类
一种基于朴素贝叶斯的微博情感分类被引量:45
2012年
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。
林江豪阳爱民周咏梅陈锦蔡泽键
关键词:文本情感分类朴素贝叶斯
中文微博情感词典构建方法被引量:17
2014年
提出了一种中文微博情感词典构建方法。采用上下文熵的网络用语发现策略,通过TF-IDF(term frequencyinverse document frequency)进行二次过滤得到网络用语;利用SO-PMI(semantic orientation-pointwise mutual information)算法在已标注的微博语料库中计算网络用语的情感倾向值,构建网络用语情感词典;将词典应用到微博情感分类实验,并与朴素贝叶斯分类器的分类性能进行了比较分析。实验结果表明,直接利用微博情感词典的分类效果好于朴素贝叶斯分类器,并具有分类过程简单、快速等优势。
周咏梅阳爱民林江豪
关键词:网络用语情感分析朴素贝叶斯
共1页<1>
聚类工具0