梁韬
- 作品数:6 被引量:12H指数:2
- 供职机构:湖南工业大学计算机与通信学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金湖南省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于粗糙集的微博文本特征选择方法被引量:4
- 2013年
- 对中文微博中主客观分类特征的选取进行了研究。通过词典与统计相结合的方法提取了基础情感词、语气词、程度词等8个候选特征。对提取的候选特征,提出了一种基于粗糙集与概率加权的特征选择算法,通过该算法最终选取了基础情感词、!或!、网络观点词、语气词、形容词、程度词作为分类特征。实验结果表明,提出的方法能达到较好的分类效果。
- 杜锐朱艳辉鲁琳邓程梁韬
- 关键词:粗糙集
- 基于三支决策的中文微博观点句识别研究
- 微博观点句识别是对微博进行观点挖掘和舆情分析的基础,因此观点句识别的准确率对后续研究工作至关重要。本文提出了一种基于三支决策的中文微博观点句识别方法,采用支持向量机分类器,sigmoid 函数计算某条微博属于观点句的概率...
- 田海龙朱艳辉梁韬马进刘璟
- 面向中文微博的评价对象抽取方法研究
- 2014年
- 微博作为当前互联网信息快速传播与分享的新平台,具有信息量庞大、评论多样等特点。针对微博评论信息中的评价对象抽取,采用组块分析和词语位置特征对训练集中3 000条微博观点句的评价对象序列标注,利用条件随机场学习并识别评价对象的名称、属性及其他辅助信息,通过修改相关参数达到最优识别效果,并提出针对复杂观点句评价对象的提取算法。实验结果表明,对测试集中7 000条微博观点句进行评价对象的名称和属性的抽取,效果较好。
- 鲁琳朱艳辉杜锐邓程梁韬
- 基于三支决策的中文微博观点句识别研究被引量:6
- 2014年
- 微博观点句识别是对微博进行观点挖掘和舆情分析的基础,因此观点句识别的准确率对后续研究工作至关重要。提出了一种基于三支决策的中文微博观点句识别方法,采用支持向量机分类器,sigmoid函数计算某条微博属于观点句的概率,并将基于三支决策的中文微博观点句识别方法与传统支持向量机方法进行对比实验,实验结果表明,基于三支决策的中文微博观点句识别方法取得了很好的识别效果。
- 田海龙朱艳辉梁韬马进刘璟
- 基于词语条件信息量的新词发现被引量:1
- 2014年
- 随着互联网用户群体的不断发展,每天都会有海量的文本产生,会产生很多新词,本文提出一种基于词语信息量特征的新词发现方法,使用CRF(条件随机场)进行新词发现的实验,测试中,实验结果表明取得一定的效果。
- 梁韬张瑞
- 关键词:新词发现条件信息量条件随机场
- 基于LDA的微博热点话题发现研究被引量:1
- 2015年
- 随着微博的广泛应用,每天会产生海量的微博文本,从这些海量的微博文本中快速准确地发现热点话题已经成为微博研究的重点。文章利用LDA模型进行特征选择,降低了数据处理的维度,提高了微博热点话题算法效率。
- 梁韬朱艳辉
- 关键词:LDA