栗春亮
- 作品数:5 被引量:103H指数:4
- 供职机构:湖南工业大学计算机与通信学院更多>>
- 发文基金:湖南省自然科学基金教育部人文社会科学研究基金湖南省教育厅科研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 中文产品评论中属性词抽取方法研究被引量:12
- 2011年
- 针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于3 623篇手机评论文章,利用该方法可获得1 732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能。
- 栗春亮朱艳辉徐叶强
- 关键词:属性词
- 中文产品评论观点抽取方法研究
- 随着电子商务和web2.0应用的发展,越来越多的消费者在购买和使用产品之后,喜欢在电子商务网站、论坛、博客发表对产品的观点态度,这些评论包含了用户对产品的特征,功能,性能等的看法,消费者在购买产品之前总会咨询别人对产品的...
- 栗春亮
- 中文基础情感词词典构建方法研究被引量:83
- 2009年
- 词语的情感倾向判别是文章语义情感倾向研究的基础工作。利用中文情感词建立一个基础情感词典,为专一领域情感词识别提供一个核心子集,能够有效地在语料库中识别及扩展情感词集,并提高分类效果。在中文词语相似度计算方法的基础上,提出了一种中文情感词语的情感权值的计算方法,并以HOWNET情感词语集为基准,构建了中文基础情感词典。利用该词典结合TF-IDF特征权值计算方法,对中文文本情感倾向进行判别,实验结果表明,该方法取得了不错的分类效果。
- 柳位平朱艳辉栗春亮向华政文志强
- 一种基于多重词典的中文文本情感特征抽取方法被引量:10
- 2011年
- 情感特征抽取是文本情感分类的重要步骤,正确的选择情感特征并赋予合理的情感权重是保障分类精度的前提。利用基础情感词词典、连词词典及词语距离,提出了一种基于多重词典的中文文本情感特征抽取算法,实验证明该方法优于HM,SO-PMI和词语语义距离等经典的特征抽取算法。
- 朱艳辉栗春亮徐叶强柳位平
- 关键词:情感特征
- 基于Lucene的海量数据库全文检索的设计与实现被引量:4
- 2011年
- 基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。
- 徐叶强朱艳辉栗春亮王文华
- 关键词:LUCENE关系数据库