徐叶强 作品数:9 被引量:69 H指数:5 供职机构: 湖南工业大学计算机与通信学院 更多>> 发文基金: 湖南省自然科学基金 教育部人文社会科学研究基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于SVM的产品评论属性特征的情感倾向分析 被引量:9 2012年 产品评论的情感倾向性分析是一个很有研究价值的领域,可以帮助客户、商家进行决策。针对产品评论中的属性词和情感词在文本中的各种关系,制定了8组特征选择规则,利用SVM算法训练模型来判断属性词和情感词的搭配识别,进而依据情感词及否定词等分析属性特征的情感倾向。实验结果表明:提出的基于S V M的搭配识别方法,在识别属性特征与情感词的搭配方面具有不错的分类效果。 王文华 朱艳辉 徐叶强 杜锐 鲁琳 邓程关键词:支持向量机 文本分类 中文信息处理 中文产品评论中评价对象的识别研究 被引量:11 2012年 在中文产品评论中利用无监督的识别评价对象,准确率和召回率较低。为此,提出一种中文产品评论中的评价对象识别方法。对特殊词、评价对象非完整性、评价对象非稳定性等情况过滤噪声,利用评价对象在评论文本中与评价短语规则出现频率较高的特征,进行置信度排序。实验结果表明,对于14 799篇数码类评论文章,该方法的准确率、召回率和F值分别为0.605、0.780、0.681。 徐叶强 朱艳辉 王文华 杜锐 鲁琳 邓程 刘洪婧关键词:完整性 稳定性 MEPG-7分块加权主颜色及相关反馈的图像检索方法 被引量:5 2011年 针对MEPG-7主颜色描述符(DCD)无法反映色彩分布的空间信息这一缺陷,采用分块加权主颜色,并在分块加权主颜色的基础上,提出了相应的反馈方法。该反馈方法块间采用基于权重调整的关联反馈算法,块内采用调整主颜色特征值的方法。实验结果表明,该方法较好地解决了主颜色空间分布信息导致的误判,并且加入了相关反馈算法,提高了检索精度。 高立春 徐叶强关键词:MPEG-7 图像检索 中文产品评论中属性词抽取方法研究 被引量:12 2011年 针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于3 623篇手机评论文章,利用该方法可获得1 732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能。 栗春亮 朱艳辉 徐叶强关键词:属性词 一种基于多重词典的中文文本情感特征抽取方法 被引量:10 2011年 情感特征抽取是文本情感分类的重要步骤,正确的选择情感特征并赋予合理的情感权重是保障分类精度的前提。利用基础情感词词典、连词词典及词语距离,提出了一种基于多重词典的中文文本情感特征抽取算法,实验证明该方法优于HM,SO-PMI和词语语义距离等经典的特征抽取算法。 朱艳辉 栗春亮 徐叶强 柳位平关键词:情感特征 基于情感分类的产品评论垂直搜索引擎的研究 随着互联网技术的不断发展,电子商务的不断兴起,BBS、博客、微博的不断涌现,商家与购买者的网上交互日趋频繁。越来越多的购买者在使用产品后,将产品的评论发表在网上,评论的数量与日俱增,评论的本身口语化较多并呈非结构化。商家... 徐叶强关键词:情感分类 垂直搜索引擎 互联网技术 SSH框架 数据库技术 文献传递 基于条件随机场的中文领域分词研究 被引量:14 2016年 针对条件随机场分词不具有良好的领域自适应性,提出一种条件随机场与领域词典相结合的方法提高领域自适应性,并根据构词规则提出了固定词串消解,动词消解,词概率消解三种方法消除歧义。实验结果表明,该分词流程和方法,提高了分词的准确率和自适应性,在计算机领域和医学领域的分词结果 F值分别提升了7.6%和8.7%。 朱艳辉 刘璟 徐叶强 田海龙 马进关键词:中文分词 条件随机场 领域自适应 歧义消解 基于Lucene的海量数据库全文检索的设计与实现 被引量:4 2011年 基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。 徐叶强 朱艳辉 栗春亮 王文华关键词:LUCENE 关系数据库