贾强
- 作品数:2 被引量:9H指数:1
- 供职机构:辽宁石油化工大学计算机与通信工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于改进的TF-IDF文本特征词提取算法研究被引量:8
- 2017年
- 在特征词提取算法中,TF-IDF算法是最常见的特征权重计算方法。在传统TF-IDF算法的基础上,提出新的基于文本词语长度的关键词提取算法。利用中文短语分词技术,识别文本中的长词与普通词汇,对于不同长度的词语利用提出的TF-IDF-WL方法重新计算权重,按权值排序结果得到关键词。实验对比发现,新的特征词提取算法能够更加精确地反映出特征词的词长情况,该算法与传统的TF-IDF算法相比,在准确率和召回率上都有较大的提升。
- 贾强冯锡炜王志峰朱睿秦航
- 关键词:TF-IDF文本预处理文本分类
- 多特征神经网络微博转发预测被引量:1
- 2017年
- 随着社交网络的快速发展,微博已成为一种信息扩散传播的平台。鉴于微博信息扩散的特点,挖掘微博转发过程中的潜在规律对于舆情监控、热点话题追踪、产品营销等有着重要意义。以新浪微博作为数据源,以用户和微博内容作为特征源,引入机器学习中的神经网络预测算法建立预测模型,实现对微博的转发预测。结果表明,与传统预测方法的对比,对微博转发可以做出较高准确率的预测。
- 王志峰冯锡炜贾强朱睿秦航
- 关键词:神经网络BP算法LDA