林琛
- 作品数:29 被引量:247H指数:10
- 供职机构:中国人民解放军南京政治学院更多>>
- 发文基金:国家高技术研究发展计划国家社会科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 微博个体信息传播影响力评价指标分析被引量:14
- 2014年
- 微博已经成为网络舆情产生的重要平台,其中具有强信息传播影响力的个体对网络舆情发展走势有着关键性影响。以3种类型微博个体2013年8月的微博数据作为研究对象,对5种传播影响力评价指标进行分析,发现同一评价指标的有效性具有一定适用范围,并受到微博个体类型的影响。建议在构建新的评价指标或模型时,应充分考虑待评价个体的类型的影响,以有助于提高评价结果的精准性。
- 林琛
- 关键词:网络舆情评价指标
- 基于神经网络和证据理论的离线签名识别被引量:5
- 2005年
- 论文提出了一种有效的基于神经网络和证据理论的离线签名识别方法。利用从签名图象中提取的三种特征分别构造BP神经网络分类器对签名图象进行初步识别,然后将各分类器的输出作为证据,利用证据理论融合来自不同分类器的输出得到最终识别结果。实验表明,该识别方法能有效提高离线签名的识别率。
- 陈刚李弼程林琛
- 关键词:离线签名识别神经网络证据理论
- 整合情报系统资源优势提高网络舆情信息服务质量
- 在分析图书情报领域中网络舆情信息服务研究现状的基础上,结合图书馆在网络舆情信息服务方面的优势,针对存在的“资源分散、重复建设”等问题,提出基于云计算的网络舆情信息服务平台框架,力图整合并发挥图书情报系统资源优势,提高网络...
- 林琛
- 关键词:云计算网络舆情信息资源情报服务
- 一种有效的垃圾邮件过滤新方法被引量:6
- 2006年
- 受到信息粒度原理的启发,给出了一种有效的垃圾邮件过滤新方法。该方法训练过程是将训练样本集合中合法邮件类和垃圾邮件类拆分成四个小类,得到四个小类的类中心向量,从粒度原理角度来看,就是采用更细的粒度来描述训练样本的先验知识。过滤过程则将新进来的邮件分别与四个小类的类中心向量进行相似度比较,最终来判定所属类别。在公共垃圾邮件语料库上测试新方法,同时与目前过滤性能较高的KNN方法进行比较,结果显示新方法具有过滤精度高,过滤速度快等优点。
- 林琛李弼程
- 关键词:垃圾邮件过滤粒度KNN
- 基于关联规则的重要邮箱发现研究被引量:1
- 2008年
- 对重要邮箱发现进行研究,提出一种基于关联分析的重要邮箱发现方法。该方法首先利用经过项集修正的频繁模式增长(FP-Growth)算法,发现频繁通信的邮箱对,再通过用户提供的关键字对邮件内容进行过滤,计算邮箱对的重要度,重要度高的邮箱则认为是重要邮箱。
- 张曼李弼程林琛
- 关键词:频繁模式增长算法数据库更新
- 基于机器学习的网络新闻评论情感分类研究被引量:29
- 2010年
- 首先对网络新闻评论数据的特点进行归纳总结,选取不同的特征集、特征维度、权重计算方法和词性等因素进行分类测试,并对实验结果进行分析比较。对比结果表明:情感词和论据词语搭配效果优于仅使用情感词作为评论特征;另外该类数据中特征维度对分类准确率的影响减小,且TF-IDF权重计算方法仍优于布尔型权重;在词性选择上,名词和动词词性比形容词和副词取得更好的分类效果。
- 周杰林琛李弼程
- 关键词:网络新闻评论中文信息处理情感分类
- 网络舆情态势分析模式研究被引量:17
- 2010年
- 利用军事领域中的战场态势分析与威胁估计思想研究了网络舆情态势分析与预警的基本原理;构建了适合计算机实现的网络舆情态势分析模式,并给出了相应的模式提取技术。实验结果表明,本文构建的网络舆情态势分析模式能够有效地表征和获取网络舆情态势,有助于更深层的分析网络舆情演变的规律,从而采用合适的引导措施。
- 李弼程林琛周杰王允
- 关键词:网络舆情预警
- 一种面向类间交叠的两类文本分类方法
- 本发明公开了一种面向类间交叠的两类文本分类方法,该方法首先形成训练样本向量,对类间交叠区域内的训练样本进行识别,判断其是否处于类间交叠区域内;然后,重新划分训练样本向量集合,在新划分的训练样本向量集合上构建第一层分类器;...
- 李弼程林琛陈刚席耀一郭志刚
- 文献传递
- 基于信息粒度原理的垃圾邮件过滤方法被引量:4
- 2007年
- 信息粒度原理是一种从多个角度来精确描述对象的物理学方法。本文将信息粒度的原理应用到垃圾邮件的过滤中,提出了一种基于信息粒度原理的垃圾邮件过滤方法。通过对原始样本空间更精细的划分来实现对邮件类别的更准确描述。本文在Ling-Spam语料库上进行了试验,结果表明,新方法具有较高的分类精度和良好的处理速度。
- 盛亮李弼程林琛
- 关键词:信息粒度垃圾邮件过滤
- 基于Hash技术的重复性评论检测被引量:4
- 2009年
- 随着互联网技术的迅速发展,论坛已经成为人们获取信息、发表言论的重要场所,但大量的重复评论已成为论坛舆情信息内容获取与监管系统中新的难题,因此对重复评论进行有效检测和消重就至关重要。针对重复评论在一定时间内具有数量大、密度高、内容相似度高的特点,提出了一种基于SHA-1技术的重复评论检测方法。该方法以句和段为粒度块计算评论Hash值,然后统计Hash表中相同的指纹数目以此判断评论之间的相似度,最后依据给出的相似度阈值检测评论是否为重复评论。实验结果表明,该方法可以对重复评论进行有效检测和消重,且优于传统方法。
- 李真林琛李弼程
- 关键词:舆情信息相似度计算HASH表