伍朝辉
- 作品数:2 被引量:20H指数:2
- 供职机构:燕山大学信息科学与工程学院更多>>
- 发文基金:河北省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于贝叶斯算法的垃圾邮件过滤技术的研究与改进被引量:13
- 2009年
- 随着电子邮件的应用与普及,垃圾邮件的泛滥也越来越多地受到人们的关注。本文对基于贝叶斯的垃圾邮件过滤器的原理及其关键技术进行了详细的描述。针对朴素贝叶斯模型对分类信息过度简化和准确率低等缺点,通过引入分级的最小风险算法和对多项式和多重贝努利估计模型进行混合的方法分别对贝叶斯过滤器进行了改进,并进行了实验。实验结果表明,改进后的贝叶斯过滤器具有了更好过滤效果。
- 张付志伍朝辉姚芳
- 关键词:垃圾邮件
- 基于TF*IDF的垃圾邮件过滤特征选择改进算法被引量:7
- 2009年
- 随着电子邮件的普及与应用,垃圾邮件的泛滥也越来越受到人们的关注。而如何进行邮件特征选择,是邮件分类中的重要问题。在介绍词频和倒文档频度的基础上,对几种常用的特征选择算法进行了分析和比较,针对现有特征选择算法过于机械的缺点,将关键字权重引入到邮件分类中,提出了一种基于关键词权重的TF*IDF特征选择改进算法,并进行了实验验证。实验结果表明,采用该算法改进后的贝叶斯过滤器具有更好的过滤效果。
- 陈琦伍朝辉姚芳宋秀荣张付志
- 关键词:垃圾邮件过滤器贝叶斯