陈松华
- 作品数:2 被引量:16H指数:2
- 供职机构:国家信息中心更多>>
- 相关领域:自动化与计算机技术更多>>
- 关于贝叶斯推理的垃圾邮件特征选择评估函数被引量:5
- 2008年
- 在各种基于机器学习的垃圾邮件过滤系统中,特征选择是基础且非常关键的一个环节,它对整个系统的性能和效率都有直接的影响。通过对垃圾邮件特点的分析,提出了一种基于贝叶斯推理的特征选择评估函数方法。新方法运算开销较小,且能够区分出不同的特征词在体现垃圾邮件特征时所存在的差异性,因而在进行特征选择时较其它常用方法更具针对性,非常利于提高过滤系统的准确性和运行效率。
- 闫鹏郑雪峰李明祥陈松华
- 关键词:反垃圾邮件贝叶斯推理
- 二值文本分类中基于Bayes推理的特征选择方法被引量:12
- 2008年
- 针对二值文本分类算法中的特征选择问题,本文提出了基于贝叶斯推理的评估函数算法来替代常用的、以IG或MI为评估函数的算法;同时,提出了以评估函数值的累计贡献率表示置信度,并以此确定特征选择维度的可量化的方法。对比实验显示,本文提出的新方法具有简便易行、高效实用的优点,此算法不仅对文本分类问题,对其它各类二值分类问题中的特征选择方法研究也都具有很好的参考、借鉴价值。
- 闫鹏郑雪峰李明祥陈松华
- 关键词:数据挖掘贝叶斯推理文本分类