申庆永
- 作品数:4 被引量:16H指数:2
- 供职机构:南开大学信息技术科学学院计算机科学与信息安全系更多>>
- 发文基金:天津市信息化项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于VSVL信用机制的电子邮件系统的设计与实现
- 随着网络的普及,电子邮件与人们的工作生活联系日趋紧密,随之而来的垃圾邮件问题日益严重。目前,基于接收端的过滤技术被广泛应用。但是在接收端处理垃圾邮件无法避免垃圾邮件对网络资源的浪费;接收端过滤技术对新类型垃圾邮件识别能力...
- 申庆永
- 关键词:电子邮件系统信用机制
- 文献传递
- 基于Milter实现的中文垃圾邮件过滤系统
- 2007年
- 提出一种基于内容的中文垃圾邮件实时过滤系统的实现方案,该系统建立在Linux的Sendmail邮件服务器上,通过Milter接口实时提取邮件内容,并结合中文分词及文本分类算法对邮件实施分类和过滤。该系统可嵌入多种文本分类算法,具有良好的可扩展性。通过测试对该系统内嵌入的不同分类算法模型进行了分析和比较。
- 杨洁张建忠申庆永何云
- 关键词:邮件分类中文分词贝叶斯算法K近邻算法
- 基于改进贝叶斯模型的中文邮件分类算法被引量:12
- 2006年
- 通过分析常见的贝叶斯分类方法和实现模型,提出了一种适用于中文邮件的分类算法——基于混合模型的最小风险贝叶斯方法。混合模型将二项独立模型和多项式模型相结合,提高邮件分类的查全率,同时,在此基础上应用最小风险贝叶斯方法,进一步提高准确率。实验表明,应用改进的方法可以得到更准确的邮件分类效果。
- 王宁张建忠何云申庆永徐敬东
- 关键词:邮件分类中文分词混合模型贝叶斯
- 中文垃圾邮件过滤系统中的实时分词算法设计被引量:4
- 2007年
- 在基于内容的中文反垃圾邮件技术中,中文分词是必不可少的一个环节。面对大规模的邮件训练样本和大负载的邮件服务器,中文分词算法的时间效率成为中文垃圾邮件过滤技术中的一个瓶颈。对此,提出一种应用在中文垃圾邮件过滤系统中的实时分词算法。该算法采用一种TRIE树型结构作为词典载体并基于最大匹配的原则,同时,在实时分类阶段结合hash表进行特征查询,极大地提高了系统的时间效率。
- 申庆永张建忠何云杨洁
- 关键词:中文分词垃圾邮件TRIE树