上海市科学技术委员会资助项目(055115030)
- 作品数:2 被引量:13H指数:2
- 相关作者:闫华赵泽宇闵可锐赵迎宾刘昕更多>>
- 相关机构:复旦大学更多>>
- 发文基金:上海市科学技术委员会资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 动态调整的Web文档增量聚类算法被引量:2
- 2006年
- 介绍Web文档聚类的应用,针对现有文档聚类算法缺乏动态更新能力、经验参数过多以及缺乏对新词的把握等不足,提出动态调整的Web文档增量聚类(DynamicallyAdjustedIncrementalWebDocumentClustering,DAIWDC)算法,并使用同义词词林优化结果.该算法在实验中达到了88%的正确率和75%的全面率,表明其具有较高的实用价值.
- 闵可锐唐悦胡运发赵泽宇闫华
- 关键词:文档聚类同义词词林
- 互联网话题识别与跟踪系统设计及实现被引量:11
- 2008年
- 针对互联网上论坛和新闻网站发布的海量自然语言文本,该文设计一个话题识别与跟踪系统,将海量的数据分类整理并聚合形成各个话题。该系统的核心采用SVM方法进行文本分类,基于知识库和网络流算法实现话题的聚合,测试结果表明,文章分类的正确率达到92%,聚类的正确率达到88%,具有较高的应用价值。
- 闵可锐赵迎宾刘昕赵泽宇闫华
- 关键词:话题识别与跟踪信息检索支持向量机聚类