李伟
- 作品数:2 被引量:6H指数:1
- 供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 三种分类算法的实验比较被引量:6
- 2004年
- 对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2000篇网上新闻语料分别对3种分类算法作了实验研究.实验结果表明,针对网上新闻而言,混合分类算法性能指标优于另外2种算法.结合实验语料环境,对3种分类算法的适用范围作了分析.
- 蔡巍王永成李伟尹中航
- 关键词:K最近邻算法混合算法
- 一种基于频次统计特性的兼类噪声消除方法
- 2004年
- 本文着重研究了自动分类知识库中因为样本兼类而引起的存在于概念类频中的噪声,提出了借助于统计特性来修正概念类频的算法.在进行理论分析的基础上,本文讨论了算法的实现步骤,并通过对新闻语料的分类实验,检验了降噪效果.实验显示,本方法可以减少兼类概念在知识库中的冗余次数,提高自动分类系统的性能指标.
- 蔡巍王永成尹中航李伟
- 关键词:知识库自然语言处理