张述祖
- 作品数:5 被引量:15H指数:2
- 供职机构:解放军理工大学理学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于散度差组合型文本特征降维方法
- 2009年
- 提出了一种基于散度差的组合型文本特征抽取方法.首先讨论了文本分类中特征降维的主要方法及其特点,然后分析了基于散度差的准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度减少信息损失的前提下实现了特征维数的大幅度降低.实验结果表明,该方法在文本分类上的效率较好.
- 刘海峰姚泽清王元元张述祖
- 关键词:文本分类特征抽取特征降维散度差
- 文本分类中基于散度差的线性特征抽取方法
- 2009年
- 分析了特征选择与特征抽取的特点与不足,针对Fisher线性鉴别准则存在问题,在一种加权散度差线性鉴别准则的基础上提出了一种基于散度差与SVD相结合的文本特征抽取方法。在解决了类内散布矩阵的奇异性问题困扰同时,通过对低阶矩阵的奇异值分解取代了对高阶矩阵的特征值求解,计算量大大减少。在最低限度减少信息损失的前提下实现了特征维数的大幅度减缩。试验结果表明,这种方法在文本分类上的准确性较好。
- 刘海峰王元元姚泽清张述祖
- 关键词:文本分类特征抽取特征降维散度差奇异值分解
- 文本分类中一种混合型特征降维方法被引量:12
- 2009年
- 提出一种基于特征选择和特征抽取的混合型文本特征降维方法,分析基于选择和抽取的特征降维方法各自的特点,借助特征项的类别分布差异信息对特征集进行初步选择。使用一种新的基于PCA的特征抽取方法对剩余特征集进行二次抽取,在最大限度减少信息损失的前提下实现了文本特征的有效降维。对文本的分类实验结果表明,该特征降维方法具有良好的分类效果。
- 刘海峰王元元姚泽清张述祖
- 关键词:文本分类特征抽取主成分分析
- 文本分类中一种基于核的最大散度差特征抽取方法
- 2009年
- 研究了一种基于核的最大散度差准则的文本特征抽取方法。首先回顾了文本分类中特征降维的主要方法、Fisher准则及其相关研究进展以及存在的问题;然后分析了基于散度差准则的线性鉴别方法的优点与不足,借助于核函数较好地解决了线性可分性较差的样本分类问题,在最低限度减少信息损失的前提下实现了特征维数的大幅度减缩。实验结果表明,该方法在文本分类上的效果较好。
- 刘海峰姚泽清张述祖王元元
- 关键词:文本分类特征抽取特征降维核变换
- 一种基于散度差组合型文本特征降维方法被引量:3
- 2008年
- 讨论了文本分类中特征降维的主要方法及其特点,分析了基于散度差准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度减少信息损失的前提下实现了特征维数的大幅度降低.试验结果表明,这种方法在文本分类上的效率较好.
- 刘海峰姚泽清王元元张述祖
- 关键词:文本分类特征抽取特征降维散度差