张学仁
- 作品数:21 被引量:122H指数:8
- 供职机构:解放军理工大学理学院更多>>
- 发文基金:国家自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术理学文学文化科学更多>>
- 基于潜在语义空间的文本检索问题研究被引量:12
- 2007年
- 本文针对潜在语义空间模型下文本检索存在的问题进行了研究;对LSI/SVD方法的理论及问题进行探讨,对文本—特征项矩阵加权方式进行了改进,对文本的聚类提出了k-means截尾算法,对原始向量空间降秩后的语义空间维数的确定提出了解决方法。
- 刘海峰王元元张学仁
- 关键词:聚类位置加权
- 区间混合判断矩阵及其排序方法被引量:10
- 2006年
- 提出了区间一致性混合判断矩阵的概念,介绍了区间互反判断矩阵和区间互补判断矩阵之间的转换公式,并且提出了区间混合判断矩阵的排序方法。最后把方法应用于解决虚拟企业的合作伙伴选择问题。
- 徐泽水张学仁
- 关键词:排序虚拟企业
- 一种基于类别信息的文本自动分类模型被引量:3
- 2010年
- 从理论角度分析基于互信息的特征选择方法的不足,提出一种改进的互信息特征选择方法;针对向量空间模型在文本表示方面的问题,使用类别空间模型将文本表示为矩阵,有效利用文本的类别信息,实现一种基于类别信息的文本分类算法。对中文文本的分类实验结果表明,该文本分类方法具有良好的分类效果。
- 刘海峰刘守生张学仁苏展
- 关键词:文本分类特征降维
- Web信息检索模型特点与问题综述被引量:2
- 2009年
- 通过对信息检索的3个经典模型——布尔模型、向量模型、概率模型及其主要的扩展模型进行评述,总结了各种模型的特点、应用途径以及理论上的不足,并探讨解决相关问题的可能途径。
- 刘海峰张学仁刘守生
- 关键词:信息检索向量模型
- 基于VSM的模糊标引文本检索若干问题研究
- 2006年
- 探讨向量空间模型下文本检索存在的问题。在文本聚类模式下提出特征项选取的改进方法:对TF-IDF因子提出位置参数加权模式;对特征项标引问题引进模糊方式:对数据稀疏等问题归纳解决的方法。
- 刘海峰王元元张学仁
- 关键词:向量空间模型聚类位置加权
- 文本分类中一种基于正交变换的特征降维方法被引量:4
- 2008年
- 本文讨论了一种基于正交变换的文本特征降维方法。分析了基于特征选择和特征抽取的特征降维方法各自特点,借助矩阵的分解论证了基于Fisher准则函数的特征降维模式的原理与理论基础,讨论了PCA与SVD两种模式的相互关系。实验结果表明这种特征降维模式在文本分类的准确性方面效果较好。
- 刘海峰王元元张学仁刘守生
- 关键词:文本分类特征抽取特征降维正交变换奇异值分解
- 基于位置的文本特征加权方法研究被引量:10
- 2009年
- TF-IDF是文本特征赋权的常用方法.该方法简单易行,但没有考虑位置因素对特征赋权的影响.通过修改因子,分析不同条件下文本表现形式的差异,提出3个基于位置的文本特征加权方法.随后的文本分类试验表明,此加权模型相比较于传统的方法,均具有较好的文本标注效果.
- 刘海峰姚泽清汪泽焱张学仁
- 关键词:特征加权位置加权文本分类
- Markov链在教育测量中的应用
- 2006年
- 将“问题解决”的分析、建模、求解和检验四个阶段作为随机过程的状态得到一Markov链.利用有关随机过程的知识对Markov链进行分类和求解.由此,对学生解决问题的能力进行测量,得到了一些合理结果.
- 张学仁刘守生
- 关键词:MARKOV链
- 基于散度差准则的文本特征降维研究被引量:8
- 2008年
- 研究了一种基于散度差准则的文本特征抽取方法。首先讨论了文本分类中特征降维的主要方法及其特点,然后分析了一种基于散度差的准则用于特征降维的原理和方法,从理论上对该方法的相关步骤进行了数学论证。在中文文本分类实验中,对KNN分类器进行了基于密度的改进,消除了由于文本分布倾斜对分类器产生的影响。实验结果表明,这种方法在文本分类的准确性方面效果较为理想。
- 刘海峰王元元张学仁刘守生
- 关键词:文本分类特征抽取特征降维散度差KNN分类器
- 基于聚类的VSM模糊标引模式下文本检索问题研究被引量:1
- 2007年
- 本文针对向量空间模型文本检索存在的几个问题进行了研究和探讨。在文本聚类模式下提出了特征项选取的改进方法;对TF-IDF因子提出了位置参数加权模式;对特征项标引问题引进模糊方式;对数据稀疏等问题总结了解决的方法。
- 刘海峰张学仁王倩
- 关键词:聚类位置加权