天津市应用基础与前沿技术研究计划(13JCYBJC15400)
- 作品数:2 被引量:3H指数:1
- 相关作者:石陆魁周浩王靖鑫马春娟张军更多>>
- 相关机构:河北工业大学更多>>
- 发文基金:天津市应用基础与前沿技术研究计划河北省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于特征词相交和流形学习的文本分类方法被引量:1
- 2014年
- 针对文本分类中特征空间的高维性导致的"维数灾难"问题,提出了一种基于流形学习的文本分类模型,该模型利用流形学习算法对高维文本特征数据降维后再分类.同时针对夹角余弦中存在的相似性偏移问题,提出了一种新的文本相似性度量措施——特征词相交距离,其实质是计算两个文档中所包含的特征词的交集,并将该措施作为流形学习算法中选择邻域的依据.实验结果表明,特征词相交距离较好地表达了文档之间的相似性,利用基于特征词相交的流形学习算法对文本数据降维后再分类,在保证分类精度的前提下极大地提高了分类算法的执行效率,克服了采用欧式距离和夹角余弦选择邻域造成低维流形的扭曲从而导致的分类精度降低的问题.
- 石陆魁王歌杨璐张军
- 关键词:文本分类流形学习
- 基于流形学习的面向对象的软件缺陷预测模型被引量:2
- 2014年
- 针对传统软件缺陷预测方法在预测面向对象的软件缺陷时存在的不足,提出一种基于流形学习的面向对象的软件缺陷预测模型。结合拉普拉斯特征映射法和分类方法,利用拉普拉斯特征映射法,对待预测的软件属性度量数据进行降维处理,得到其低维特征;利用分类算法,从低维特征数据中预测软件存在的缺陷。实验结果表明,该方法有效提高了面向对象的软件缺陷预测精度,也提高了算法的执行效率。
- 石陆魁马春娟王靖鑫周浩
- 关键词:软件缺陷预测流形学习面向对象