四川省科技计划项目(2008GZ0003)
- 作品数:49 被引量:215H指数:6
- 相关作者:朱颢东钟勇李红婵马春华周姝更多>>
- 相关机构:中国科学院成都计算机应用研究所中国科学院研究生院郑州轻工业学院更多>>
- 发文基金:四川省科技计划项目四川省科技攻关计划中国科学院西部之光基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 使用特征分辨率和差别对象对集的特征选择
- 2010年
- 特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果。首先简单分析了几种经典的特征选择方法,总结了它们的不足,然后提出了特征分辨率的概念,并提出了一个基于差别对象对集的属性约简算法,最后把该属性约简算法同特征分辨率结合起来,提出了一个新的特征选择方法。该方法首先利用特征分辨率进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明此种特征选择方法效果良好。
- 吴洪丽朱颢东周瑞琼
- 关键词:文本分类属性约简
- 使用类内集中度和分层递阶约简的特征选择方法
- 2010年
- 特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果。首先简单分析了几种经典的特征选择方法,总结了它们的不足,然后提出了类内集中度的概念,紧接着把分层递阶的思想引入粗糙集并提出了一个改进的基于分层递阶的属性约简算法,最后把该约简算法同类内集中度结合起来,提出了一个综合的特征选择方法。该方法首先利用类内集中度进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明此种特征选择方法效果良好。
- 陈吕强朱颢东伏明兰
- 关键词:文本分类分层递阶约简
- 基于关键路径法的软件过程控制模型被引量:1
- 2010年
- 为了增强软件过程控制能力,保障软件产品质量,提出一种基于关键路径法的软件过程控制模型。该模型以过程活动间的网络拓扑结构为基础,在确保工期和关键路径上资源需求的条件下,控制其他活动的开始时间,使得过程中所需的总资源耗费较少,且在此耗费下各活动开始时间较早。在最优耗费的约束下,还给出了一个基于资源竞争链的浮动信息更新算法,以便更新各活动的浮动信息。最后,用实例验证了所提模型的有效性和可行性。
- 高晓徐高峰钟勇
- 关键词:软件过程控制资源均衡
- 结合优化的文档频和LSA的特征选择方法被引量:2
- 2009年
- 为了提高文本分类算法的效率和精度,必须使用特征选择算法来降低特征空间的维数。然而许多常用特征选择算法在选择属性时,只是利用特征的权重而并没有考虑特征之间的隐含关系,使得得到的特征集存在一定的冗余,并不具备较好的代表性。首先给出了一个基于最小词频的文档频方法,并用它过滤掉一些词条以降低文本矩阵的稀疏性,然后使用LSA进行词语间的语义分析,消除同义词和多义词的影响,提高了文本分类的速度与精确度。实验结果表明此种特征选择方法效果良好。
- 朱颢东钟勇
- 关键词:文本分类词频潜在语义分析
- 基于优化的文档频和粗糙集的特征选择方法被引量:5
- 2009年
- 特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频方法,然后把粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择方法.该综合方法首先使用基于最小词频的文档频方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.
- 朱颢东钟勇
- 关键词:文本分类词频属性约简粗糙集
- 产品数据管理中人员配置问题的算法研究
- 通过对产品数据管理中人员配置问题进行深入研究和分析,建立起整数规划数学模型,在借鉴其它算法的基础上,提出了遗传算法,并对算法中的编码方案、适值函数、变异过程进行了详细描述,为人员配置问题提供了新的解决方案。
- 周姝钟勇
- 关键词:产品数据管理遗传算法
- 文献传递
- 基于优化文档频和信息量的特征选择方法被引量:2
- 2009年
- 针对文本分类中几种典型的特征选择方法存在的不足,提出基于优化文档频和信息量的特征选择方法。该方法首先使用优化的文档频方法进行特征选择以降低文本向量的稀疏性,然后利用所提属性的约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明:该方法同3种经典特征选择方法相比,"互信息"和"统计量"以及"信息增益"都要好。
- 张韬朱颢东
- 关键词:词频粗糙集属性约简
- 一种无决策属性的信息系统的属性约简算法被引量:3
- 2010年
- 经典属性约简及其延伸算法是基于有决策属性的信息系统的属性约简算法,它们对无决策属性的信息系统的属性约简无能为力.为此,本文以粗集理论为基础,对无决策属性的信息系统从集合论的论域划分方面进行研究,提出了一种适用于无决策属性的信息系统的启发式属性约简算法.该算法在一定程度上能够解决无决策属性的信息系统属性约简问题,进一步扩展了粗集理论的应用范围.实例表明该算法是有效可行的.
- 朱颢东钟勇
- 关键词:属性约简信息系统集合论
- 基于实时性的Java虚拟机垃圾收集算法被引量:1
- 2010年
- 提出了一种适用于实时性环境的Java虚拟机垃圾收集算法。该算法对增量式收集器中堆空间的划分方式、引用跟踪等方面进行了改进,以减少垃圾收集带来的不确定性暂停,并可以使用户指定一个时间段内垃圾收集导致应用程序暂停的最长时间,从而使其适用于实时性环境。实验结果表明,该算法有效减少了暂停的频率和时长。
- 白江涛钟勇朱颢东
- 关键词:垃圾收集实时性
- 采用种群划分的动态自适应免疫克隆选择算法被引量:3
- 2011年
- 为了克服传统免疫克隆选择算法的种群缺乏多样性、抗体选择不具随机性的缺点,提出了一种新型动态自适应免疫克隆选择算法。在该算法求解过程中,根据抗体的亲和度将抗体种群动态地分为记忆单元和一般抗体单元,以球面杂交方式对种群进行调整并动态修正每个抗体的变异概率,从而保障了群体多样性,加快了算法的全局搜索速度。实例验证了所提算法具有较好的性能。
- 马春华钟勇
- 关键词:免疫克隆选择算法