范明 作品数:99 被引量:351 H指数:9 供职机构: 郑州大学信息工程学院 更多>> 发文基金: 河南省自然科学基金 国家自然科学基金 河南省教育厅科学技术研究重点项目 更多>> 相关领域: 自动化与计算机技术 经济管理 理学 农业科学 更多>>
集成基于EP的分类器用于分类数据流 近年来,数据流挖掘已成为知识发现领域中的一个研究热点.数据流中数据的无限性和概念漂移等特征使得传统的分类算法不能很好地适用于数据流环境.提出了一种基于eEP的分类器集成算法CEEPCE(classification by... 陈崇超 施鸿喜 范明关键词:数据流 文献传递 利用基本显露模式分类稀有类 被引量:2 2005年 提出了一种新的稀有类分类方法,称作VeEPRC。该方法使用一种特殊的EP(基本显露模式,eEP)构造基于eEP的分类器,并对它们“装袋”,建立有效的组合分类器VeEPRC。在UCI机器学习数据库的基准数据集上的实验表明,VeEPRC不仅对稀有类具有较高的召回率和精度,而且具有较高的分类准确率。 范明 刘艳霞关键词:稀有类 装袋 模糊形式概念并行构造算法 被引量:6 2013年 形式概念分析理论已经广泛地应用于计算机诸多领域.当前,模糊概念格直接构造仍然是该领域主要问题之一,其构造过程具有指数级时间复杂度.为了提高模糊概念格构造效率,文中对串行模糊概念构造算法进行并行化改进,将模糊集合组合搜索空间映射为自然数区间,简化了搜索空间表示、划分和遍历过程,进而提出并行模糊概念构造算法(Parallel Fuzzy Next Closure,ParaFuNeC).该算法对搜索空间均匀划分,子搜索空间彼此独立,从而避免并行任务之间同步、通讯等时间耗费,达到提高模糊概念构造效率的目标.时间复杂度分析和实验结果表明该算法在大规模计算任务情况下,加速比随着并行度的提高呈正比增长趋势.另外,串行比例指标表明ParaFuNeC算法在大规模计算任务情况下具有更好的可扩展性. 张卓 柴玉梅 王黎明 范明关键词:模糊集 一种基于基本显露模式的分类算法 被引量:12 2004年 本文提出了一种新的基于EP的分类法CEEP。CEEP仅使用最短的EP(eEP)建立分类器,并使用不同于早先的基于EP的分类法(如,CAEP)的评分标准。文中还讨论了eEP的有效挖掘,最小支持度和最小增长率阈值的自适应选取等问题。在UCI机器学习库中的12个数据集上的实验表明,本文的分类方法具有很好的分类正确率。如何保证eEP有足够的履盖率,以及如何处理稀有类的分类,尚待进一步研究。此外,如何将装袋(bagging)和推进(bootstrap)的思想与CEEP的方法相结合,进一步提高分类的正确率,也是值得深入研究的问题。 范明 刘孟旭 赵红领关键词:分类器 最小支持度 数据集 EP 正确率 非平衡数据集分类方法探讨 被引量:9 2012年 由于数据集中类分布极不平衡,很多分类算法在非平衡数据集上失效,而非平衡数据集中占少数的类在现实生活中通常具有显著意义,因此如何提高非平衡数据集中少数类的分类性能成为近年来研究的热点。详细讨论了非平衡数据集分类问题的本质、影响非平衡数据集分类的因素、非平衡数据集分类通常采用的方法、常用的评估标准以及该问题中存在的问题与挑战。 职为梅 郭华平 范明 叶阳东关键词:非平衡数据集 抽样技术 代价敏感学习 基于概率模型的网页相关度研究 基于内容的网页相关度评价是提高网上信息检索服务质量的核心问题。本文以北大计算语言学研究所构建的名人实体网页语料库为基础,主要研究了中文名人实体网页的相关度评价问题,以满足用户定制的个性化检索需求。作者设计并实现了基于概率... 贾玉祥 昝红英 范明关键词:信息检索 个性化检索 相关度评价 文献传递 香港法律汉英双语语料库XML自动标注 本文报告对汉英双语香港法律条文内容及层次结构特征进行 XML 自动标注的工作。标注好的语料库的整体结构与实际法律逻辑组织结构相同,并且利用标记信息实现条文内容的检索定位。本文的 XML 双语语料标注遵照国际语料库编码标准... 张霞 昝红英 揭春雨 张坤丽 范明关键词:双语语料库 法律条例 一种新颖的基于最有效的跳跃显露模式的分类法 1.引言分类是一种重要的数据分析形式。目前,已经有许多种分类方法,但其中大部分都是内存驻留算法,通常假定数据量很小。随着数据库中数据量和维数越来越大,建立高效的、适用于大型数据库的分类法已成为数据挖掘的一个挑战性问题。1... 李曼 范明关键词:CLASSIFICATION 文献传递 基于逻辑规则的递归查询之自底向上处理 被引量:3 1992年 八十年代中期,数据库技术和人工智能、辑逻程序设计技术的结合导致了一个新的领域——知识库(演绎数据库)的诞生。为了有效地实现知识库,必须有效地处理由逻辑规则表示的查询。这方面的研究看来正在引起逻辑查询处理方法的重大变革。本文简略考察逻辑查询自顶向下和自底向上求值的基本思想,比较其相对优缺点,阐述开发自底向上算法的动机,并着重介绍和评述过去五、六年中开发的以魔集为代表的逻辑查询的自底向上算法。 徐洁磐 范明关键词:递归查询 自底向上 演绎数据库 逻辑规则 查询处理 关系代数 在逐渐缩小的空间上渐进学习朴素贝叶斯参数 被引量:2 2012年 局部加权朴素贝叶斯(LWNB)是朴素贝叶斯(NB)的一种较好的改进,判别频率估计(DFE)可以极大地提高NB的泛化正确率。受LWNB和DFE启发,提出逐渐缩小空间(GCS)算法用来学习NB参数:对于一个测试实例,寻找包含全体训练实例的全局空间的一系列逐渐缩小的子空间。这些子空间具有两种性质:1)它们都包含测试实例;2)一个空间一定包含在任何一个比它大的空间中。在逐渐缩小的空间上使用修改的DFE(MDFE)算法渐进地学习NB的参数,然后使用NB分类测试实例。与LWNB的根本不同是:GCS使用全体训练实例学习NB并且GCS可以实现为非懒惰版本。实现了GCS的决策树版本(GCS-T)实验结果显示,与C4.5以及贝叶斯分类算法(如NaiveBayes、BaysianNet、NBTree、LWNB、隐朴素贝叶斯)相比,GCS-T具有较高的泛化正确率,并且GCS-T的分类速度明显快于LWNB。 欧阳泽华 郭华平 范明关键词:朴素贝叶斯 决策树