钟富礼 作品数:9 被引量:28 H指数:4 供职机构: 香港理工大学 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 江苏省自然科学基金 更多>> 相关领域: 自动化与计算机技术 金属学及工艺 理学 更多>>
基于移相加权球面单簇聚类的周期时间序列异常检测 被引量:2 2011年 针对传统的单分类器不适用于周期时间序列的异常检测,提出了一种基于移相加权球面单簇聚类的单分类器PS-WS1M-OCC.通过在聚类过程中增加高效的循环移位操作,解决了时间序列记录之间相似度计算的问题.另一方面,基于时间序列记录的权重分布,提出了新的阈值自适应确定方法,从而使单分类器对训练集包含的异常数据和参数设置不敏感.实验表明,本文提出的单分类器可以用于周期时间序列的异常检测;与传统的单分类器相比,可以成功地从包含异常数据的训练集中进行无监督学习,对训练集包含的异常数据鲁棒,并且对参数不敏感. 王骏 钟富礼 王士同 邓赵红基于代表点评分策略的快速自适应聚类算法 被引量:5 2018年 在基于代表点的聚类算法中,为了解决算法自适应性和聚类速度问题,在快速压缩集密度估计的基础上,提出了一种基于代表点评分策略的快速自适应聚类算法.该算法的提出基于3个非常重要的假设:1)每个簇有一个代表点,且代表点来自簇内高密度样本;2)代表点或在压缩集中,或在压缩集附近且与压缩集中样本具有高度相似性;3)各簇中样本围绕代表点并沿着压缩集扩散.基于第1个和第2个假设,提出用代表点分值来评估样本成为代表点的可能性,并分析了其合理性.基于第3个假设和代表点分值,构建了一种快速的自适应聚类算法,该算法将所有样本按照其代表点分值从大到小排序,形成代表点候选集;然后从代表点候选集中逐个选择代表点,利用其邻域不断传递标签至整个压缩集;最后采用同样的方法将压缩集中样本的标签扩散至整个数据集,在此过程中引入抽样,提高标签传播速度.在人工数据集和真实数据集上的实验表明:所提出的算法能够处理任意形状的数据集和大规模数据集,且不需要指定类别数. 张远鹏 张远鹏 邓赵红 钟富礼 王士同协作式整体和局部的分类机 被引量:1 2011年 提出了一种协作式整体局部分类算法,即C2M(Collaborative classification machine with local and global information),该算法利用两类样本各自的协方差作为整体方向信息,获得两个带整体和局部信息的分类面,并通过组合分类器的平均规则将两个分类面组合,得到最终的最优判决平面.该算法可用两次QP(Quadratic programming)求解,时间复杂度为O(2N3),大大小于M4(Maxi-min margin machine)的O(N4),线性核时的分类精度高于只利用了局部信息的支持向量机(Support vector machine,SVM).理论上证明了在交遇区较多时,C2M可以比M4更有效地利用全局信息,并提出了判断整体信息对分类是否有贡献的4个判别指标.模拟数据和标准数据集上与M4和SVM的对比实验证明了该算法的有效性. 张战成 王士同 钟富礼关键词:支持向量机 基于力的类同传播聚类方法 2009年 提出一种基于力的类同传播聚类方法AFAPC。依据万有引力定律,根据数据间的相互引力,并在数据组成的网络中交替传递类同信息,计算出数据的聚类和对应的聚类中心。实验结果表明,AFAPC能在更短的时间内,取得与类同传播聚类算法APC相媲美的聚类效果。 王士同 陈晓峰 曹苏群 钟富礼关键词:聚类 万有引力 一种支持向量机的快速分类算法 被引量:8 2012年 鉴于传统支持向量机分类过程的计算量和支持向量的个数成正比,为了提高分类决策的速度,提出一种约简支持向量的快速分类算法,该算法对原始的支持向量进行特定比例的模糊均值聚类操作,按照分类误差最小的原则构建最小线性二乘回归模型,求解新的支持向量系数和决策函数的偏置.人造数据集和标准数据集上的实验表明,约简50%支持向量后,可以在保持分类精度在无统计意义的明显损失的前提下,使得分类速度提高50%. 张战成 王士同 邓赵红 钟富礼关键词:支持向量机 我们还需要前馈神经网络技术? 被引量:1 2013年 定义了前馈核神经网络的体系结构。从实际应用的需求出发,所定义的网络涵盖了目前多数前馈神经网络。从理论上证明了该网络的批量学习过程实际上所表达的是一种核学习机,进而证明了网络的学习仅需在最后一层实施即可,而在隐含层的参数可任意赋值。因此,该结论事实上是现有LLM及ELM的拓广。同时,发现在逼近精度要求不是太高的情况下,目前的前馈神经网络学习技术因过于繁琐而没有必要,仅需对网络最后一层进行学习即可。而前馈神经网络技术目前最前沿的应用是解决大样本及深度知识表达问题。针对这两个热点问题,分别提出了大样本下的廉价学习策略和深度知识挖掘下的灵巧学习策略。在此,作者希望该文能引起广泛讨论甚至争论。 王士同 钟富礼 蒋亦樟关键词:深度知识 最小学习机 被引量:7 2010年 针对极端学习机(ELM)不能用于多层前向神经网络学习的问题,通过揭示单层前向神经网络(SLFN)的ELM与岭回归以及中心化的岭回归之间的关系,提出了SLFN的最小学习机。通过证明核化的中心化岭回归与核化的PCA之间的关系,提出以无限可微的核函数为激励函数的多层前向神经网络(MLFN)的最小学习机LLM.SLFN/MLFN的最小学习机能够保持ELM的上述优势。 王士同 钟富礼关键词:前向神经网络 极端学习机 迁移学习模糊识别方法和智能建模 2015年 传统机器学习方法在识别领域或建模分析时其性能往往依赖于数据的丰富程度,训练数据或待分析数据量的多少决定最终模型的性能,通常数据量越多所构模型的性能越佳。但对于一些特殊领域或新兴领域,初期所采集的数据量常显不足,此时传统机器学习方法不再有效。针对此问题,近年来一种新的学习模式迁移学习方法被提出。该方法可通过对历史相关数据的总结获取历史知识,利用知识和当前的数据进行识别或建模从而得到更可靠的模型。该学习过程与人类的认知过程类似,其开创了一种新的学习模式。介绍和总结近年来在迁移学习框架下提升传统模糊识别方法(主要模糊聚类技术)和模糊智能建模方法(主要模糊系统建模技术)性能所做的一系列工作及尚存在的一些问题,以期为相关领域的研究人员提供有价值的参考。 王士同 钟富礼 蒋亦樟 邓赵红 钱鹏江关键词:历史知识 具有隐私保护功能的协作式分类机制 被引量:4 2011年 提出了一种能够保护数据隐私的协作式分类机制,即C2MP2(collaborative classification mechanismfor privacy-preserving),该算法利用2类样本各自的均值和协方差作为整体信息,将整体信息共享给对方,参与分类的双方,分别使用各自的隐私数据和对方的整体信息训练获得2个可以保护隐私的分类器,并由2个分类器协作得到最终的分类器.其线性模型的训练过程不仅可以保护双方数据元的隐私,还可以保护数据元的数量信息不泄露.针对测试过程的隐私保护,设计了可以保护待测样本的隐私和分类规则不泄露的安全算法.在C2MP2线性模型的基础上,分析了C2MP2和MPM(mini maxprobability machine),SVM(support vector machine)以及M4(maxi-min margin machine)在处理隐私数据方面的区别和联系.进一步使用核方法通过内积矩阵实现隐私保护的同时提高C2MP2的非线性识别能力,并通过模拟数据和标准数据集上实验检验了C2MP2线性模型和核化模型的有效性. 张战成 王士同 钟富礼关键词:隐私保护 支持向量机