陈卓
- 作品数:7 被引量:52H指数:3
- 供职机构:北京科技大学计算机与通信工程学院更多>>
- 发文基金:国家自然科学基金教育部科学技术研究重点项目江西省自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于发现特征子空间模型的文本分类算法被引量:2
- 2009年
- 在非结构化数据挖掘结构模型,即发现特征子空间模型(DFSSM)的运行机制下,提出了一种新的文本分类算法——基于DFSSM的文本分类(TCDFSSM)算法。该算法在文本训练及分类阶段的基础上增加了自动反馈阶段,使得TCDFSSM具有自学习能力,并给出了文本分类过程反馈阈值的选取算法。结果表明,该算法分类效果良好,其自学习能力、适应性及鲁棒性更加优越。
- 周法国王映龙杨炳儒陈卓
- 关键词:文本分类
- 基于图的多关系数据挖掘理论研究与方法被引量:1
- 2008年
- 在过去的几年.结构化数据挖掘的需求日渐兴起,图是计算机学科和离散数学中最好的结构数据研究之一,基于图的数据挖掘已越来越广泛。本文介绍了基于图的数据挖掘的理论基础及其研究方法。
- 王映龙宋泽锋陈卓
- 关键词:结构化数据数据挖掘
- 序列模式挖掘综述被引量:27
- 2008年
- 综述了序列模式挖掘的研究状况。首先介绍了序列模式挖掘背景与相关概念;其次总结了序列模式挖掘的一般方法,介绍并分析了最具代表性的序列模式挖掘算法;最后展望序列模式挖掘的研究方向。便于研究者对已有算法进行改进,提出具有更好性能的新的序列模式挖掘算法。
- 陈卓杨炳儒宋威宋泽锋
- 关键词:数据挖掘周期模式增量式挖掘
- 一种挖掘最大频繁子图的新算法被引量:3
- 2008年
- 如何从大量的图中挖掘出令人感兴趣的子图模式已经成为数据挖掘领域研究的热点之一.由于其内在的计算复杂性,挖掘全部频繁子图非常困难,且得到的频繁子图过多,影响着结果的理解和应用.解决方案之一是挖掘最大频繁子图.在经典的Apriori算法的基础上,提出了一种挖掘最大频繁子图的新算法Apriori-MaxGraph.首先给出了一种新的、用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可以加速子图规范编码序列匹配的速度.其次,针对最大频繁子图,对候选子图的生成进行了规范.最后,采用双向搜索与剪枝策略,大大减小了搜索空间,提高了算法的效率.实验结果表明,Apriori-MaxGraph算法具有较高的挖掘效率.
- 王映龙杨炳儒宋泽峰陈卓李琳娜
- 关键词:数据挖掘邻接矩阵
- 基于区域特征分布式Web用户兴趣迁移模式
- 2008年
- 提出一种基于区域特征的分布式Web用户兴趣迁移模式挖掘模型DWICP,以及基于该模型的具有区域特征的用户识别方法和局部浏览兴趣迁移模式更新算法/全局浏览兴趣迁移模式更新算法,用于发现具有区域特征的用户浏览兴趣迁移模式。实验表明,该方法能够较好地解决分布式环境下Web访问行为模式研究中的区域分析需求,同时提高了用户浏览兴趣表示的准确性。
- 张克君杨炳儒章小莉宋泽锋陈卓
- 关键词:分布式数据挖掘WEB访问模式挖掘
- 基因序列相似程度的LCS算法研究被引量:16
- 2007年
- 首先重新审视了采用穷举法求解LCS问题的困难,以及对应的优点;随后针对穷举法的优点进行了两类优化;最后给出了算法实现的图示以及算法的结论。通过实验证明,算法的效率较传统的动态规划的LCS算法有了很大的提升。
- 王映龙杨炳儒宋泽锋陈卓唐建军
- 关键词:最长公共子序列穷举法
- 基于时态逻辑的多时间序列挖掘模型被引量:3
- 2009年
- 为了从多时间序列之间发现的定性的时态相关模式可而更全面的理解和把握系统的演化特性,提出了一种基于时态逻辑的多时间序列挖掘模型。它首先将多时间序列转化为多事件序列,然后将预处理后的多事件序列利用区间时态逻辑(ITL)关系子集来定义多事件序列中事件间的时态相关模式。其次进行多状态序列融合和局部时态观测序列的生成,之后采用频繁模式挖掘算法发现多时间序列的频繁时序模式。该模型有助于解决时间序列挖掘所面临的若干挑战和难题,有助于扩展现有时间序列挖掘系统的功能,从而指导时间序列等复杂类型数据的知识发现过程。实验结果表明了该模型及算法的有效性和优越性。
- 陈卓杨炳儒周法国李琳娜
- 关键词:时态逻辑多时间序列数据挖掘