国家自然科学基金(60573075)
- 作品数:8 被引量:40H指数:4
- 相关作者:张继福蔡江辉赵旭俊张素兰胡立华更多>>
- 相关机构:太原科技大学更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于约束FP树的天体光谱数据相关性分析系统研究被引量:2
- 2008年
- 从海量天体光谱数据中挖掘光谱数据特征和物理化学性质之间内在的、隐含的相关性,是人类探索天文规律的一种有效方法。利用基于约束FP树的关联规则挖掘方法作为天体光谱数据相关性分析手段,采用VC++和Oracle9i作为开发工具,设计与实现了天体光谱数据相关性分析系统,给出了其系统的软件体系结构和模块功能,并对光谱数据预处理、背景知识表示、CFP树构造、频繁模式提取及关联规则生成等关键技术以及关键模块的实现技术,进行了详细描述。系统运行结果表明,利用关联规则来描述、分析天体光谱数据特征和物理化学性质之间存在的相关性,是可行的和有价值的,从而为寻找天体规律提供了一种有效手段。
- 赵旭俊张继福蔡江辉
- 关键词:天体光谱数据挖掘关联规则FP树
- 一种基于距离支持度的离群数据挖掘算法
- 现有离群数据发现算法大多是针对低维数据的,这些算法在处理高维海量数据时存在效率问题,而且要求输入参数较多,影响了结果的客观性。针对不同要求下离群数据发现任务,利用距离支持度来改变离群数据的约束范围,提出了一种基于距离的高...
- 蔡江辉张继福赵旭俊
- 关键词:数据挖掘离群数据聚类恒星光谱数据
- 文献传递
- 基于概念格的分类规则提取算法及其应用
- 概念格是形式背景分析中的核心数据结构,分类规则是数据挖掘一项很重要的任务。本文首先给出了一种分类概念格渐进式构造算法,并在此算法基础上给出了分类规则的提取算法,理论表明了分类概念格要比一般概念格构造的效率高、复杂度小。最...
- 胡立华张继福张素兰
- 关键词:概念格最小上界天体光谱数据
- 文献传递
- 约束概念格及其构造方法被引量:17
- 2006年
- 概念格是一种有效的数据分析和知识提取的形式化工具.然而,随着要处理的数据量的剧增,基于原始形式背景构造出的概念格结点数目庞大,占用大的存储空间,同时概念格结点中一些属性集形成的内涵,用户并不都感兴趣,因而从中提取用户需求知识费时.为了降低概念格构造的时空复杂性,增强实用性和针对性,首先采用谓词逻辑描述用户感兴趣的背景知识,并将背景知识引入到概念格结构中,提出了一种新的概念格:约束概念格.在此基础上,提出了基于背景知识的约束概念格构造算法CCLA.理论分析表明,该算法能有效地减少概念格的存储空间和建格时间.最后,采用恒星天体光谱数据作为形式背景,实验验证了该算法的有效性.
- 张继福张素兰胡立华
- 关键词:数据挖掘约束概念格谓词逻辑背景知识恒星光谱数据
- 基于链表结构的概念格渐进式构造被引量:11
- 2007年
- 给出了一种基于链表结构的Godin算法实现方法,该方法采用链表结构组织格结点,并利用索引表,实现了对概念格子结点的快速查找,提高了概念格渐进式构造的效率。最后,以天体光谱数据作为形式背景,实验结果表明,该方法的构造效率要明显优于基于顺序结构的Godin算法。
- 蒋义勇张继福张素兰
- 关键词:概念格链表结构索引表
- 约束频繁模式树及其构造方法研究被引量:2
- 2010年
- 频繁模式挖掘是影响关联规则挖掘效率的主要步骤.采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出一种基于背景知识的频繁模式树-CFP-Tree(Constrain Frequent Pattern Tree),并给出了其构造算法CFPT-Construct,从而提高关联规则挖掘结果的针对性,降低了FP-Tree构造的复杂性,有效地解决了FP-Tree构造算法中数据存储的瓶颈问题.最后以国家天文台提供的天体光谱数据作为数据集,实验验证了算法的有效性、针对性和高效率.
- 赵旭俊张继福蔡江辉
- 关键词:数据挖掘关联规则背景知识
- 一种基于约束FP树的天体光谱数据相关性分析方法被引量:5
- 2009年
- 寻找未知的天文规律是人类探索宇宙奥妙所追求目标之一.利用关联规则来描述天体光谱数据特征与其物理化学性质之间存在的、未知的相关性,是实现该目标的一种有效手段.以国家重大科学工程LAMOST项目为背景,利用一阶谓词逻辑作为天体光谱知识表示技术,提出一种约束FP树及其构造算法,从而有效提高天体光谱数据相关性分析的针对性和效率.并在此基础上,提出一种基于约束FP树的天体光谱数据相关性分析方法.实验结果分析表明,利用该相关性分析方法挖掘天体光谱数据特征和物理化学性质之间存在的相关性,是可行的和有价值的.
- 张继福赵旭俊
- 关键词:天体光谱数据关联规则
- 面向LAMOST的天体光谱离群数据挖掘系统研究被引量:6
- 2007年
- 在宇宙中寻求未知天体是人类探索宇宙奥妙所追求的目标之一,离群数据挖掘是发现未知天体光谱数据的一种有效途径。文章首先以VC++和Oracle9i为开发工具,设计与实现了面向LAMOST的恒星光谱离群数据挖掘系统,并给出了其软件体系结构和模块功能。其次,对基于中值滤波器的恒星光谱数据预处理、基于距离的恒星光谱数据聚类、基于距离支持度的恒星光谱数据离群数据挖掘、基于主分量分析法PCA的恒星光谱数据离群数据的三维可视化等主要关键技术进行了详细描述。最后,基于SDSS恒星光谱数据的运行结果表明,利用该系统寻找天体光谱离群数据是可行的,从而为寻找未知的、特殊的天体光谱数据提供了一种新途径。
- 张继福蔡江辉
- 关键词:天体光谱数据离群数据聚类
- 基于FP树的特异关联规则挖掘算法研究被引量:2
- 2007年
- 分析稀少数据的相关性是一种重要的、有价值的数据挖掘任务。运用面向关联规则的FP树构造方法,提出了一种特异关联规则挖掘算法RSFPA。该算法将包含特异模式的数据集压缩成一棵FP树,通过挖掘FP树来提取特异模式集,从而进一步提高了特异模式的挖掘效率。最后,利用恒星光谱作为数据集,实验验证了RSFPA算法的正确性和有效性。
- 弓秀莲赵旭俊张继福
- 关键词:数据挖掘FP树恒星光谱数据
- 基于微粒群和子空间的离群数据挖掘算法研究被引量:3
- 2009年
- 传统的离群数据挖掘方法大多数是利用全局的观点看待离群数据,很难发现低维子空间中的偏移数据。利用微粒群算法(PSO)具有简单、容易实现并且没有许多参数需要调整等优势,提出了一种基于PSO和子空间的离群数据挖掘算法(OM-PSO)。该算法首先将子空间看作微粒,根据偏离数据所在子空间的稀疏系数,采用带有变异算子的PSO算法来搜索子空间,并将子空间中的数据看作为局部偏离数据,即离群数据;最后采用离散化的天体光谱数据作为数据集,实验结果验证了该算法的有效性。
- 葛凌云张继福蔡江辉
- 关键词:离群数据微粒群算法子空间天体光谱数据