国家自然科学基金(60973074) 作品数:11 被引量:96 H指数:5 相关作者: 李陶深 张希翔 赵志刚 万军 王芳 更多>> 相关机构: 广西大学 更多>> 发文基金: 国家自然科学基金 广西壮族自治区自然科学基金 广西教育厅科研项目 更多>> 相关领域: 自动化与计算机技术 自然科学总论 生物学 电子电信 更多>>
一种基于压缩矩阵的Apriori算法改进研究 被引量:46 2013年 针对已有基于矩阵的Apriori算法存在的问题,提出了一种改进的基于压缩矩阵的Apriori算法。算法进行了以下方面的改进:增加了两个数组,分别用于记录矩阵行与列中1的个数,使得算法在压缩矩阵时减少了扫描矩阵的次数;在压缩矩阵中,通过增加删除不能连接的项集和非频繁的项集的操作,使得矩阵压缩得更小,提高了空间效率;改变了删除事务列的条件和算法结束的条件,以减少挖掘结果的误差和算法循环的次数。算法性能分析和实验分析证明,改进后的算法能有效地挖掘频繁项集,并且比现有的算法具有更高的计算效率。 罗丹 李陶深关键词:数据挖掘 频繁项集 APRIORI算法 压缩矩阵 IaaS下基于预测的弹性云服务的研究 被引量:5 2014年 针对供应虚拟机的IaaS(infrastructure as a service)云下虚拟机部署存在较高时延,导致弹性云服务效率低下的问题,提出一种基于ARIMA模型和季节指数的动态负载预测及资源估算的方法.该方法利用负载与虚拟机配置的关系,预测负载值,并估算虚拟机需求量,从而可提前部署虚拟机,提高IaaS云的服务效率.研究结合供应虚拟机的私有IaaS云环境,实现其下的弹性供应的资源决策模块.实验与算法分析表明,该方法能够准确决策虚拟机资源量,保证虚拟机资源预留,有效改善了IaaS云的弹性效率. 文静 李陶深 黄汝维关键词:ARIMA 虚拟机 数据缺失条件下基于启发式构元的多元回归分析方法 被引量:3 2012年 传统的多元回归分析方法可以对缺失数据进行预测填补,但它在构造回归方程时存在自变量形式较为固定、单一等不足。为此,提出一种基于启发式构元的多元回归分析方法,通过贪婪算法找出现有变量的优化组合形式,选取若干新构变量进行回归分析,从而得到更好的拟合优度。通过对案例中小麦茎秆机械强度缺失数据信息进行仿真计算和评估,证实了方法的有效性。算例结果表明该方法运用在缺失数据预测中拥有较好的精准性。 张希翔 李陶深关键词:贪婪算法 相关系数 一种基于向量的概率加权关联规则挖掘算法 被引量:3 2014年 关联规则挖掘是数据挖掘领域中最活跃的一个分支。目前提出的许多关联规则挖掘算法需要多次扫描数据库并产生大量候选项集,影响了挖掘效率。针对加权关联规则挖掘算法中多次扫描数据库影响算法性能的问题,对其进行了优化,采取了以空间换时间的思路,提出一种基于向量的概率加权关联规则挖掘算法。以求概率的方式设置项目属性的权值,通过矩阵向量存储结构保存事务记录,只需扫描一次数据库,并且采用不同的剪枝策略及加权支持度和置信度的计算方式。使用数据实例进行模拟实验,结果表明此算法明显提高了挖掘效率。 赵志刚 万军 王芳关键词:数据挖掘 向量 加权关联规则 剪枝策略 一种基于改进PSO的K-means优化聚类算法 被引量:27 2014年 针对传统的K-means算法对初始聚类中心的选取敏感、容易收敛到局部最优的缺点,提出一种基于改进粒子群优化算法(PSO)的K-means优化聚类算法。该算法利用PSO算法强大的全局搜索能力对初始聚类中心的选取进行优化:通过动态调整惯性权重等参数增强PSO算法的性能;利用群体适应度方差决定算法中前部分PSO算法和后部分Kmeans算法的转换时机;设置变量实时监控各个粒子和粒子群的最优值变化情况,及时地对出现早熟收敛的粒子进行变异操作,从而为K-means算法搜索到全局最优的初始聚类中心,使聚类结果不受初始聚类中心影响,易于获得全局最优解。实验结果表明文中提出的改进算法与传统聚类算法相比具有更高的聚类正确率、更好的聚类质量及全局搜索能力。 谢秀华 李陶深关键词:聚类 粒子群优化算法 全局最优 Fuzzy Classification Algorithm Based on Mutually Restraint On the basis of most steady state structure of rigid bodies in physical theory,this paper regards data set as ... LINGHU Dazhi School of Business Guangxi University Nanning关键词:CLASSIFICATION FUZZY 基于投影位置的序列模式挖掘算法 2012年 针对PrefixSpan算法在产生频繁序列模式(特别是挖掘密数据集和长序列模式)时会产生大量的投影数据库,使得算法性能下降的问题,提出一种基于投影位置的序列模式挖掘(PSPM)算法.该算法利用Apriori性质舍弃对非频繁项存储,节省了存储空间和扫描不可能出现序列的挖掘时间;在递归挖掘过程中,利用投影位置表直接定位投影序列位置进行挖掘局部频繁项,避免了构造投影数据库,从而提高执行效率.实验结果表明:与PrefixSpan(with pseudo-pro)算法相比,PSPM具有更好的执行效率和可伸缩性. 王伟娜 李陶深 陈庆锋关键词:数据挖掘 PREFIXSPAN 投影数据库 基于OWSFP-Tree的最大频繁项目集挖掘算法 被引量:5 2013年 为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前都需要超集检验,利用项目表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。 赵志刚 王芳 万军关键词:数据挖掘 关联规则 最大频繁项目集 FP-TREE 云计算下适应用户任务动态变更的调度算法 被引量:6 2012年 针对云计算下处理海量用户任务时可能出现的用户撤销任务情形,提出一种云计算下适应用户任务动态变更的调度算法.算法在产生任务有向无环图(DAG)的基础上,当有撤销任务出现时,对每个撤销任务均根据其依赖关系撤销关联任务,更新DAG状态,再使用启发式算法进行调度.云仿真器CloudSim上的实验结果表明:该算法可避免对撤销无用任务的调度执行,在撤销相关依赖任务后提高了调度效率及云资源的利用率,在完成时间跨度上优于Min-Min算法和Max-Min算法. 张希翔 李陶深关键词:云计算 调度算法 Web访问序列模式挖掘算法的研究 被引量:2 2013年 针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户查找信息的质量和效率,以及对用户开展个性化的信息服务。实验和应用结果表明,提出的算法具有更好的执行效率,适用于Web日志挖掘,可用于构建智能化Web站点和解决个性化的信息服务问题。 李陶深 王伟娜 陈庆峰关键词:WEB访问 数据挖掘 PREFIXSPAN算法 WEB日志挖掘