武丽芬 作品数:22 被引量:43 H指数:5 供职机构: 晋中学院 更多>> 发文基金: 山西省教育科学“十二五”规划课题 国家自然科学基金 山西省教育科学“十一五”规划课题 更多>> 相关领域: 自动化与计算机技术 电子电信 文化科学 环境科学与工程 更多>>
基于近邻边缘检测的支持向量机 被引量:1 2015年 针对标准支持向量机方法需要存储、计算和处理核矩阵而学习效率很低,不能有效处理较大规模数据挖掘的问题,提出一种基于近邻边缘检测的支持向量机方法 (SVM Method Based on Neighbor Edge Detection,ED_SVM)。该方法将近邻边缘检测技术引入SVM的训练过程,即首先对数据进行划分,选择混合类样本,通过边缘检测技术提取其中位于近似最优分类边界附近的含有较多重要支持向量信息的样本,构成新的小规模训练集,以在压缩训练集的同时保持原始支持向量信息的分布特性;并在新构成的训练集上训练标准SVM,在提高SVM学习效率的同时得到优秀的泛化性能。实验结果表明,本文提出的ED_SVM方法能够同时获得较高的测试精度和学习效率。 王秀华 武丽芬关键词:支持向量机 边缘检测 支持向量 泛化性能 一种优化FP-growth的支持度相同项的排序算法 被引量:1 2012年 Han等人提出了频繁模式增长FP-growth算法,该算法在第一次扫描数据库后,得到频繁项集合和每个频繁项的支持度,并按支持度降序排列,但没有对支持度相同项的排列做进一步说明。本文依据"越是频繁出现,越可能被共享"的建树原则,提出了通过比较该项与前后项项集的支持度,较大者先排列的方法,使后续构建的FP-tree比任意排序构建的FP-tree更优。 武丽芬关键词:频繁项 最小支持度 改进的决策树算法在文理分科中的应用研究 被引量:5 2011年 文理分科是高中生面临的第一次重大选择,选文科还是理科,很多同学感到两头难。针对这种情况,通过对比决策树分类算法中的ID3和C4.5算法,提出了基于影响因子的新的分类算法,构造了"文理分科分类器"。实验证明该方法在文理分科问题上比传统的ID3和C4.5算法有更高的分类精确度,该分类器可以辅助学生和家长进行文理科的选择,降低选择的错误性。 武丽芬关键词:决策树 文理分科 分类器 关联规则在高校贫困生认定中的应用 2013年 贫困生的认定是各高校繁重的一项工作,利用关联规则挖掘中的FP-growth算法,运用SQL Server2005中Analysis Services工具对影响贫困生认定的数据因素进行挖掘,发现了学习成绩、贷款、消费水平以及家庭情况等之间的关系。为贫困生认定提供了理论支持和科学依据,提高了工作效率,对实际工作有一定的指导意义。 王秀华 武丽芬关键词:关联规则 贫困生 ANALYSIS 软件工程双语教学模式研究 2020年 软件人员的英语能力直接影响到软件产业生产能力和软件产业的发展。随着软件工程学科作用和地位的不断上升,开展软件工程双语教学势在必行。本文系统论述了双语教学的内涵、研究内容、教学方法及创新与收获,为今后软件工程双语教学提供了行之有效的借鉴模式。 阎宏丽 武丽芬关键词:双语教学 分类教学 因材施教 一种改进的加速K均值聚类算法 被引量:7 2019年 针对当前聚类算法应用于大规模多类别数据集中时,计算量较大,且算法性能严重依赖于K值的不足,提出一种改进的加速K均值聚类算法。算法主要由两种策略组成:一是基于质心下界(PLB)的跳跃过程,新引入称为质心的固定点来计算对象和矩心间距离的下界,避免了常见聚类算法在收敛早期过程中的距离计算过程;二是基于不变矩心对(ICP)的跳跃过程,如果矩心更新步骤完成后被分配及未被分配矩心的位置保持不变,则维持对象分配策略不变且无需计算与未被分配矩心之间的距离。此外,还给出了将本文算法与Hamerly算法相结合的拓展算法以进一步提升聚类加速效果。对大规模高维图像数据集进行了仿真实验,结果表明,与Hamerly算法相比,本文算法在获得相同聚类效果的同时,极大地压缩了距离计算量。当K值较大时,本文算法的平均压缩率更高,平均耗时更少。 马俊宏 武丽芬关键词:聚类 压缩率 基于Apriori算法的数据挖掘在电信套餐制定中的应用 被引量:8 2007年 针对目前电信行业激烈的竞争,提出了为用户量身定做套餐是占领市场的新战略,并通过Apriori算法实现用户业务间的关联性挖掘,为制定套餐提供科学依据. 武丽芬 严学勇关键词:套餐 数据挖掘 关联规则 基于数据挖掘的有色金属冶金化学课程成绩研究 2016年 学生本人的课程学习成绩可以直接反映出课程学习质量的好坏,也可以直观地反映出教学质量的好坏。数据挖掘是一种提取信息和知识的技术,它会在瞬间完成非常复杂的过程,这个过程中包含了大量的、不完整的、有噪音干扰的数据,数据挖掘技术就是要从这些数据中去找到那些隐藏的、有用的信息。在学生课程成绩以及相关数据上运用数据挖掘技术,对教学工作具有帮助和指导的重大意义,因为可以发现学生学习在学习效果以及效率之间的关联性。本文以国内某高校的有色金属冶金化学课程成绩为实例,在阐述数据挖掘知识的基础上,探究课程成绩的关联性。 张鸿雁 武丽芬关键词:数据挖掘 相关数据 基于RNN模型与LSTM模型的机器作诗研究 被引量:5 2021年 现如今自然语言处理在人类生产生活中起到极其重要的作用,随着各类机器学习算法以及深度神经网络的发展,各类写诗机器人频频出现。文章通过机器写诗系统研究了循环神经网络(RNN)与长短期记忆网络(LSTM)在唐诗写作方面的模型效果。本系统基于谷歌开源的深度学习框架TensorFlow,Python作为开发语言,交叉熵损失作为实验结果评价依据进行研究,其结果有力证明了LSTM模型在作诗方面的优越性,并阐释了其具有优越性的具体原因。 武丽芬 严学勇 赵吉关键词:循环神经网络 学生成绩数据挖掘的研究与实现 被引量:6 2011年 文章从分析影响学生成绩的因素出发,利用数据挖掘关联规则中的Apriori算法对采集的学生数据集进行挖掘,以期发现影响学生成绩的潜在因素,从而为相关部门制定教学政策,改善教学质量提供理论支持和科学依据,从而更好地开展教学工作,更好地为学生服务. 武丽芬 孟强关键词:数据挖掘 关联规则 APRIORI算法