国家自然科学基金(61373127) 作品数:13 被引量:37 H指数:4 相关作者: 张永 任永功 郑晓薇 闫德勤 刘洋 更多>> 相关机构: 辽宁师范大学 计算机软件新技术国家重点实验室 瓦房店市第八高级中学 更多>> 发文基金: 国家自然科学基金 辽宁省高等学校优秀人才支持计划 辽宁省博士科研启动基金 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
基于智能分组策略的XML关键字查询算法 2016年 XML关键字查询作为一种信息检索方式,一直是相关领域的热点研究问题。在经典查询语义SLCA的基础上,设计并实现了一种基于智能分组策略的XML关键字查询的优化算法。提出的算法通过合理的分组策略可以保证在运算过程中及时去除组内祖先节点和重复节点,减少了大量冗余计算,提高了算法的效率。最后设计多组实验在不同的XML数据上进行测试,实验结果表明了该算法的有效性和高效性。 张永 李泉霖 刘博关键词:扩展标记语言 关键字查询 基于相对熵的数据流概念漂移检测算法 被引量:2 2017年 针对数据流中出现的概念漂移问题,采用决策树作为分类器,提出一种基于相对熵的数据流概念漂移检测算法。提出的算法将分类器的准确率与相对熵作为判断该数据块是否发生概念漂移的标准。通过5个数据集对该方法进行验证,该算法在其中4个数据集上都获得了最优的结果,在另一个数据集上获得了次优结果。实验结果表明采用该方法不仅能够有效地检测概念漂移的发生,而且还能提高分类器的准确率。 杨帆 张永关键词:数据流 概念漂移 相对熵 决策树 基于极端学习机的Demons图像配准 2017年 医学图像配准是医学诊断中的重要研究内容,配准精度和速度也是众多研究的核心。图像配准过程可设想为是一种神经网络的学习过程,基于这种想法,引入极端学习机(ELM)这一系统对图像完成配准。该方法速度快、鲁棒性高,最重要的是它能不依赖梯度信息,从而很好地避开了点周围间的互相干扰,考虑到其学习过程的准确性,引入鲁棒激活函数学习机,以更好地提高配准学习系统的准确度,并提高其稳定性。 高弘治 闫德勤 杨伊 刘彩凤关键词:图像配准 极端学习机 基于用户相关性的动态网络媒体数据无监督特征选择算法 被引量:5 2018年 移动互联网、社交媒体的快速发展,极大推动了各个领域对文本、图像、视频等网络媒体数据处理的需求.该类数据具有高维度、动态更新、内容复杂的特性,增加了特征计算以及分类难度.同时,当前网络媒体数据的特征选择方法主要针对静态数据,并且对数据格式规范性要求较高.针对上述问题,为保证对动态网络媒体数据的实时特征提取,该文提出了一种基于用户相关性的动态网络媒体数据无监督特征选择算法(Unsupervised Feature Selection Algorithm for Dynamic Network Media Based on User Correlation,UFSDUC).首先,对社交网络中的交互用户进行关系分析,作为无监督特征选择的约束条件.然后,利用拉普拉斯算子构建用户相关性的特征选择模型,量化相关用户之间的关系强弱,通过拉格朗日乘子法给出特征模型中最优用户关系的数学方法.最后,基于梯度下降法设定动态网络媒体数据的阈值,用以计算非零特征权值来更新最优特征子集,达到对网络媒体数据进行有效分类的目的.该算法可在保证用户在相关性完整的基础上对动态网络媒体数据进行准确、实时的特征选择.该文采用3个标准网络媒体数据集,同时与5种目前较为流行的同类型算法进行对比以验证算法的有效性. 任永功 王玉玲 刘洋 张晶关键词:梯度下降法 Hadoop下多模式并行分类算法及其应用研究 被引量:2 2014年 根据人工神经网络自组织、高度并行以及具有非线性映射能力的特点,提出一种基于云计算的Hadoop多模式并行分类算法。通过将自组织映射网络与多个并行BP神经网络结合,提高多语义模式中复杂分类问题的学习效率和训练精度。采用Hadoop平台下的Map Reduce框架实现算法的并行处理,解决大规模数据样本训练时内存开销大、通信耗时长的问题。实验结果表明,与传统单BP多输出分类算法相比,该算法训练速度更快、分类精度更高,在处理大规模数据集时具有实时和高效的特性。 李玉丹 郑晓薇关键词:HADOOP集群 MAPREDUCE框架 自组织映射网络 大数据集 基于Hadoop-Mahout的分布式课程推荐算法 被引量:8 2018年 针对MOOC(Massive Open Online Course)平台上同类及相似课程繁杂,在线学习者不易找到适合自己的课程,而导致学习效率降低,学习效果较差等问题,提出一种IRS课程评价方法,对在线课程进行相关的评价。结合用户偏好及IRS方法改进了机器学习框架Apache-Mahout的协同过滤推荐算法,对在线学习者进行个性化课程推荐。面对MOOC平台上大量的课程信息及学习者信息,基于Hadoop分布式云计算平台,设计了在线课程推荐并行算法。实验结果表明,提出的IRS推荐算法有效且适用于分布式云计算环境,同时验证了该算法在分布式环境下并行计算的高效性。 徐文健 刘青昆 郑晓薇 李永波关键词:HADOOP 基于分层聚类及重采样的大规模数据分类 被引量:5 2013年 针对大规模数据的分类问题,将监督学习与无监督学习结合起来,提出了一种基于分层聚类和重采样技术的支持向量机(SVM)分类方法。该方法首先利用无监督学习算法中的k-means聚类分析技术将数据集划分成不同的子集,然后对各个子集进行逐类聚类,分别选出各类中心邻域内的样本点,构成最终的训练集,最后利用支持向量机对所选择的最具代表样本点进行训练建模。实验表明,所提方法可以大幅度降低支持向量机的学习代价,其分类精度比随机欠采样更优,而且可以达到采用完整数据集训练所得的结果。 张永 浮盼盼 张玉婷关键词:海量数据 聚类 重采样 支持向量机 基于环型网络模体应用马尔科夫聚类的图挖掘模型 被引量:4 2017年 针对图数据挖掘效率低、精度低等问题,提出基于环型网络模体应用马尔科夫聚类的图挖掘模型.首先,依据输入图的点集,采用Erd o″s-Rényi模型生成随机图,在输入图和随机图的子图挖掘过程中利用向量的加法性质判定环型子图,计算网络模体的统计特征,判断子图是否为网络模体.然后,求解图中边的绝对贡献值关联矩阵,通过动态阈值法求得阈值,二值化处理该矩阵.最后,对已稀疏化的图进行扩张和膨胀操作,使其达到收敛状态.实验表明,文中模型有效减少运行时间,在保证聚类质量同时提高图挖掘效率. 任永功 索全明 刘洋一种修正的模糊极限学习机 2017年 极限学习机ELM(Extreme learning machine)作为一个有竞争力的机器学习算法,以其简单的理论和易于实施的特点吸引了越来越多学者的关注。近来,针对噪音及离群数据,研究人员提出了相关的研究算法,然而如何将ELM更好地应用在含有噪音及离群数据的分类问题中仍是一个重要的研究课题。基于数据的信息关联的技术思想提出一种修正的模糊极限学习机(MFELM)。MFELM的优势在于:1)MFELM在处理噪音及离群数据的分类问题时能够保持ELM处理正常数据分类问题的良好性能;2)适用于ELM的激活函数或核函数同样适用于MFELM模型;3)根据不同的需求给每个数据样本分配不同的隶属度,MFELM可以推广到代价敏感学习中。通过使用UCI数据集和普遍应用的人脸数据集进行实验,实验结果表明该提出的算法显著提高了ELM的分类能力并优于其他算法。 李丽娜 闫德勤 楚永贺关键词:极限学习机 不平衡数据 信息关联 特征映射 基于Poisson过程的Hadoop集群平均寿命计算方法 2016年 Hadoop集群在连续长时间执行任务的过程中,集群故障会对集群造成不同程度的冲击与损害,是集群性能下降、系统故障频发的主要原因,更会导致集群平均寿命的大大缩短.为解决此问题,提出了一种基于Poisson过程的Hadoop集群平均寿命预测方法.通过预测计算,及时对集群进行调整优化,使系统性能保持在正常状态.同时在三种不同特征类型的Hadoop集群的实验中观察集群在任务执行过程中平均寿命的变化.实验结果表明,该方法能有效地判断Hadoop集群故障发生的频率,预测出集群的平均寿命。 李佳宣 郑晓薇 张永关键词:POISSON过程