师智斌
- 作品数:40 被引量:111H指数:4
- 供职机构:中北大学电子与计算机科学技术学院更多>>
- 发文基金:山西省自然科学基金国家自然科学基金铁道部科技研究开发计划更多>>
- 相关领域:自动化与计算机技术经济管理文化科学电子电信更多>>
- 基于分类超平面的非线性集成学习机被引量:2
- 2013年
- 针对支持向量机面临的大规模数据分类问题,提出基于分类超平面的非线性集成学习机NALM。该方法借鉴管理学中协同管理的思想,将大规模数据分成规模较小的子集,然后分别在子集上运行分类超平面算法,最后将各子集上的分类结果进行非线性集成得到最终的分类结果。该方法不仅继承了分类超平面的优点,而且还将分类超平面的适用范围从小规模数据扩展到中大规模数据,从线性空间推广到Hilbert核空间。若干数据集上的实验表明:NALM能以较少的支持向量来解决大规模样本分类问题。
- 刘忠宝赵文娟师智斌
- 关键词:支持向量机分类超平面大规模数据
- 形式背景约简在数据立方体中的应用研究被引量:1
- 2012年
- 研究形式背景约简理论,将形式概念分析理论的属性约简方法应用到数据立方体的研究,通过对绝对不必要属性和相对必要属性约简实现基本表的简化。研究表明,由约简后的基本表进行的数据立方体的构建要比由原始基本表的构建过程简单,由于保存了约简过程,可得到与原基本表相同的聚集概念。通过对基本表进行约简,还明确了基本表中各个属性对数据立方体聚集单元的刻画作用,这对于理解数据的特性有重要的意义。
- 师智斌王博
- 关键词:属性约简数据立方体
- 基于数据仓库的股票交易数据分析与预测研究
- 本文分析了目前我国股票市场分析预测方法状况及国内外数据仓库和数据挖掘技术在各个领域的广泛应用,以提供股票投资决策为目的,研究了将数据仓库技术应用到股票分析系统中,建立了面向分听、面向决策的数据平台,采用数据挖掘技术中的前...
- 师智斌
- 关键词:数据仓库
- 计算机网络安全现状及其对策浅谈
- 综述了计算机网络安全的现状;分析了影响网络安全的主要原因;讨论了网络安全的特性,并在此基础上提出相应的策略。
- 王保民张景林师智斌
- 关键词:网络安全计算机病毒黑客
- 基于时序特征的网络流量分类方法被引量:2
- 2022年
- 网络流量数据具有明显的时序特征.针对基于机器学习的网络流量分类方法中,传统机器学习依赖人工设计特征以及深度学习无法兼顾特征自主生成与特征可解释性等问题,采用时序分析方法,提出了一种基于时序特征的网络流量分类方法.首先,将网络流量数据预处理为时序数据;然后,应用Shapelet-Transform算法来自主学习网络流量的时序特征,并改写Shapelet-Transform算法的计算逻辑,且将其部署在GPU上,使其可以快速处理大规模网络流量数据集;最后,结合支持向量机分类算法构造了最优分类模型来实现网络流量分类.公开数据集实验测试结果表明,所提方法可以实现网络流量时序特征的自主学习,并达到与深度学习接近的分类精度,同时给出深度学习方法无法提供的可解释性分类依据.
- 赵力强师智斌石琼雷海卫
- 关键词:网络流量分类可解释性GPU
- 大规模不完整信息特征提取仿真研究被引量:2
- 2018年
- 随着信息规模的不断扩大不完整信息随之出现,使信息无法完成正常传输。对其进行特征提取,能够有效提升数据分析的准确性。对不完整信息特征的提取,需要得到特征属性类别中心矢量,计算出特征挖掘适应度值,完成对不完整信息特征的提取。传统方法估计出基函数和滤波器,对不完整信息进行滤波,但忽略了计算出特征挖掘适应度值,导致提取精度偏低。提出基于神经网络的大规模不完整信息特征提取方法。描述不完整信息属性与分类结果之间的关系,组建分类决策树对不完整信息进行聚类处理,结合自适应搜索方法进行大规模不完整信息特征进行提取,得到特征属性类别中心矢量,得到动态训练下的信息特征提取的模糊控制律,计算出特征挖掘适应度值,由此实现大规模不完整信息的特征提取。实验结果表明,所提方法具有较高的特征提取精度。
- 高佳锋师智斌
- 关键词:特征提取
- 融合用户兴趣和评分差异的协同过滤推荐算法被引量:28
- 2020年
- 针对传统的协同过滤算法中单一评分相似性计算不准确的问题,提出融合用户兴趣和评分差异的协同过滤推荐算法。将TF-IDF思想运用到用户对标签的权重计算中,并使用指数衰减函数和时间窗口捕捉用户兴趣的变化;根据历史评分矩阵,充分考虑用户评分值差异、评判准则差异、影响力差异和项目影响差异等影响因子,定义了一种评分差异相似性度量算法;最后将用户兴趣相似性和评分差异相似性进行加权融合,获取更加准确的用户邻居,从而预测项目评分并进行推荐。在数据集Movielens的实验表明,提出的算法能有效提高推荐精度。
- 陆航师智斌刘忠宝
- 关键词:协同过滤TF-IDF
- 炸药GAS重结晶细化过程中膨胀度测试技术研究被引量:2
- 2003年
- 介绍了GAS重结晶细化方法中膨胀度测试原理、方法、装置,并对丙酮-CO2、环己酮-CO2体系膨胀度进行了测试。研究表明,膨胀度主要受压力、温度及实验过程搅拌作用的影响。
- 王保民师智斌
- 关键词:炸药膨胀度测试技术温度二氧化碳
- 数据立方体聚集范围查询分块方法研究
- 2007年
- 范围查询是数据立方体数据分析的有效工具,预计算技术通过预先计算并存储范围查询的结果,可以实现快速的用户响应。近年来研究人员对基于MOLAP的预计算技术的研究主要以prefixsum及分块技术为基础。本文对预计算技术的分块方法进行研究,分析了现有分块技术的方法和性能,并提出了两种新的分块方法:嵌套分块和基于前缀区域边界的分块。本文对这两种分块的方法和特点做了阐述,研究表明这两种方法为分块技术提出了新的思路,是对现有分块方案的有力补充。
- 师智斌黄厚宽
- 关键词:数据立方体范围查询
- 大数据分析下终端用户信息快速获取仿真研究被引量:2
- 2018年
- 对终端用户信息的快速获取,能够有效提高大数据下用户信息处理效率。对大数据分析下终端用户信息获取,需要建立用户信息的数据预处理模型,去除终端用户信息中存在的噪声,完成用户信息的快速获取。传统方法对下近似的计算方法进行了重新定义,并对快速获取模型进行探讨,但忽略了对用户信息中噪声的滤除,导致信息获取效率偏低。提出终端用户信息快速获取方法。根据科尔莫戈罗夫多项式建立用户信息的数据预处理模型,去除终端用户信息中存在的噪声,提高快速获取结果的准确性,采用贝叶斯定理计算终端用户信息的特征,根据信息特征快速的完成获取,提高了方法的获取效率。仿真证明,上述方法可以在较短的时间内准确的完成终端用户信息的快速获取。
- 杨捷师智斌刘忠宝
- 关键词:大数据终端用户