华北理工大学理学院河北省数据科学与应用重点实验室
- 作品数:7 被引量:2H指数:1
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- PFKD:综合考虑数据异构和模型异构的个性化联邦学习框架
- 2024年
- 联邦学习是解决机器学习中数据共享和隐私保护两个关键难题的重要方法.然而,联邦学习本身也面临着数据异构和模型异构的挑战.现有研究往往只专注于解决其中一个方面的问题,忽视了两者之间的关联性.为此,本文提出了一个名为PFKD的框架,该框架通过知识蒸馏技术解决模型异构问题,通过个性化算法解决数据异构问题,以实现更具个性化的联邦学习.通过实验分析验证了所提出框架的有效性.实验结果显示,该框架能够突破模型的性能瓶颈,提高模型精度约1个百分点.此外,在调整适当的超参数后,该框架的性能得到进一步提升.
- 陈学斌任志强
- 关键词:数据异构
- 已知时间的空间文本skyline查询被引量:1
- 2020年
- 现有的空间文本skyline查询忽略了地理空间对象的时间信息,考虑到时间信息对应用的重要性,将时间信息应用到空间文本skyline查询中,提出了一种新的查询,即已知时间的空间文本skyline查询(Time-aware SpatialTextual Skyline Query,TSTSQ)。TSTSQ中skyline对象的筛选依赖于三个条件:文本相关性、空间邻近和有效时间。分别设计了对象的空间文本相关性和时间文本相关性的计算函数,构建时空信息和文本信息的对象索引结构TKR-Tree,通过构造高效的裁剪策略实现了TSTSQ的查询算法。通过实验数据的分析和对比,验证了TSTSQ查询的有效性。
- 郭莎莎李爽阎红灿
- 关键词:时间信息SKYLINE查询
- 基于RTOPSIS的集成学习的综合评价研究
- 2024年
- Stacking集成学习被认为是一种“黑盒”模型,采用多个基学习器的预测结果输入,通过元学习器来生成最终的预测。这种复杂性使得难以准确了解每个基学习器对最终结果的贡献。为解决此问题,该文提出了RTOPSIS方法。该方法结合了灰色关联度系数计算和优劣解距离方法,为决策者提供了一种有效的工具,以清晰地揭示每个基学习器在Stacking模型中对最终结果的贡献程度。具体而言:采用RTOPSIS算法替代传统的判别方法,综合考虑基学习器和元学习器之间的关系,提供更客观和合理的模型排名结果;应用灰色关联分析算法计算各个基学习器在Stacking模型中的权重,并反映其对最终结果的贡献程度。实验证明,相对于单一指标如Accuracy、AUC和F1-score等,在Stacking模型综合评价中,RTOPSIS算法为该文6个模型提供了更为合适的排名,且与经典优劣解距离算法的排序结果基本一致。因此,RTOPSIS算法在Stacking模型评价中展现出更全面的评价效果。
- 左胜勇冯立超陈学斌张春艳
- 关键词:综合评价
- 基于Stacking集成学习的恶意攻击检测方法
- 2024年
- 伴随着互联网的快速发展,网络安全问题越发严峻,尤其是网络攻击变得更加频繁,对其检测防控迫在眉睫。该研究主要提出了一种新的LightGBM-XGboost-Random forest的Stacking集成学习模型;新的特征提取方法也被相应提出,通过探索性数据分析对特征集进行重要特征提取,较传统方法更快速、方便;相比于单一模型与传统模型,该Stacking集成学习模型的检测精确度更高,对LUFlows数据集进行实践训练,该集成模型检测精确度可达到97.0%,明显高于单一使用LightGBM模型、XGboost模型、Random forest模型的精确度;同时引入NSL-KDD数据集对该Stacking集成学习模型进行泛化能力测试,与最新的研究进行比对,LXR模型测得F1-score为0.8709,优于多数模型结果。表明该集成学习模型能够提供一种更为精确有效且泛化能力强的网络攻击检测方法,以更好地维护网络空间安全。
- 左胜勇冯立超陈学斌郭宸良
- 满足个性化差分隐私的社交网络图生成方法被引量:1
- 2024年
- 【目的】针对现有本地化差分隐私社交网络图生成算法中直接扰动邻居列表的方法会导致引入过多噪声且隐私保护程度不均衡的问题,提出了一种满足个性化的本地差分隐私社交网络图生成方法(GPDP)。【方法】首先,使用传统的社区发现算法Louvain对原始社交网络图进行划分,保留社区信息;其次,对于划分后的社区根据其社区内部平均权重度比值作为新的隐私预算参数分配给每个节点;然后,每个节点根据新的隐私预算各自扰动其邻居列表,同时利用随机邻接位向量(RABV)方法降低通讯成本;最后合并邻居列表形成生成图。【结果】通过在真实数据集上的实验结果表明,该算法在发布合成图数据时保证了数据隐私性和可用性的均衡,同时保留了更多的社区结构信息。
- 高瑞陈学斌谷铮邹元怀
- 关键词:社交网络
- 基于GCN的入侵检测数据预处理方法
- 2023年
- 入侵检测是一种保障网络安全的有效手段。传统的入侵检测技术依赖于专家数据库,不能应对日益复杂的网络环境,所以许多研究者把机器学习的方法应用到入侵检测领域。GCN(Graph Convolutional Networks)是一种分类效果优秀的机器学习算法,本文用标准的GCN实现入侵检测任务,取得了很好的效果。提出三种数据预处理方法,将UNSW-NB15数据集构建成图结构的数据,去训练GCN算法。实验结果表明,预处理之后的数据使基于GCN的入侵检测算法具有很高的准确率,用三种预处理方法处理过的数据,去训练本文所使用的入侵检测算法,训练后的算法在执行入侵检测任务时分别有98.1%,91.9%,72.8%的准确率。提出的三种预处理方法,可以更快地将网络数据构建为图结构的数据,使入侵检测算法分析数据的速度提高,同时令算法在保证准确率的情况下大大节省计算资源。
- 白伟冯立超
- 关键词:入侵检测数据预处理
- 基于模糊超群构建的Engel群及其性质研究
- 2024年
- 通过构造满足Engel递减条件的模糊超群(H,。)上最小的等价关系■^(*),使得模糊超群关于等价关系构建的商群(等价类的集合)H/■^(*)是一个Engel群,并通过等价关系的强正则性来刻画该Engel群,最后引入模糊超群的?-部分的概念,确定等价关系?是可传递的充要条件.
- 阎熠闫焱张晓婷王悦
- 关键词:等价关系