教育部人文社会科学研究基金(13YJC860006)
- 作品数:18 被引量:215H指数:9
- 相关作者:韩忠明段大高陈炎刘雯杨伟杰更多>>
- 相关机构:北京工商大学更多>>
- 发文基金:教育部人文社会科学研究基金国家自然科学基金中央财政支持地方高校发展专项资金更多>>
- 相关领域:自动化与计算机技术理学电子电信更多>>
- 基于条件变分自编码的密码攻击算法被引量:1
- 2020年
- 使用密码猜测算法是评估用户密码强度和安全性的有效方法,提出一种基于条件变分自编码密码猜测算法PassCVAE。算法基于条件变分自编码模型,将用户个人信息作为条件特征,训练密码攻击模型。在编码器端,分别使用双向循环神经网络(GRU)和文本卷积神经网络(TextCNN),实现对密码序列和用户个人信息的编码和特征的抽象提取;在解码器端使用两层GRU神经网络,实现对用户个人信息和密码数据隐编码的解码,生成密码序列。该算法可以有效地拟合密码数据的分布和字符组合规律,生成高质量的猜测密码数据。多组实验结果表明,提出的PassCVAE算法优于现有的主流密码猜测算法。
- 段大高赵振东梁少虎韩忠明
- 关键词:密码攻击
- 基于行为模式的社会网络用户谱聚类算法被引量:1
- 2014年
- 利用行为模式对用户分类是一个非常新颖的问题,目前基于行为模式的社会网络用户聚类相关研究较少.在社会网络用户的交互行为的基础上构建用户行为马尔可夫模型,并采用一步转移矩阵、n步转移矩阵和收敛马尔可夫分布表达用户行为马尔可夫模型,提出相应的实现算法.基于谱聚类的思想,提出基于行为模式的社会网络用户谱聚类算法,基于行为模式的社会网络用户谱聚类能够发现行为模式相似程度较高的用户群.在人人网和脸谱网上进行了大量实验,实验结果表明本文方法对用户分类效果优于k最近邻算法.在大量用户聚类上,提出方法的聚类结果在聚类密集性和类别差异度上也都优于K最近邻算法.
- 韩忠明张晨李斌莫倩
- 关键词:社会网络马尔可夫模型谱聚类
- 基于隐回归的用户关系强度模型被引量:2
- 2016年
- 为了科学合理地度量社会网络中用户间的有向关系强度,基于用户有向交互次,提出一个度量用户交互强度的光滑模型。将用户关系强度作为隐变量,交互强度作为因变量,构建度量用户关系强度的隐变量回归模型,并给出求解隐变量回归模型的最大期望(EM)算法。分别从人人网和新浪微博采集了数据集,从最佳好友、强度排序等方面进行了大量实验。在人人网实验中,通过关系模型选择的TOP-10好友与人工标注结果比较,得出NDCG均值为69.48%,平均查准率均值(MAP)为66.3%,与对比算法相比有明显提高;在大规模新浪微博数据集实验中,将关系强度大的节点作为传染模型的源节点的传播范围相较于选择其他节点作为源节点平均提高了80%。实验结果说明所提模型能够有效度量用户间的关系强度。
- 韩忠明谭旭升陈炎杨伟杰
- 关键词:社会网络
- 一种有效的基于三角结构的复杂网络节点影响力度量模型被引量:30
- 2016年
- 度量复杂网络中的节点影响力对理解网络的结构和功能起着至关重要的作用.度、介数、紧密度等经典指标能够一定程度上度量节点影响力,k-shell和H-index等指标也可以应用于评价节点影响力.然而这些模型都存在着各自的局限性.本文基于节点与邻居节点之间的三角结构提出了一种有效的节点影响力度量指标模型(local triangle centrality,LTC),该模型不仅考虑节点间的三角结构,同时考虑了周边邻居节点的规模.我们在多个真实复杂网络上进行了大量实验,通过SIR模型进行节点影响力仿真实验,证明LTC指标相比于其他指标能够更加准确地度量节点的传播影响力.节点删除后网络鲁棒性的实验结果也表明LTC指标具有更好效果.
- 韩忠明陈炎李梦琪刘雯杨伟杰
- 关键词:复杂网络
- 基于微博评论的虚假消息检测模型被引量:9
- 2016年
- 微博虚假消息的判别是微博研究中的难点问题。为了实现快速准确识别,从源微博的评论角度出发定义了三个不同特征:支持性、置信度、内容相关性。利用所选三个特征作为输入,构建SVM分类算法判别消息真伪。以抓取的新浪微博上的真实数据集作为实验对象,利用提出的模型进行了实验并与人工神经网络对比,在虚假微博的识别中初步取得了较好的结果,可以有效的识别虚假消息。
- 段大高王长生韩忠明李斌
- 关键词:谣言支持向量机
- 基于张量投票的昆虫翅脉提取算法
- 2014年
- 昆虫翅脉提取对于昆虫自动分类意义重大。鉴于传统翅脉提取算法中存在断裂、边缘不整齐等缺点,提出一种基于张量投票的昆虫翅脉提取算法。首先对翅脉图像进行去噪、二值化、形态学等预处理,得到稀疏二值点图,然后计算每点的张量值,结合Gestalt定律的邻近性、相似性规则,对邻域内点进行张量投票,并设定投票阈值,最终获取昆虫翅脉轮廓。实验结果表明,由于引入张量和Gestalt规则,文中所提算法可以提取出更加符合感知规则的翅脉结构,得到较为完整且平滑的翅脉轮廓,同时对于出现少许断裂的翅脉图像,依然可以获得较为完整的翅脉边缘,这为后期的昆虫自动分类奠定基础。
- 段大高龚乐万月亮韩忠明
- 关键词:张量投票视觉感知
- 基于梯度提升决策树的微博虚假消息检测被引量:21
- 2018年
- 微博是信息共享的重要平台,同时,也成为虚假消息产生和推广的重要平台,虚假消息的传播严重扰乱了社会秩序。为了快速、有效地识别微博虚假消息,提出一种基于梯度提升决策树(GBDT)的虚假消息检测方法。首先,从评论的角度分析微博虚假消息和真实消息之间存在的差异,在此基础上提取评论中的文本内容、用户属性,信息传播和时间特性的分类特征;然后,基于分类特征,采用GBDT算法实现微博虚假消息识别模型;最后,在两个真实的微博数据集上进行验证。实验结果表明,基于GBDT的识别模型能有效提高微博虚假消息检测的准确率。
- 段大高盖新新韩忠明刘冰心
- 关键词:社交网络
- 互联网环境下传输特征数据采集精度估计被引量:4
- 2018年
- 对互联网环境下数据传输过程特征的采集精度的估计,能够有效提高数据传输的正确性。对传输数据特征采集精度估计精度的评估,需要结合二进制向量描述方法选取数据特征,对传输数据的联合参量进行估计,完成对传输数据特征采集精度估计精度的估计。传统方法选择一个数据采集区域中心节点的取样值,获得数据传输区域测量值,但忽略了对联合参数的估计,导致其数据采集精度的估计效果不理想。提出基于相干功率谱密度估计的互联网环境下传输特征数据采集精度估计方法。计算传输数据时间序列的自相关函数,结合二进制向量描述方法进行传输数据的特征优选,利用时间联合估计方法对传输数据进行特征检测和联合参量估计,实现传输数据特征的准确采集,实现对数据采集的高精度估计。实验结果表明,所提方法对数据传输特征的采集精度较高,能够高效对传输特征数据采集的精度进行估计。
- 刘雯董健段大高郑晨烨
- 关键词:互联网环境数据采集
- 基于内容的热点话题传播模型被引量:9
- 2013年
- 采用传染病模型对网络热点话题的传播进行建模具有重要的价值,但是现有的传染病模型并没有区分话题类型和不同用户传播话题的概率,为此提出一个基于内容的网络热点话题传播模型.模型中引入了用户对话题传播的敏感度,基于用户话题敏感度定义了单个用户传播话题的概率,融合话题的内容分类特性、用户传播概率、用户重入概率等因素,借鉴SIRS模型的基本思想,构建了话题传播模型(CSIRS).在无标度网络、小世界网络、随机网络和真实社会网络上作了不同实验,实验结果表明CSIRS模型不仅能够呈现一般传染病动力模型的传播模式,还能够呈现多个波动、小范围长时间传播、快速上升缓慢下降等社会网络热点话题的传播模式.该模型为融合网络结构和话题内容属性建模话题传播过程带来新的研究思路.
- 韩忠明张慧张梦
- 关键词:传染病模型
- 面向结构洞的复杂网络关键节点排序被引量:46
- 2015年
- 复杂网络中的结构洞节点对于信息传播具有重要作用,现有关键节点排序方法多数没有兼顾结构洞节点和其他类型的关键节点进行排序.本文根据结构洞理论与关键节点排序相关研究选取了网络约束系数、介数中心性、等级度、效率、网络规模、Page Rank值以及聚类系数7个度量指标,将基于List Net的排序学习方法引入到复杂网络的关键节点排序问题中,融合7个度量指标,构建了一个能够综合评价面向结构洞节点的关键节点排序方法.采用模拟网络和实际复杂网络进行了大量实验,人工标准试验结果表明本文排序方法能够综合考虑结构洞节点和核心节点,关键节点排序与人工排序结果具有较高的一致性.SIR传播模型评估实验结果表明由本文选择TOP-K节点发起的传播能够在较短的传播时间内达到最大的传播范围.
- 韩忠明吴杨谭旭升段大高杨伟杰
- 关键词:复杂网络