国家自然科学基金(61170112)
- 作品数:42 被引量:407H指数:11
- 相关作者:韩忠明段大高莫倩杨伟杰陈炎更多>>
- 相关机构:北京工商大学公安部第三研究所东华大学更多>>
- 发文基金:国家自然科学基金教育部人文社会科学研究基金北京市属高等学校科学技术与研究生教育创新工程建设项目更多>>
- 相关领域:自动化与计算机技术理学冶金工程电子电信更多>>
- 基于隐回归的用户关系强度模型被引量:2
- 2016年
- 为了科学合理地度量社会网络中用户间的有向关系强度,基于用户有向交互次,提出一个度量用户交互强度的光滑模型。将用户关系强度作为隐变量,交互强度作为因变量,构建度量用户关系强度的隐变量回归模型,并给出求解隐变量回归模型的最大期望(EM)算法。分别从人人网和新浪微博采集了数据集,从最佳好友、强度排序等方面进行了大量实验。在人人网实验中,通过关系模型选择的TOP-10好友与人工标注结果比较,得出NDCG均值为69.48%,平均查准率均值(MAP)为66.3%,与对比算法相比有明显提高;在大规模新浪微博数据集实验中,将关系强度大的节点作为传染模型的源节点的传播范围相较于选择其他节点作为源节点平均提高了80%。实验结果说明所提模型能够有效度量用户间的关系强度。
- 韩忠明谭旭升陈炎杨伟杰
- 关键词:社会网络
- 带隐变量的回归模型EM算法被引量:1
- 2014年
- 带有隐变量的回归模型具有非常广泛的应用场合,隐回归模型的参数求解问题依赖于自变量的分布假设。基于自变量的beta分布的假设条件,给出了隐回归模型的EM算法,详细地推导了模型中的参数求解过程,给出了使用牛顿法求解beta分布参数的算法,并提出一个合适的初值选择算法。在模拟数据和真实数据的基础上进行了详细的比较性试验,结果表明,对具有不同分布特征的因变量观察值,EM算法能够有效地求解隐回归模型的参数。
- 韩忠明吕涛张慧姜同强
- 关键词:最大期望算法
- 基于网络嵌入方法的耦合网络节点表示学习
- 2020年
- 网络节点表示学习是网络数据分析挖掘中的一个基础问题,通过学习网络节点表示向量,可以更加精准地对网络节点进行表征.近年来,随着深度学习的发展,嵌入方法在网络节点表示学习方面得到了广泛应用.同时,网络数据在规模、模态等特征方面也有了很大的变化,研究重点从单网络分析挖掘逐渐演变至耦合网络分析挖掘.本文首先分析了嵌入方法在单网络节点表示学习中的研究现状,对比了现有方法的优劣.然后借鉴单网络中嵌入方法的思想,针对耦合网络提出了耦合网络嵌入模型CWCNE.针对耦合网络的特性,改进了嵌入方法中的游走算法,提出了一种网络间带约束的随机游走策略;同时改进了模型的训练方法,使用网络间迭代训练的方式来学习模型参数.最后使用了社交耦合网络、学术耦合网络、影视耦合网络、诗词耦合网络、著作耦合网络等5组数据集验证了CWCNE的有效性.并在社团划分、实体识别、标签分类等任务上取得了良好的结果.
- 韩忠明刘聃郑晨烨刘雯刘雯段大高
- 关键词:网络嵌入社团划分标签分类
- 互联网科技专家搜索系统被引量:3
- 2013年
- 提出和设计了一个为用户自动收集、分析和整理科技专家信息的科技专家搜索系统.描述了互联网科技专家搜索系统的体系结构、主要特征和关键技术.系统采用基于特征向量的分类算法,设计了一种适合于互联网大规模科技专家信息抽取的方法,利用互联网上的信息资源高效的抽取专家信息、挖掘专家学术关系,为科技专家发现和搜索研究提供了一种新的思路.
- 莫倩张传想
- 关键词:信息抽取学术搜索
- 面向领域的智能搜索引擎设计与实现被引量:2
- 2012年
- 传统的主题搜索技术难以适应大范围垂直领域的智能搜索需求,通过将主题搜索与语义搜索相关技术分别应用到搜索引擎的数据采集与智能查询过程中,利用基于层次分类模型的领域数据采集机器人,完成对领域信息的精准采集,基于中文百科资源自动构建领域本体,将大规模领域本体库用于搜索引擎的语义扩展推理中,实现了一个面向领域的智能搜索引擎。实验结果表明,基于层次结构的领域分类具有较高的分类准确率和召回率,与其他搜索引擎相比较,该系统具有领域专业性强、领域易于移植、检索更加智能等特点。
- 莫倩张树王芳
- 关键词:主题搜索语义搜索领域本体
- 一种有效的基于三角结构的复杂网络节点影响力度量模型被引量:30
- 2016年
- 度量复杂网络中的节点影响力对理解网络的结构和功能起着至关重要的作用.度、介数、紧密度等经典指标能够一定程度上度量节点影响力,k-shell和H-index等指标也可以应用于评价节点影响力.然而这些模型都存在着各自的局限性.本文基于节点与邻居节点之间的三角结构提出了一种有效的节点影响力度量指标模型(local triangle centrality,LTC),该模型不仅考虑节点间的三角结构,同时考虑了周边邻居节点的规模.我们在多个真实复杂网络上进行了大量实验,通过SIR模型进行节点影响力仿真实验,证明LTC指标相比于其他指标能够更加准确地度量节点的传播影响力.节点删除后网络鲁棒性的实验结果也表明LTC指标具有更好效果.
- 韩忠明陈炎李梦琪刘雯杨伟杰
- 关键词:复杂网络
- 基于张量投票的昆虫翅脉提取算法
- 2014年
- 昆虫翅脉提取对于昆虫自动分类意义重大。鉴于传统翅脉提取算法中存在断裂、边缘不整齐等缺点,提出一种基于张量投票的昆虫翅脉提取算法。首先对翅脉图像进行去噪、二值化、形态学等预处理,得到稀疏二值点图,然后计算每点的张量值,结合Gestalt定律的邻近性、相似性规则,对邻域内点进行张量投票,并设定投票阈值,最终获取昆虫翅脉轮廓。实验结果表明,由于引入张量和Gestalt规则,文中所提算法可以提取出更加符合感知规则的翅脉结构,得到较为完整且平滑的翅脉轮廓,同时对于出现少许断裂的翅脉图像,依然可以获得较为完整的翅脉边缘,这为后期的昆虫自动分类奠定基础。
- 段大高龚乐万月亮韩忠明
- 关键词:张量投票视觉感知
- 基于内容的热点话题传播模型被引量:9
- 2013年
- 采用传染病模型对网络热点话题的传播进行建模具有重要的价值,但是现有的传染病模型并没有区分话题类型和不同用户传播话题的概率,为此提出一个基于内容的网络热点话题传播模型.模型中引入了用户对话题传播的敏感度,基于用户话题敏感度定义了单个用户传播话题的概率,融合话题的内容分类特性、用户传播概率、用户重入概率等因素,借鉴SIRS模型的基本思想,构建了话题传播模型(CSIRS).在无标度网络、小世界网络、随机网络和真实社会网络上作了不同实验,实验结果表明CSIRS模型不仅能够呈现一般传染病动力模型的传播模式,还能够呈现多个波动、小范围长时间传播、快速上升缓慢下降等社会网络热点话题的传播模式.该模型为融合网络结构和话题内容属性建模话题传播过程带来新的研究思路.
- 韩忠明张慧张梦
- 关键词:传染病模型
- Epidemic机制下基于优先级的机会网络路由算法
- 2012年
- 在机会网络某些应用场景中,部分节点有优先使用网络资源的需求。提出并在ONE仿真平台上实现了Epidemic机制下基于优先级策略的路由算法。该算法为网络中节点分配了不同的优先级,并通过一定的策略抑制低优先级节点使用网络资源,以此来保证高优先级节点优先使用网络资源。仿真结果表明,当选择恰当的时间因子时,该算法可有效地抑制Epidemic过度泛洪,在不影响网络总体性能的前提下大幅度提高优先级节点的性能。
- 孙践知张迎新陈丹韩忠明
- 关键词:机会网络路由算法EPIDEMIC
- 基于条件变分自编码的密码攻击算法被引量:1
- 2020年
- 使用密码猜测算法是评估用户密码强度和安全性的有效方法,提出一种基于条件变分自编码密码猜测算法PassCVAE。算法基于条件变分自编码模型,将用户个人信息作为条件特征,训练密码攻击模型。在编码器端,分别使用双向循环神经网络(GRU)和文本卷积神经网络(TextCNN),实现对密码序列和用户个人信息的编码和特征的抽象提取;在解码器端使用两层GRU神经网络,实现对用户个人信息和密码数据隐编码的解码,生成密码序列。该算法可以有效地拟合密码数据的分布和字符组合规律,生成高质量的猜测密码数据。多组实验结果表明,提出的PassCVAE算法优于现有的主流密码猜测算法。
- 段大高赵振东梁少虎韩忠明
- 关键词:密码攻击