林晓勇 作品数:24 被引量:48 H指数:4 供职机构: 北京化工大学 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 石油与天然气工程 化学工程 更多>>
基于Hash结构的关联规则交互挖掘算法 被引量:3 2012年 关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。 朱群雄 赵春 冯磊 林晓勇关键词:关联规则挖掘 频繁模式挖掘 基于灾害仿真的虚拟应急演练系统 被引量:5 2015年 基于虚拟现实技术的虚拟应急演练有着广泛的应用,但现有演练系统往往缺少对灾害场景的有效仿真,以及预案支撑下的完整系统框架.针对上述问题,该文首先提出了一种面向应急演练的仿真系统VEDSimu,解决了实体间消息高效传输、大规模仿真模型计算问题;并基于VEDSimu开发预案脚本系统、预案推理机、考核评价以及虚拟现实客户端等其他模块,构建虚拟应急演练系统VEDSys.最后,结合VEDSys在实际企业虚拟消防演练中的应用,验证了系统的可行性、高效性与可扩展性. 冯磊 徐圆 林晓勇关键词:虚拟现实 频繁模式增量维护算法IM-FPM 被引量:2 2008年 数据挖掘是当今研究的一个热点,传感器实时收集大量的数据,将数据收集与数据挖掘技术结合起来,是现代数据处理技术发展的重要趋势。频繁模式挖掘是数据挖掘中的核心问题,本文针对数据库发生变化时频繁模式挖掘中普遍存在的重复扫描、遍历和计算问题,提出了频繁模式的增量维护算法IM-FPM。该算法充分利用已有挖掘结果来提高效率但又完全独立于上次采用的挖掘方法,并且只需对原始数据库进行一次扫描。实验结果表明,该算法能有效地解决数据库发生变化时的频繁模式增量维护问题。 林晓勇 朱群雄关键词:数据挖掘 关联规则 数据处理 一种医疗文本数据的命名实体识别方法 本发明提供了属于信息抽取技术领域的一种医疗文本数据的命名实体识别方法,本文采用隐马尔可夫模型对原始医学文本进行序列标注,得到预测分词结果。在预测分词处理结束后,利用半监督学习方法对分词结果进行迭代自学习,以得到准确的分词... 史晟辉 徐梓豪 李五锁 黄定琦 陈晓宇 张永健 朱群雄 林晓勇文献传递 基于工艺流程图的设备管理监控系统 基于工艺流程图的设备管理监控系统主要通过石油化工设备的工艺流程图对设备进行管理,该系统包括流程图交互子系统,设备全生命周期信息管理子系统,配置管理子系统和数据库子系统。本发明采用B/S构架,提供了基于流程图的全新视角,将... 徐圆 朱群雄 陶婷婷 耿志强 王艳清 李芳 林晓勇 史晟辉文献传递 基于主题模型的矩阵分解推荐算法 被引量:3 2015年 针对协同过滤算法存在的数据稀疏和忽视用户喜好多主题的问题,提出了基于主题模型的矩阵分解推荐算法,将标签、主题模型融合到了矩阵分解模型当中。该方法首先根据物品的标签提取物品的主题特征,用物品主题特征向量表达该物品,然后通过相似度计算方法得到每个物品的最近邻,最后用基于最近邻的正则化项来改进矩阵分解模型。在实验分析中,选择了不同的主题数进行比较,并且在潜在因子数不同的情况下,对比了该算法和潜在因子模型、正则化奇异值分解推荐算法。实验结果表明,改进算法能够降低预测评分的均方根误差,提高评分预测的准确度。 林晓勇 代苓苓 史晟辉 李芳关键词:推荐系统 标签 主题模型 矩阵分解 关联规则的动态维护及其在财务数据中的应用 被引量:4 2012年 关联规则挖掘在许多数据挖掘中有着广泛的应用。当数据库和支持度阈值发生变化时,现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题。该文基于增量式更新算法(IUA)和快速更新算法(FUP),提出在数据库与支持度阈值同时变化情况下的关联规则动态维护算法ARDM,并通过Hash结构与模式增长方法进行优化。实验表明:该算法充分利用了已挖掘结果,在数据库和支持度阈值同时变化时比FP-Growth大幅提高了执行效率。最后,将该算法应用于企业财务指标及财务比率分析。 朱群雄 赵春 冯磊 林晓勇关键词:关联规则 财务分析 基于PCA-DEA的乙烯装置能效分析 被引量:7 2015年 由于影响乙烯装置能耗的因素较多,有必要采用相关分析筛选与乙烯装置能效相关的因素,以确保分析的全面性与有效性。数据包络分析(DEA)作为一种非参数的效率优化分析,适用于多输入多输出系统的特点能够综合考虑乙烯能效评估中的多因素影响。输入输出指标过多或存在不当指标,则会导致 DEA 分辨率过低,需要对输入输出指标降维。为此,提出采用主元分析(PCA)降维的PCA-DEA法,并将该PCA-DEA法应用于某乙烯装置以2001~2010年的月实际生产数据为依据的能效分析中,得到比单纯选用主要指标的DEA算法和未采取PCA降维的DEA算法更好的能效分析结果。通过与单位综合能耗(SEC)对比,验证了PCA-DEA方法的有效性,为乙烯装置能效分析的准确性提供了更为实用的方法。 朱群雄 陈希 贺彦林 林晓勇 顾祥柏关键词:能效分析 数据包络分析 主元分析 降维 高密度聚乙烯串级聚合反应过程故障预测方法 高密度聚乙烯串级聚合反应过程故障预测方法应用于HDPE生产技术领域,其特征在于,结合可拓理论,建立定量与定性分析相结合的过程多维基元模型,探索过程工艺参数、操作参数、设备参数等基元模型的发散性、相关性、蕴含性和可扩性,重... 徐圆 朱群雄 耿志强 彭荻 刘辛新 陈彦京 王艳清 李芳 史晟辉 林晓勇文献传递 频繁模式挖掘和动态维护的理论与方法研究 频繁模式挖掘是许多数据挖掘任务中的核心问题,有着广泛的应用。而现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题。本文以频繁模式挖掘为切入点,系统地研究了频繁模式/效用频繁模式挖掘和动态维护的理论与方法。主... 林晓勇关键词:数据挖掘