搜索到581篇“ FP-TREE“的相关文章
基于关联分析FP-Tree算法的企业风险信息数据在线挖掘方法
2024年
现阶段的数据挖掘方法缺少对数据关联分析的过程,挖掘效果较差,故文章提出基于关联分析频繁模式树(FrequentPattern Tree, FP-Tree)算法的企业风险信息数据在线挖掘方法。选取与企业风险相关的信息指标,收集有关数据并进行预处理操作后,设计一种考虑关联分析的FP-Tree算法,生成FP-Tree节点的条件模式树挖掘频繁项集,计算满足最小置信度的频繁项集,实现企业风险信息数据在线挖掘。实验结果表明,所用方法挖掘量和挖掘效率较高。
庞泰翁巍孟灿赵蕾牛红伟
关键词:数据挖掘
基于FP-tree的新能源汽车产业国际竞争力影响因素关联挖掘算法
2024年
为充分挖掘新能源汽车产业国际竞争力影响因素、探究价值增长点,提出了基于FP-tree的影响因素关联挖掘算法。通过构建国际竞争力各指标影响因素的关联规则,分析任意事务数据集中的关联数据,利用最小支持度参数minsup按照从上到下的方式搜索,确定最长的频繁项目集,采用FP-tree关联频繁项目集,设定分支关联性挖掘标准,实现了新能源汽车产业国际竞争力影响因素的挖掘。测试结果表明,设计算法的最小支持度和数据关联挖掘时间较短,置信度分析具有较高的稳定性。
邱璜
关键词:FP-TREE新能源汽车产业国际竞争力影响因素关联规则
基于FP-tree和MapReduce的集合相似度自连接算法被引量:1
2023年
利用集合相似度自连接算法找出一个集合集中所有相似度大于给定阈值的集合对有着广泛的应用.基于过滤-验证框架和并行分布式计算框架MapReduce的集合相似度连接是近年来的研究热点.但现有算法在阈值低时产生较大规模的候选集,导致性能不理想.针对这一问题,提出采用频繁模式树FP-tree及其派生结构FP-tree*将数据压缩在内存中计算集合相似度自连接以减小候选集规模.首先设计并讨论基于现有FP-tree*的集合相似度连接计算及其优缺点,提出遍历效率更高的线性频繁模式树结构模型TELP-tree及基于它的算法TELP-SJ(TELP-tree self join),其包括分别面向构建树和遍历树的2阶段过滤算法,这些算法可以减小树规模和减少树遍历.然后,设计基于MapReduce的并行分布式算法FastTELP-SJ.最后,基于4组真实应用数据集进行3组性能比较实验.实验结果表明FastTELP-SJ算法面向高维大规模集合相似度自连接计算时,包括执行时间、内存占用率、磁盘使用量和可扩展性的运行效率最好.
冯禹洪吴坤汉黄志鸿冯洋洲陈欢欢白鉴聪明仲
关键词:FP树MAPREDUCE框架
基于词云图和FP-tree的历保建筑修缮管控分析
2022年
历史保护建筑的修缮工程逐渐成为了城市更新与改造不可或缺的重点内容之一。通过词云图分析对上海市历史保护建筑工程修缮工作中的管控共性要点进行梳理与分析,并利用FP-tree关联规则分析各管控要点间的逻辑衔接关系,提炼出“立面恢复要到位”,“装饰复原要细致”,“重点部件要关注”三方面的共性管控要点,为历史保护建筑修缮管控提供一定的参考和借鉴。
肖思奇孙恺毓顾钦子黄科锋
关键词:城市更新历史保护建筑保护修缮FP-TREE
基于FP-tree关联算法的文献主题研究--以大数据哲学研究为例被引量:2
2022年
数据科学与人文社会科学的融合,不仅能丰富人文社会科学的研究方法,还能拓展研究思路、发现新问题、提出新议题。这种融合将人文社会科学研究带入了一个前所未有的时代。本文介绍了一种利用FP-tree算法对社会科学文献关键词做关联规则挖掘,从而获得相关研究领域研究重点、趋势、研究进路以及“数字意外”的流程和方法,并将该方法应用于“大数据哲学研究”领域,直观地揭示目前该领域的研究重点、现状和相关研究路径等。
薛永红曾琢
关键词:文献主题文本分析大数据哲学
基于关联分析FP-Tree算法的企业风险预警方法
本发明涉及一种基于关联分析FP‑Tree算法的企业风险预警方法。构建企业指标数据集,而后运用互熵‑区间套法进行分箱、卡方检验相关性筛选指标,最后运用关联分析FP‑Tree算法进行企业风险预警。本发明不仅能够从单指标数据分...
吴志雄甘建武李晓琼黄鼎
基于FP-Tree算法的电网二次设备状态评价指标的信息挖掘处理方法
本发明公开了一种基于FP‑Tree算法的电网二次设备状态评价指标的信息挖掘处理方法,步聚如下:一、二次设备状态数据收集,构建二次设备的缺陷集;二、FP‑Tree算法应用,具体过程如下:<Image file="DEST_...
赵明婧
基于FP序列树的法文词语提取方法研究被引量:1
2021年
法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库。该方法把文本中的单词共现信息压缩为FP序列树结构,快速提取频繁词串并计算其成词度,得到法文词语集合。实验表明,该方法的准确率高达90%,且具有比现有法文词语提取方法更高的召回率,能有效支持法语文本挖掘应用。
于娟吴晓鹏廖晓刘建国
关键词:文本压缩
FP-Tree算法规则挖掘的研究与应用被引量:2
2021年
FP-Tree算法的规则挖掘以及阈值设定与规则获取的关系进行了研究.选取高校医疗系统中存储的大学生体检数据,并对这些原始数据进行过滤、转换等加工处理,得到便于进行规则挖掘的事务数据库.将事务数据库中的数据用FP-Tree算法进行处理,得到数据之间的关联关系,从而对应获取大学生群体中常见慢性病之间的关联关系.在FP-Tree算法应用过程中设定相关参数的不同阈值,并反复实验调整最小支持度阈值和最小置信度阈值以满足医学标准.所获得的关联关系可以在患某种慢性病的早期就敦促大学生改掉不良嗜好、养成良好的生活习惯,降低严重慢性疾病发生的概率.
王大勇李丽张蕾孙时光
关键词:FP-TREE算法关联规则数据挖掘事务数据库慢性病
基于FP-Tree算法的汉语复句关系词依存关系规则的自动挖掘
2021年
目前关系词识别规则库中共有规则734条,主要是基于字面特征的规则,仍需补充基于依存关系的规则。本文在依存语法的基础上,运用挖掘频繁项集的FP-tree算法对复句中依存规则进行自动挖掘。首先对语料进行预处理,为避免每次重复扫描数据库,先根据关系词对复句进行分类;同时排除数据集过小的分类结果,以保证挖掘规则的质量;然后利用特征分析器分析预处理后的语料,并对分析结果进行形式化表示得到复句的依存特征集合;接着用FP-tree算法对实验语料进行规则挖掘,共挖掘规则84条。实验结果表明,FP-tree算法对依存规则进行自动挖掘的可行性和有效性。
涂馨丹
关键词:关系词FP-TREE

相关作者

孙志挥
作品数:187被引量:2,100H指数:26
供职机构:东南大学计算机科学与工程学院
研究主题:数据挖掘 关联规则 数据库 频繁模式树 数据流
易月娥
作品数:19被引量:25H指数:3
供职机构:长沙民政职业技术学院
研究主题:无线传感器网络 FP-TREE 关联规则 数据挖掘 关联规则挖掘算法
姜晗
作品数:24被引量:77H指数:5
供职机构:济宁职业技术学院
研究主题:关联规则 最大频繁项集 频繁项集 频繁闭项集 FP-TREE
李伟平
作品数:57被引量:310H指数:7
供职机构:北京大学
研究主题:情境感知 计算机 电子设备 社交网络 SOA
马丽生
作品数:39被引量:76H指数:6
供职机构:滁州学院
研究主题:数据挖掘 粗糙集 正区域 关联规则 最大频繁项目集