您的位置: 专家智库 > >

文献类型

  • 1篇期刊文章
  • 1篇专利

领域

  • 1篇自动化与计算...

主题

  • 1篇多叉树
  • 1篇数据挖掘
  • 1篇索引
  • 1篇索引表
  • 1篇关联规则
  • 1篇APRIOR...
  • 1篇APRIOR...
  • 1篇HBASE
  • 1篇查询
  • 1篇查询方法
  • 1篇查询条件
  • 1篇查询系统
  • 1篇查询执行
  • 1篇SPARK

机构

  • 2篇烽火通信科技...
  • 1篇武汉邮电科学...

作者

  • 2篇刘宇
  • 1篇曹俊亮
  • 1篇周帅锋
  • 1篇赵智峰
  • 1篇韦蓉
  • 1篇王勇强
  • 1篇李佳宁

传媒

  • 1篇信息技术

年份

  • 1篇2018
  • 1篇2015
2 条 记 录,以下是 1-2
排序方式:
HBase二级索引存储和查询系统及其查询方法
本发明涉及数据处理技术领域,尤其涉及HBase二级索引存储和查询系统及其查询方法,包括客户端、查询处理模块、查询执行引擎模块和HBase存储模块。本发明将数据表存储在SSD固态硬盘,相较于传统的SATA硬盘,数据读写速度...
王勇强赵智峰周帅锋曹俊亮李佳宁韦蓉刘宇
文献传递
基于多叉树和Spark的改进Apriori算法被引量:3
2018年
文中基于Spark和多叉树对传统Apriori算法进行改进,将原始事物数据库转换为布尔矩阵,切割成多个分区数据库后交由Spark的各个Worker节点处理,以多叉树的形式存储中间结果,最后交由主节点进行合并,得到全局频繁项集。将基于Spark实现的Apriori算法同Hadoop环境下的Apriori算法进行性能对比,发现在数据量相同的情况下基于Spark的Apriori算法较基于Hadoop的Apriori算法执行时间减少了67%以上,采用多叉树存储中间结果后,算法执行时间在原来的基础上减少了44%以上。文中实验证明了Spark比Hadoop更适用于Apriori这种以迭代搜索方式执行的算法,且采用多叉树存储中间结果可有效地提高算法执行效率。
曹佳豪刘宇
关键词:数据挖掘关联规则APRIORI多叉树SPARK
共1页<1>
聚类工具0