吴孔玲
- 作品数:5 被引量:17H指数:2
- 供职机构:桂林电子科技大学计算机科学与工程学院更多>>
- 发文基金:广西可信软件重点实验室开放基金广西研究生教育创新计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 序列模式挖掘研究被引量:9
- 2012年
- 为了更好地分析购物篮数据,挖掘出潜在客户,序列模式挖掘应运而生。序列模式挖掘是数据挖掘一个重要研究内容,近年来在很多领域得到广泛运用。概述序列模式挖掘的发展现状,研究基本挖掘框架的经典挖掘算法与扩展模型挖掘算法,特别针对近年来出现的新数据形式序列模式挖掘,以及基于零压缩二叉决策图(ZBDD)结构的挖掘算法做了阐述,最后对序列模式挖掘发展趋势进行了展望。
- 吴孔玲缪裕青苏杰张晓华
- 关键词:序列模式挖掘投影数据库
- 垂直分布下的隐私保护关联规则挖掘被引量:1
- 2012年
- 针对垂直分布下的隐私保护关联规则挖掘算法安全性不高和挖掘效率较低的问题,提出了一种隐私保护关联规则挖掘算法。算法采用一种新的点积协议,通过引入逆矩阵和随机数隐藏原始输入信息,具有较好的安全性;利用挖掘最大频繁项集来代替挖掘所有频繁项集,采用深度优先遍历策略,结合各种剪枝策略,明显加快了频繁项集的生成速度,大大减少计算代价。实验结果表明,挖掘效率得到了很大提高。
- 张晓华缪裕青苏杰吴孔玲
- 关键词:隐私保护关联规则最大频繁项集点积协议
- 一种基于序列末项位置信息的序列模式挖掘算法被引量:5
- 2012年
- 针对PrefixSpan算法中反复扫描投影数据库寻找局部频繁项并重复构造挖掘大量重复投影数据库的不足,提出一种基于序列末项位置信息的序列模式挖掘算法SPM-LIPT。通过连接2-序列位置信息表(LIPT)找到序列模式的下一项,实现序列模式增长,避免对投影数据库反复扫描;同时通过检查相同末项序列首位置信息表(SLIFPT)进行前向剪枝;消除大量重复投影的构建。最后通过实验证明了算法的有效性。
- 缪裕青吴孔玲朱晓雁苏杰
- 关键词:数据挖掘序列模式挖掘位置信息投影数据库
- 基于二级索引结构无候选项闭合序列模式挖掘算法
- 2012年
- 针对CloSpan算法分两个阶段挖掘闭合序列模式中第一阶段需要保持候选序列且未充分利用项的位置信息、存在对数据库重复扫描和计算大小的不足,提出了posCloSpan算法。算法通过对二级索引结构进行检索实现向前剪枝,避免数据库重复扫描以及对超序索引表、子序索引表的检测,实现非闭合序列的修剪,无须保存候选序列。实验结果证明,算法在处理较长序列以及存在大量重复投影数据库的数据源时,有效降低了时间上的开销。
- 缪裕青吴孔玲朱晓雁张锦杏
- 关键词:数据挖掘序列模式挖掘
- 基于语义倾向计算器的情感分析方法被引量:2
- 2012年
- 针对基于词典的传统分类器无法对不在词典中的情感词的极性和强度进行有效计算和细分的问题,基于最大期望模型,提出构建完善情感词典的EM-SO算法,在此基础上设计基于语义倾向计算模型的否定式和强(弱)化处理组件,以获取评价词及其修饰词的组合效应。实验结果表明,所提算法及所设计组件在评论集上对情感词极性和强度的计算性能优于SO-CAL模型,可应用到主观性分类等实际任务中。
- 苏杰缪裕青刘少兵吴孔玲
- 关键词:语义倾向情感分析否定式