国家自然科学基金(60603047)
- 作品数:46 被引量:145H指数:6
- 相关作者:任永功郑晓薇张建强张亮付玉更多>>
- 相关机构:辽宁师范大学内蒙古师范大学内蒙古大学更多>>
- 发文基金:国家自然科学基金辽宁省教育厅高等学校科学研究项目大连市优秀青年科技人才基金更多>>
- 相关领域:自动化与计算机技术文化科学文学电子电信更多>>
- 一种基于频繁模式树的最大频繁项目集挖掘算法被引量:7
- 2010年
- 目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位图建树的方法有效的减少了扫描数据库的次数,从而节省了CPU的执行时间.另外,此算法运用独特的最大频繁项目集判断策略,同时运用投影技术进行超集检测,提高了遍历的效率,实验结果表明该算法是快速有效的.
- 任永功张亮付玉
- 关键词:频繁项目集最大频繁项目集频繁模式树深度优先搜索
- 一种基于聚类分析的事务间关联规则挖掘算法被引量:1
- 2011年
- 现有算法实现了事务内到事务间最大频繁项目集的转换,能够直接发现不同用户之间的关联关系。但在处理较大的事务数据库时,由于是在原数据库基础上进行关联分析,产生了大量的虚假规则。针对上述问题提出一种基于聚类分析的事务间关联规则挖掘算法,利用聚类分析将初始的复杂的数据集进行约简,去掉冗余数据,缩小数据集,避免了多次扫描数据库和大量的虚假规则的产生。实验结果表明该方法比单独使用事务间的关联规则方法具有更高的效率,能更准确地预测用户的兴趣性。
- 祁艳艳任永功
- 关键词:WEB数据挖掘聚类分析
- 基于事件的异构平台并行程序性能可视化研究
- 2010年
- 为了便于用户快速、直观地了解到机群系统中并行应用程序的性能情况,将Linux计算机群与Windows控制显示平台相结合,提出了一种基于事件的异构平台并行程序性能可视化方法。该方法以MPI作为底层编程环境,在高层使用MPE技术,依据动态性能检测方式获取程序执行过程信息;设计C#语言及Jumpshot日志图形化分析集成工具实现并行程序性能可视化。实验结果表明,该方法可准确、直观地反映程序性能信息,有助于程序员简便、有效地对并行程序进行量化分析,对提高机群系统的可用性、改善程序性能及效率等方面具有较高的实用价值。
- 顾慧郑晓薇申安来逯文晖
- 关键词:异构平台性能检测MPE可视化
- 异构平台下的并行程序性能可视化方法
- 2010年
- 为了便于对异构平台下的并行程序性能进行分析,在对可视化技术和并行计算与控制显示平台研究的基础上设计了一种异构环境下的性能可视化模型。针对该模型的特点利用监测代码插桩技术、性能数据事后分析等方法,给出了并行性能数据获取、转换与绘图的具体方法和实现过程,为跨平台并行性能数据的采集和转换提供了一种简便方法。实验结果表明了在异构环境下该方法对并行性能数据可视化的可行性与有效性。
- 郑晓薇顾慧
- 关键词:异构并行程序性能数据获取可视化
- 均衡时空挖掘数据流中频繁项集被引量:1
- 2011年
- 数据流具有流动性、连续性以及项分布不均衡性等特点,挖掘数据流中频繁项集是一项意义重大且具有挑战性的工作。提出一种均衡时空挖掘数据流中频繁项集算法——Bala_Tree,Bala_Tree实现一遍扫描数据流、快速簇更新、周期树结构重构以及基于经典算法挖掘频繁项集。实验表明,此算法能快速扫描和更新数据,合理利用内存以及精确获得频繁项集,Bala_Tree算法优于其他同类算法。
- 宋奎勇任永功寇香霞
- 关键词:数据流频繁项集
- 多核并行技术在Image Quilting纹理合成算法中的应用被引量:1
- 2012年
- 针对Image Quilting纹理合成算法的新旧纹理块拼接特点,研究了一种创建多任务实现纹理块切割拼接的并行编程模式.设计了重叠区域缝合路径计算的多任务模块函数iq(),利用MATLAB多核集群中创建的调度器将子任务分配到各个节点上并行执行计算.实验结果表明,该算法获得了较好的加速比,提高了多核CPU的使用效率,有效地提升了多核计算机资源的利用率.
- 于梦玲郑晓薇张建强侯立斐
- 关键词:IMAGE
- 一种改进的用户浏览偏爱路径挖掘方法被引量:2
- 2009年
- 提出一种基于"三矩阵"模型的偏爱浏览路径的挖掘方法。在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。在会话矩阵上采用2个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,求得相似用户的相关页面集。并利用路径选择偏爱度在相似用户的路径矩阵上挖掘出相似用户的浏览偏爱路径。实验证明,该方法是合理有效的,能够得到更精准的用户偏爱浏览路径。
- 任永功付玉张亮
- 关键词:WEB日志
- 一种结合散列与位表挖掘频繁项目集算法被引量:2
- 2010年
- 在频繁项集的挖掘中,很多算法都是基于Apriori的。这些算法有两个共同的问题:一是把整个数据库装入内存,占用大量的空间;二是在产生候选项集和计算支持度时花费了大量的时间。为了提高效率,提出了一种基于位表挖掘频繁项目集的算法Hash-BFI。按照水平和垂直的方向把数据库压缩到位表内,以大大节省内存空间。引入散列函数计算频繁二项集,完全通过AND,OR运算得到候选项集和计算候选项集支持度,并进行剪枝,从而提高了算法效率。
- 任永功宋奎勇寇香霞
- 关键词:APRIORI频繁项集散列
- DPFS:一种基于动态规划的文本特征选择算法被引量:2
- 2009年
- 在文本特征选择过程中,针对原始特征空间维数过高、计算量过大、并且存在较大不相关性和冗余性,提出了一种基于动态规划思想的文本特征选择算法(DPFS)。首先,结合动态规划思想,基于特征与类别的相关性分析,对原始特征集合进行特征筛选,保留与类别具有强相关性和弱相关性的特征;然后,再次结合动态规划思想,对特征子集做冗余性分析,滤除弱相关且冗余的特征;最后,得到一个近似最优特征子集。实验结果表明,此算法在对数据降维和在降维过程中减少计算量是有效的。
- 任永功林楠
- 关键词:冗余性动态规划
- 三次插值样条曲线拟合多核并行算法被引量:5
- 2010年
- 充分利用多核技术提升多核处理器的资源利用率,缩短执行时间,发挥多核系统的优异性能。在多核计算机上设计了解三对角方程组的奇偶约化多线程并行程序,实现了三次样条曲线拟合的快速计算。通过实验结果的加速比对比,可以看出并行后缩短了求解方程组的时间,多核资源得到充分利用。结果表明,奇偶约化多核并行算法在三次样条曲线拟合中的应用是有效及可行的。
- 苗莎郑晓薇
- 关键词:多核三对角方程组样条曲线加速比