张一川 作品数:20 被引量:113 H指数:6 供职机构: 东北大学软件学院 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于云计算的计算机实验教学系统模型研究 被引量:1 2016年 针对高校计算机实验教学过程中所面临的问题,提出将实验教学管理软件与云计算技术相结合的方法,借助云计算这种新的基于互联网、面向大众的服务计算模式,构建基于云计算的实验教学管理系统模型,并对系统模块进行阐述,该模型的提出能够有效解决实验教学中的问题,为教育信息化提供技术保障和决策支撑。 易俗 张杨 张一川关键词:云计算 计算机实验 实验教学系统 HaoLap:基于Hadoop的海量数据OLAP系统 被引量:5 2013年 近年来,随着计算机技术的发展及其在互联网、传感器和科学数据分析等领域的广泛应用,数据量爆炸性地增长,海量数据给传统的数据管理和分析带来新的挑战,学界和业界广泛采用分布式文件系统和MapReduce编程模型来应对这一挑战.介绍了HaoLap(Hadoop based OLAP),一种基于Hadoop分布式文件系统(HDFS)和MapReduce编程模型的海量数据OLAP系统.本研究吸取了MOLAP的经验:采用元数据存储多维模型以及HDFS存储事实数据,采用编码完成维和事实数据的映射,采用MapReduce完成OLAP运算.描述了HaoLap的关键技术,包括系统结构、维定义和编码、事实数据存储和编码、OLAP算法和服务接口.介绍了HaoLap在科学数据分析的应用案例,并与主流非关系数据管理系统进行性能对比.实验结果表明,尽管数据装载性能略显不足,但HaoLap的OLAP性能要优于HBase,Hive,HadoopDB等主流非关系数据管理系统. 郭朝鹏 王智 韩峰 张一川 宋杰关键词:多维数据模型 OLAP 海量数据 HDFS MAPREDUCE HaoLap:基于Hadoop的海量数据OLAP系统 近年来,随着计算机技术的发展及其在互联网、传感器和科学数据分析等领域的广泛应用,数据量爆炸性地增长,海量数据给传统的数据管理和分析带来新的挑战,学界和业界广泛采用分布式文件系统和MapReduce编程模型来应对速一挑战.... 郭朝鹏 王智 韩峰 张一川 宋杰关键词:海量数据 联机分析处理系统 结构特征 文献传递 分布式环境下的频繁数据缓存策略 被引量:3 2017年 大数据环境下利用分布式缓存技术能够提供高性能、高可用的数据查询。针对轻量级数据库应用的频繁数据缓存策略具有高效、易扩展的优点,更有利于轻型分布式数据库应用的查询优化改进。因此,通过分析用户行为和用户查询特征,研究针对近期频繁查询数据的数据缓存策略,能够预测高命中率的缓存数据,提高数据查询效率。首先分析并给出查询频繁度的定义,其次根据时间因素对缓存数据选取的影响细化用户查询操作,并通过查询数据的查询频繁度应对查询过程中不同的缓存命中情况整合节点间的缓存数据。最后,实验证明该数据缓存策略具有较高的数据命中率,能够提高数据查询的效率。实现方面可根据实际需要采用不同的缓存属性组合,具有良好的易扩展性。 易俗 殷慧文 张一川 张莉关键词:集群环境 分布式系统 大数据 大数据分析的分布式MOLAP技术 被引量:34 2014年 大数据的规模效应给数据存储、管理以及数据分析带来了极大的挑战,学界和业界广泛采用分布式文件系统和MapReduce编程模型来应对这一挑战.提出了大数据环境中一种基于Hadoop分布式文件系统(HDFS)和MapReduce编程模型的分布式MOLAP技术,称为DOLAP(distributed OLAP).DOLAP采用一种特殊的多维模型完成维和度量的映射;采用维编码和遍历算法实现维层次上的上卷下钻操作;采用数据分块和线性化算法将维和度量保存在分布式文件系统中;采用数据块选择算法优化OLAP的性能;采用MapReduce编程模型实现OLAP操作.描述了DOLAP在科学数据分析的应用案例,并与主流的非关系数据库系统进行性能对比.实验结果表明,尽管数据装载性能略显不足,但DOLAP的性能要优于基于HBase,Hive,HadoopDB,OLAP4Cloud等主流非关系数据库系统实现的OLAP性能. 宋杰 郭朝鹏 王智 张一川 于戈 Jean-Marc PIERSON关键词:大数据 多维数据模型 OLAP MAPREDUCE 多因素自适应心跳检测算法研究 被引量:6 2017年 分布式系统中心跳检测是节点故障检测机制的关键技术之一,心跳频率设定的合理性将影响到故障检测的准确性和完整性。针对大数据环境下,分布式系统产生故障受到网络、节点、作业多方面影响,为了提高心跳频率在多方面因素影响下的合理性设定,提出一种多因素心跳检测综合指标评价模型。在该模型下同时考虑网络负载情况和节点CPU工作状态及节点作业的大小对心跳检测过程的影响。在此基础上,提出了基于多因素评价模型的自适应心跳检测算法。该算法可以随网络环境、节点CPU占用率、作业任务大小自适应地改变心跳频率,综合各因素给出心跳频率设定的最优方案。最后通过实验验证了多因素对心跳频率自适应调整的影响。 易俗 殷慧文 王闯 张一川关键词:分布式系统 心跳检测 心跳频率 基于SBTM的多租约个性化业务定制系统的研究与实现 2013年 随着云计算的普及,SaaS作为一种新的软件交付模型得到了越来越广泛的关注.为了支持不同规模SaaS用户的多样化业务需求,多租约SaaS应用需要更灵活的个性化业务定制方法.从多租约SaaS应用的个性化业务构建角度,提出了一种新的基于扩展WSCL的SaaS业务-租约模型,设计并实现了基于SBTM的多租约个性化业务定制系统.该系统不仅能够支持用户采用图形化界面进行业务流程定制,简化了租约业务定制的开发.而且利用规则约束、DL匹配及Petri网性质等方法对定制流程进行合理性检测,保证流程定制过程的正确性.此外,通过基于图匹配的最优租约模型推荐方法提高了软件的开发效率.最后,介绍了该系统的框架及各个模块的基本功能并通过实例展示了该系统的效果. 张一川 张斌 刘莹关键词:SAAS 支持多租约个性化业务定制的SaaS业务-租约模型 被引量:9 2012年 面对多租约日益增长的个性化业务需求,目前大多数业务模型存在不能够灵活、简单地满足租约的个性化定制的问题,因此,提出了基于ex-WSCL的SaaS业务-租约模型(exWSCL-SBTM)作为SaaS业务流程描述方法.利用该模型以交互及变迁组织业务流程的特点,以及将业务端与租约端相分离的方式,能够提高多租约个性化业务定制的方便性和灵活性.在此基础上,给出了个性化业务定制操作行为的定义,以及提出了基于SBTM的多租约个性化业务定制框架. 张一川 张斌 刘莹关键词:SAAS 个性化 基于Hadoop的大数据查询系统简述 被引量:5 2013年 近年来,随着计算机技术的迅猛发展,其领域迎来了大数据时代。随着大数据的出现,传统的关系型数据库已经不能满足高储存量的要求,此时成本低廉、有着良好并行性和伸缩性的云数据库应运而生,它采用键值对数据模型和分布式的计算环境。但是海量数据在Key-value数据库中的查询效率低下、实时性差等问题又普遍存在。为了解决查询效率低下这一问题,将多维数据模型和索引技术应用于Key-value数据库,将事实数据以多维的形式进行存储并在多维模型上建立索引以加快查询速度。论文将系统地描述多维数据模型的建立和索引技术的实现,最后简单地和主流Key-value数据库进行优缺点对比。 陈梦杰 陈勇旭 贾益斌 张一川 宋杰关键词:大数据 TREE 一种支持用户动态需求的服务组合模型 通过组合已有服务提供新的增值服务的服务组合是一种具有重要价值的应用构造模式。在目前服务组合的方法中,都是通过事先预测用户动态需求的方法对服务组合流程建模,不能预测到因服务空间的变化而导致的用户动态需求的变化,因而无法有效... 汪德帅 刘唯实 张一川 张斌关键词:服务组合模型 软件工程 文献传递