王伟
- 作品数:20 被引量:179H指数:7
- 供职机构:同济大学电子与信息工程学院嵌入式系统与服务计算教育部重点实验室更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于实例的迁移时间序列异常检测算法研究被引量:7
- 2019年
- 时间序列异常检测不管在学术界还是工业界都正引起人们极大的兴趣,但同时也存在异常标签数据缺失严重这一普遍问题。为了解决该问题,文章提出了基于实例的迁移时间序列异常检测算法——InsTransAnomalyDetect算法。该算法通过构建有效的决策函数来迁移实例,将原来的无监督异常检测任务转化为监督学习的任务。算法集成两种决策函数,分别是基于密度的决策函数和基于聚类的决策函数。文章最后将该方法与两种经典的异常检测算法在24个数据集上进行效果对比。实验结果表明,在24个数据集中,文中算法的表现优于无监督的异常检测算法的数据集有21个,平均准确率提升20%左右。实验证明了文中算法的优越性。
- 王伟王伟
- 关键词:异常检测时间序列
- 基于应用驱动的异构体系结构模型
- 2013年
- 科学计算应用问题在计算模型、处理过程以及对处理器、存储器和通信的要求方面存在巨大的差异。同一种结构难以适应差异巨大的应用,造成效率低下。解决途径在于可变的体系结构,让体系结构去适应不同的应用,而不是让应用去适应单一的体系结构。不同的应用决定了不同的应用程序结构,对于不同的应用程序结构,采用最适合的体系结构去匹配,实现应用决定体系结构的模型。结果表明,基于应用驱动的异构体系结构异构模型能够达到使运算高效率、低能耗的目的。最后给出了从不同应用得到最适应体系结构的方法。
- 沈来信杨帆王伟
- 基于改进的模糊C-均值聚类的信任文摘被引量:3
- 2008年
- 信息时代的到来和互联网的发展,使信息文本呈爆炸趋势生成和传播,虚假信息的大量存在,给人们高效地获取可信的、安全的信息带来了相当的困难.如何对互联网上的信息文本进行信任评估,是内容信任和网络安全急待解决的问题.借鉴传统的自动摘要技术,首先提出了信任文摘的概念,在文本的词、句子、篇章等各个层面上发掘信任信息,改进自动分词方法,选取信任中心句并运用改进的模糊C均值聚类算法对其聚类,然后为信任中心句选择信任支撑句,最后生成了信任文摘,为基于内容的信任评估提供了一个较好的手段.
- 张泉曾国荪王伟王伟孙明军
- 关键词:模糊C-均值聚类自动文摘
- 一种最大化内存共享与最小化运行时环境的超轻量级容器被引量:7
- 2019年
- 容器技术的兴起带来了数据中心的深刻变化,大量软件转为微服务方式部署与交付.如何优化海量用户环境下大规模容器的启动、运行与维护问题具有广泛的现实意义.目前以Docker为代表的主流容器技术已经取得较大成功,但在镜像体积、资源共享等方面仍有较大改进空间.梳理了虚拟化技术的发展过程,阐明轻量级的虚拟化技术是未来的研究方向,对数据敏感型应用至关重要.通过建立库文件共享模型,探究了库文件的共享程度对容器最大启动数量的影响.给出了一种超轻量级的容器设计方案,通过细化可操作资源的粒度,使得支撑应用程序运行的容器运行时环境最小化;将依赖库文件与可执行二进制文件单独抽取成层,实现了容器对主机内存资源的最大化共享.根据上述方案实现了一种超轻量级容器管理引擎:REG(runtime environment generation),并定义了一套基于REG的工作流.在镜像体积、启动速度、内存占用、容器启动风暴等方面进行对比实验,验证了所提方法在大规模容器环境下的有效性.
- 张礼庆郭栋吴绍岭崔海波崔海波
- 关键词:轻量级资源共享
- 基于大数据的铁路信号系统数据存储与分析系统设计与实现被引量:15
- 2017年
- 文章基于Hadoop技术,设计并实现了一个铁路信号数据存储与分析系统。首先,文章研究了Hadoop平台下分布式系统工作原理、HDFS分布式文件管理作用机制、MapReduce模型。然后,针对信号检测大数据设计相关文件解析接口,处理包括txt和CSV格式的数据包;利用HDFS分布式文件管理系统完成对数据的存储和管理;根据数据存储结构设计HBase表,建立快速存取查询索引,并编写HBase操作的各式API。最后,利用Ext JS搭建前端展示页面,通过服务器与Hadoop平台通信完成电气特性分析和日志分析,并将数据处理结果以列表、曲线图和散点图的可视化方式展示在前端;同时完成了对海量数据的挖掘和可视化展现工作。
- 王伟王伟王伟郭栋
- 关键词:大数据HADOOPMAPREDUCE铁路信号系统
- 一种基于贝叶斯理论的软件可靠度评估方法被引量:1
- 2012年
- 针对目前软件测试过程中可靠性度量方法匮乏的不足,提出了一种新的基于贝叶斯理论的软件可靠度评估方法,该方法通过分析软件模块间的影响关系构建贝叶斯网络,利用贝叶斯方法和经验数据评估贝叶斯网络中各节点的可靠度.给出了可靠度计算的详细推导过程,并通过一个具体实例解释了计算过程.该方法能重用已有的测试结果,计算速度快,简单易行.通过对每个模块提供数值可靠度估算,可以作为测试用例选择的依据,降低了测试成本,从而很好地为软件测试提供支持.
- 许金超曾国荪王伟
- 关键词:可靠度贝叶斯理论软件测试
- 并行时空处理模型下的快速N-body算法被引量:3
- 2011年
- 图形处理器(graphic processing unit,GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU的CUDA(compute unified device architecture)和OpenCL(open computing language)编程模型为程序员提供了充足的类似于C语言的应用程序接口(application programming interface,API),便于程序员发挥GPU的并行计算能力。采用图形硬件进行加速计算,通过一种新的GPU处理模型——并行时间空间模型,对现有GPU上的N-body实现进行了分析,从而提出了一种新的GPU上快速仿真N-body问题的算法,并在AMD的HD Radeon 5850上进行了实现。实验结果表明,相对于CPU上的实现,获得了400倍左右的加速;相对于已有GPU上的实现,也获得了2至5倍的加速。
- 王伟王伟王伟曾栩鸿王福焕
- 关键词:N-BODY并行计算
- 一种基于机器学习的Spark容器集群性能提升方法被引量:2
- 2019年
- 目前基于Spark的应用十分广泛,合理的参数配置会使Spark作业具备较高的执行效率,很多学者对虚拟机集群上的Spark参数调优进行了深入研究。近年来,容器作为一种新兴的云计算基础设施越来越广泛地被应用于服务集群中,因而对基于容器集群的Spark参数调优进行研究也具有重要意义。文章研究了Docker容器集群中Spark的参数配置问题,提出了一种新型的参数调优方法(ContainerOpt),使用机器学习方法学习并预测作业在不同参数组合下的性能,同时引入节点自动伸缩机制,使输入规模较大的作业可以获得更优的性能。文章还提出了由时间和资源共同决定的性能表示模型,代替传统的基于单一执行时间的性能表示模型,从而在作业执行时间和资源占用之间达到较好的平衡。实验结果表明,相较于默认配置,该参数调优方法可提升50%的执行效率。
- 田春岐李静王伟王伟
- 关键词:云计算SPARKDOCKER
- AnomalyDetect:一种基于欧式距离的在线异常检测算法
- 异常检测是数据挖掘中的一项关键技术,是指在一群数据中发现离群点,在计算机和互联网领域有广泛的应用,包括网络安全、图像识别、智能运维等等.特别是智能运维,近几年取得了长足的发展.已有的异常检测算法会有低准确度、离线、无法自...
- 霍文君王伟李文
- 关键词:数据挖掘异常检测时间序列欧式距离
- 绿色评价模型的互模拟等价及逻辑保持被引量:4
- 2013年
- 绿色计算中,复杂系统的绿色评价是一个重要的研究课题,其核心任务是判断运行时时间、空间资源消耗是否满足环境约束或限定.设计时,采用模型检测技术,自动、完备、高效地进行绿色评价,是一种新颖且有效的解决方案,但可能出现的状态爆炸问题将影响评价成败或效率.引入随机决策过程作为绿色评价模型;用时态逻辑刻画包含行为正确性及时间、空间资源约束的绿色评价指标;定义不确定语义理解下评价模型状态的互模拟等价规则,给出互模拟商的构造方法以及商模型调度,并比较等价语义下的行为机理;运用结构化归纳法证明互模拟等价保持评价结论.分析表明,互模拟等价可用作状态约简手段,为基于模型的绿色评价提供理论支撑和技术手段.
- 钮俊曾国荪王伟
- 关键词:评价指标互模拟