邓全
- 作品数:12 被引量:5H指数:1
- 供职机构:国防科学技术大学计算机学院更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金中国人民解放军总装备部预研基金更多>>
- 相关领域:电子电信自动化与计算机技术航空宇航科学技术更多>>
- 高性能自研处理器物理设计频率提升方法
- 2024年
- 提升处理器核的频率是提升处理器性能的重要手段.传统的物理设计流程难以实现高主频的处理器核.基于业界主流的布局布线工具,通过嵌入手工定制部件的网表、逻辑和物理设计协同优化、优化定制布线规则、优化物理设计方法学等组合策略.在相同工艺、面积、功耗对等条件下,达到流片签核要求时,自研处理器核物理设计频率比原始设计可提升约30%.
- 何小威乐大珩乐大珩隋兵才郭维
- 关键词:布局布线物理设计
- 引入电流变化率的电源分布网络最差噪声分析算法被引量:1
- 2016年
- 随着时钟频率的增加以及电源电压的降低,电源完整性问题日益凸显。将电流变化率加入到最差噪声算法的电流约束中,能够在任意电流变化率的情况下分析电源分布网络的最差噪声,从而获得更加真实的最差噪声。另外,利用改进的Knuth-Yao四边形不等式法对基于动态规划的最差噪声算法进行加速,加速后算法的时间复杂度从O(n^2m)降为O(mnlogn)。
- 赵振宇孙浩邓全蒋剑锋
- 关键词:动态规划时域分析
- RISC-V指令集架构的乱序超标量处理器中指令融合的实现
- 指令融合技术通过在处理器执行指令时将两条指令融合成一条指令进行重命名、发射和执行来增大处理器的实际发射宽度,并且减少指令占用的乱序执行资源数目和降低调度开销.指令融合的实现因处理器微架构的不同而不同,本文在自研的RISC...
- 孙彩霞郑重倪晓强邓全郭辉隋兵才王永文
- 关键词:乱序超标量
- DMR:兼容RISC-V架构的乱序超标量通用处理器核被引量:1
- 2021年
- DMR是由国防科技大学计算机学院自研的一款兼容RISC-V架构的乱序超标量通用处理器核,支持用户态(user-mode)、特权态(supervisor-mode)和机器态(machine-mode)三种特权级模式,兼容RV64G指令集规范,并进行了自定义向量扩展,虚存系统支持Sv39和Sv48,物理地址为44b.DMR的单周期整数流水线为12级,指令乱序发射、顺序提交,指令发射宽度为4,实现了多个分布式调度队列,每拍最多可乱序调度9条指令执行.DMR采用覆盖率驱动的多层次、多平台的功能验证方法,已经在FPGA原型系统下成功启动Linux OS,CoreMark分数为5.12MHz,在14nm工艺下主频可达到2GHz.
- 孙彩霞郑重邓全隋兵才王永文倪晓强
- 关键词:乱序超标量通用CPU
- 访存子系统关键参数配置对访存延迟的影响的实例研究
- 处理器核心执行程序的性能,在较大程度上受限于访存子系统的效率。多级Cache设计的初衷就是通过时间-空间折中的方式,来减小"存储墙"对处理器访存性能或执行程序性能的影响。访存子系统关键参数的不同配置组合对访存效率影响很大...
- 郭维郑重雷国庆邓全
- 关键词:CACHE处理器高性能
- 应用级兼容RISC-V的混合指令集处理器
- 2023年
- 指令集架构的改变会导致处理器硬件平台发生变化,面向旧硬件平台编译的二进制应用程序将无法在新的硬件平台上继续运行。提出了一种应用级兼容多种指令集的混合指令集架构,基于该混合指令集架构的处理器可原生运行多种指令集的应用,能有效避免程序开发移植的重复工作或二进制翻译执行的性能损失。在自主研发的一款处理器基础上实现了应用级兼容RISC-V的混合指令集处理器。与单一指令集相比,应用级支持2种指令集带来的硬件开销仅增加了0.45%。FPGA原型系统成功启动了面向混合指令集架构移植的操作系统,并能正确运行2种指令集的应用,验证了混合指令集架构思想的可行性。RISC-V指令集下,Coremark性能为5.58/MHz,SPECint2006的性能为8.44/GHz,SPECfp2006的性能为10.75/GHz。
- 孙彩霞隋兵才邓全郑重倪晓强王永文
- 关键词:处理器应用级
- 基于低阈值单元的高性能低功耗设计方法被引量:1
- 2015年
- 在高性能IC设计中对高低两种阈值电压技术进行比较,利用低阈值电压降低动态功耗的手段实现降低总功耗的目标,并分析出了两种阈值电压低功耗设计各自适应的电路类型。首先对40nm工艺中标准单元的内部功耗、时序、尺寸进行分析。接着在相同延时下对高阈值和低阈值两种标准单元所设计的反相器链时序电路的功耗进行对比分析。最后基于Benchmark和AES两种类型电路,分别采用高阈值和低阈值进行综合,对比得出在相同时钟周期下更低功耗的设计所对应的阈值电压设计方式。结果显示,在相同的时钟频率下,对动态功耗占据总功耗比例极大的电路使用低阈值设计得到的功耗更低。同样,在动态功耗比例不是极大的电路中,当低阈值综合的slack为正时,以及当高阈值综合的slack为负、低阈值的slack为0时,用低阈值设计功耗更低;而当高阈值、低阈值综合的slack都为0时,用高阈值设计功耗更低。
- 倪灿灿赵振宇唐皓月曲连华李欢李鹏邓全
- 关键词:阈值电压动态功耗
- 兼容bfloat16的高速浮点加法器设计
- 2021年
- 为了提高人工智能、深度学习等领域对于浮点数计算的速度,介绍了一种兼容bfloat16格式的高速浮点加法器,在可以完成正常格式的16、32、64位浮点数计算,同时兼容bfloat16格式浮点数进行计算,利用对应的浮点加法指令编写定向测试激励进行功能验证,对设计结果利用软件综合验证。设计使用主流的双通路TWO-PATH算法,即根据阶码差值大小将计算转化为不同路径计算,首先为减少计算绝对延时,调整计算步骤缩减流水线拍数;然后在半精度加法中实现兼容bfloat16格式。相比于初始设计频率下降1.36%,为2.16 GHz,面积增加14.01%,功率增加53.31%。
- 胥涛秦水介邓全
- 基于简化电阻电容电路的单粒子效应应用研究
- 2014年
- 随着器件尺寸缩小至纳米级,微观粒子对半导体器件的影响变得越来越明显。器件可靠性的研究近年来逐渐引起了人们的重视,开展了很多相关研究。以研究单粒子翻转效应为核心,在传统混合仿真的基础上,采用简化RC电路模型对简化电路的应用进行研究,总结了电阻和电容值变化对等效电路中敏感节点处电学特性变化的规律,探究了使用Id-Vd曲线判断单粒子翻转的准确性,提出了在研究临位翻转时,通过单次实验即可有效预测临位翻转情况的方法。根据实验所得的电压电流曲线图形特点对它们进行分类,从而判断临位翻转。通过模拟实验与预测结果比对,两者的结果相符,预测有较高准确性。
- 邓全王天琦李鹏张民选肖立伊
- 关键词:单粒子效应软错误
- 3D SRAM中的TSV开路故障模型研究被引量:2
- 2014年
- 基于3D-IC技术的3DSRAM,由于硅通孔TSV制造工艺尚未成熟,使得TSV容易出现开路故障。而现有的TSV测试方式均需要通过特定的电路来实现,增加了额外的面积开销。通过对2D Memory BIST的研究,针对3DSRAM中的TSV全开路故障进行建模,根据TSV之间的耦合效应进行广泛的模拟研究,分析并验证在读写操作下由于TSV的开路故障对SRAM存储单元里所存值的影响,将TSV开路故障所引起的物理故障映射为SRAM的功能故障。该故障模型可以在不增加额外测试电路的情况下,为有效测试和解决这种TSV开路故障提供基础。
- 蒋剑锋赵振宇邓全朱文峰周康
- 关键词:TSV开路故障