赵二虎 作品数:26 被引量:13 H指数:2 供职机构: 中国科学院计算技术研究所 更多>> 发文基金: 国家科技重大专项 更多>> 相关领域: 自动化与计算机技术 理学 文化科学 更多>>
支持多卡并行的嵌入式智能计算装置 本发明提出一种支持多卡并行的嵌入式智能计算装置,包括嵌入式智能计算板卡、主控与IO板卡和RapidIO交换板卡;嵌入式智能计算装置采用高速RapidIO分布式对等网络,并采用标准VPX嵌入式智能计算系统多卡并行计算、标准... 徐勇军 吴济文 赵二虎 安竹林嵌入式异构智能计算系统并行多流水线设计 2023年 嵌入式智能计算系统因其功耗受限和多传感器实时智能处理需要,对硬件平台的智能算力能效比和智能计算业务并行度提出了严峻挑战.传统嵌入式计算系统常采用的DSP+FPGA数字信号处理架构,无法适用于多个神经网络模型加速场景.本文基于ARM+DLP+SRIO嵌入式异构智能计算架构,利用智能处理器多片多核多内存通道特性,提出了并行多流水线设计方法.该方法充分考虑智能计算业务中数据传输、拷贝、推理、结果反馈等环节时间开销,为不同的神经网络模型合理分配智能算力资源,以达到最大的端到端智能计算业务吞吐率.实验结果表明,采用并行多流水线设计方法的深度学习处理器利用率较单流水线平均提高约25.2%,较无流水线平均提高约30.7%,满足可见光、红外、SAR等多模图像实时智能处理需求,具有实际应用价值. 赵二虎 吴济文 肖思莹 晋振杰 徐勇军关键词:神经网络模型 基于ARM+DLP+SRIO的嵌入式智能计算系统研究 被引量:10 2021年 以x86+GPU为代表的当前主流AI计算平台,受限于功耗、体积、带宽、环境适应性等因素,无法适用于物端及边缘智能计算场景.提出并研究了一种基于ARM+DLP+SRIO的嵌入式智能计算系统,从AI算力、能效比、IO带宽三个方面分析了所提嵌入式智能计算系统的设计思路和技术优势,并实验验证了该系统的功能及性能指标.实验结果表明:基于ARM+DLP+SRIO的嵌入式智能计算系统AI峰值算力达到114.9TOPS,能效比达到1.03TFLOPS/W,IO带宽达到20Gbps.在智能计算系统领域,其能效比优于国内其它已知同类板卡或系统,嵌入式环境适应能力优于传统台式机和服务器,可作为物端及边缘环境下AI计算任务的通用硬件加速平台. 赵二虎 吴济文 查晶晶 郭振 徐勇军关键词:串行RAPIDIO 能效比 一种通信与调试设备电路及应用其的嵌入式智能计算系统 一种通信与调试设备电路,其特征在于,包括:第一板间高速通信连接器,包括CPU以太网MAC控制器接口、2路CPU TTL UART接口、时钟模块I2C接口、CPU JTAG接口。千兆以太网PHY芯片,一端与该CPU以太网M... 吴济文 赵二虎 徐勇军 马鼎 肖思莹 安晓静基于双目视觉的危化品事故处理剂投送靶向定位方法 本发明提供了一种基于双目视觉的危化品事故处理剂投送靶向定位方法。该方法包括:对于已检测出的从不同角度拍摄的两幅图像的危化品泄漏目标区域,基于动量守恒定理获取所述危化品泄漏目标区域的质点位置的像素坐标;基于所述危化品泄漏目... 赵二虎 王守中 徐勇军 张统 王鹏文献传递 电路布线方法、DDR4内存电路及电子设备 本发明提出一种电路布线方法,包括:于PCB基板的第一面规则设置多个元件颗粒,并于该PCB基板的第二面对应设置该元件颗粒,使该第二面的元件颗粒与该第一面的元件颗粒互为镜像;于该PCB基板设置端接电阻,以及与处理器连接的处理... 赵二虎 徐勇军 吴济文 安竹林 李超一种边缘计算平台 本发明实施例提供一种边缘计算平台,该平台包括:第一存储器、第二存储器,其中,第一存储器、第二存储器中配置有相同的操作系统,其中,第一存储器支持操作系统稳定运行,第二存储器支持操作系统更新,且边缘计算平台被配置为:在需要稳... 肖思莹 吴济文 赵二虎 徐勇军一种基于通道数搜索卷积神经网络的方法 本发明提供一种基于通道数搜索卷积神经网络的方法,包括:构建与待优化卷积神经网络的卷积层层数相同的初始卷积神经网络,并将该初始卷积神经网络每层的初始通道数设为相同数值并使初始卷积神经网络的初始通道数不超过待优化卷积神经网络... 朱徽 徐勇军 赵二虎 程坦 安竹林文献传递 一种规模易扩展的嵌入式智能计算系统 一种规模易扩展的嵌入式智能计算系统,包括:处理器模块,包括处理器主模块、内存装置、固态存储装置、通信网口装置、通信串口装置,该处理器主模块与该内存装置、该固态存储装置、该通信网口装置、该通信串口装置分别连接;智能加速模块... 吴济文 赵二虎 徐勇军 肖思莹 安晓静基于图表征知识蒸馏的图像分类方法 2024年 知识蒸馏的核心思想是利用1个作为教师网络的大型模型来指导1个作为学生网络的小型模型,提升学生网络在图像分类任务上的性能.现有知识蒸馏方法通常从单一的输入样本中提取类别概率或特征信息作为知识,并没有对样本间关系进行建模,造成网络的表征学习能力下降.为解决此问题,本文引入图卷积神经网络,将输入样本集视为图结点构建关系图,图中的每个样本都可以聚合其他样本信息,提升样本的表征能力.本文从图结点和图关系2个角度构建图表征知识蒸馏误差,利用元学习引导学生网络自适应学习教师网络更佳的图表征,提升学生网络的图建模能力.相比于基线方法,本文提出的图表征知识蒸馏方法在加拿大高等研究院(Canadian Institute For Advanced Research,CIFAR)发布的100种分类数据集上提升了3.70%的分类准确率,表明本文方法引导学生网络学习到了更具有判别性的特征空间,提升了图像分类能力. 杨传广 陈路明 赵二虎 安竹林 徐勇军关键词:图像分类 元学习