博洛尼亚大学和苏黎世联邦理工学院的研究人员发表了一篇题为“DARKSIDE:用于片上极端边缘DNN推理和训练的异构RISC-V计算集群”的新技术论文。
摘要
“片上深度神经网络(DNN)推理和极端边缘(TinyML)的训练对延迟、吞吐量、准确性和灵活性提出了严格的要求。异构集群将dsp增强核心的灵活性与专用加速器的性能和能量提升相结合,是应对这一挑战的有希望的解决方案。我们提出了DARKSIDE,一个片上系统,具有8个RISC-V内核的异构集群,增强了2-b到32-b混合精度整数算法。为了提高关键计算密集型DNN内核的性能和效率,集群中增加了三个数字加速器:1)低数据重用深度卷积内核的专用引擎(高达30 MAC/周期);2)一个最小的开销数据传输,以编组1 - 32b的数据;3)用于平铺矩阵乘法加速的16-b浮点张量积引擎(TPE)。DARKSIDE采用65纳米CMOS技术实现。当使用2-b整数DNN内核时,集群的峰值整数性能为65 GOPS/W,峰值效率为835 GOPS/W。当针对浮点张量操作时,TPE提供高达18.2 GFLOPS的性能或300 GFLOPS/W的效率-足以实现片上浮点训练的竞争速度加上超低功耗量化推理。”
找到这里是技术文件.出版于2022年9月。
A. Garofalo等,“暗面:基于芯片上深度神经网络推断和训练的异构RISC-V计算集群”,《IEEE固态电路学会开放杂志》,vol. 2, pp. 231-243, 2022, doi: 10.1109/OJSSCS.2022.3210082。
留言回复