首页

技术论文

用于TinyML DNN推理和片上训练的低功耗异构计算集群

2023年4月9日-通过:技术文件链接

博洛尼亚大学和苏黎世联邦理工学院的研究人员发表了一篇题为“DARKSIDE:用于片上极端边缘DNN推理和训练的异构RISC-V计算集群”的新技术论文。

摘要

“片上深度神经网络(DNN)推理和极端边缘(TinyML)的训练对延迟、吞吐量、准确性和灵活性提出了严格的要求。异构集群将dsp增强核心的灵活性与专用加速器的性能和能量提升相结合，是应对这一挑战的有希望的解决方案。我们提出了DARKSIDE，一个片上系统，具有8个RISC-V内核的异构集群，增强了2-b到32-b混合精度整数算法。为了提高关键计算密集型DNN内核的性能和效率，集群中增加了三个数字加速器:1)低数据重用深度卷积内核的专用引擎(高达30 MAC/周期);2)一个最小的开销数据传输，以编组1 - 32b的数据;3)用于平铺矩阵乘法加速的16-b浮点张量积引擎(TPE)。DARKSIDE采用65纳米CMOS技术实现。当使用2-b整数DNN内核时，集群的峰值整数性能为65 GOPS/W，峰值效率为835 GOPS/W。当针对浮点张量操作时，TPE提供高达18.2 GFLOPS的性能或300 GFLOPS/W的效率-足以实现片上浮点训练的竞争速度加上超低功耗量化推理。”

找到这里是技术文件．出版于2022年9月。

A. Garofalo等，“暗面:基于芯片上深度神经网络推断和训练的异构RISC-V计算集群”，《IEEE固态电路学会开放杂志》，vol. 2, pp. 231-243, 2022, doi: 10.1109/OJSSCS.2022.3210082。

用于TinyML DNN推理和片上训练的低功耗异构计算集群

留言回复取消回复

技术论文

热门文章

真正的3D比2.5D更难

在小子代周围形成的小型联合体

RISC-V验证有必要的工具吗?

技术预测:晶圆厂制程将持续到2040年

高na极紫外技术面临新挑战

知识中心
探索实体、人员和技术

相关文章

真正的3D比2.5D更难

浮点8会解决AI/ML开销吗?

RISC-V进入主流

在小子代周围形成的小型联合体

选择正确的高带宽内存

RISC-V芯片有多安全?

RISC-V验证有必要的工具吗?

芯片技术和产业动态的巨大变化

赞助商

最近的评论

关于

导航

与我们联系

用于TinyML DNN推理和片上训练的低功耗异构计算集群

留言回复取消回复

技术论文

热门文章

真正的3D比2.5D更难

在小子代周围形成的小型联合体

RISC-V验证有必要的工具吗?

技术预测:晶圆厂制程将持续到2040年

高na极紫外技术面临新挑战

知识中心探索实体、人员和技术

相关文章

真正的3D比2.5D更难

浮点8会解决AI/ML开销吗?

RISC-V进入主流

在小子代周围形成的小型联合体

选择正确的高带宽内存

RISC-V芯片有多安全?

RISC-V验证有必要的工具吗?

芯片技术和产业动态的巨大变化

赞助商

通讯注册

受欢迎的标签

最近的评论

关于

导航

与我们联系

知识中心
探索实体、人员和技术