EDA社区如何准备应对即将到来的挑战尚不清楚。
登纳德比例已经消失,阿姆达尔定律正在达到极限,而摩尔定律正变得越来越困难和昂贵,特别是在功率和性能效益下降的情况下。虽然这些都没有减少更快、更低功耗芯片的机会,但却极大地改变了芯片设计和制造的动态。
不仅仅是不同的工艺节点和半节点,开发芯片的公司——传统芯片公司、汽车原始设备制造商、无晶圆厂和非晶圆厂idm以及大型系统公司——在为其特定应用寻求最佳解决方案时,现在面临着更多的选择和更独特的挑战。他们都对EDA生态系统提出了更高的要求,EDA生态系统正在竞相跟上这些变化,包括各种类型的先进封装、芯片,以及对集成和定制硬件和软件的需求。
而异构集成早于Dennard扩展或者说扁平化摩尔定律几年来,硅设计师和系统架构师现在正在接受这种范式,以保持他们对PPA目标的追求-没有经验法则及其衍生品,”Saugat Sen说,该公司的研发副总裁节奏。“虽然这个时代有许多建筑和设计挑战,但解决热问题是最重要的。设计和实现的效率与多物理场分析的闭环集成有着复杂的联系。more than moore为实现分析的微观世界创造了一个令人信服的案例,超越了系统设计的结构,从硅到封装,甚至超越,尤其是在处于设计创新前沿的系统公司中。”
定义系统处理器的功率和能量需求变得越来越困难。
IBM研究员、IBM Z Systems系统架构和设计的CTO Christian Jacobi说,计算的功耗和总能源使用是一个巨大的问题,由于地缘政治的发展、能源成本的上升和环境问题,这个问题正在变得越来越大。“与此同时,由于摩尔定律和登纳德扩展基本上已经结束,作为架构师,我们希望继续为每个芯片添加特性、功能、性能和更多的内核,而不会导致能源足迹爆炸。因此,我们必须更加聪明地管理芯片中的能量,从如何在任何时间点优化功耗与性能,如何利用不是每个计算资源都得到充分利用的较少活动时期,到减少芯片组件的功耗。”
IBM的Z系统解决方案是将人工智能集成到处理器芯片中。“我们可以访问已经存在的数据,”Jacobi说。“如果数据在处理器芯片中,在处理器芯片的缓存中——因为无论其他业务流程是在哪里计算该数据,比如银行交易或信用卡交易——我不需要将该数据移到其他地方,移到不同的设备或通过网络或通过PCI接口到I/O附加适配器。相反,我有我的本地化AI引擎,我可以访问那里的数据。我不需要移动半米或一米或一公里就能到达不同的设备。这显然大大减少了人工智能的能源足迹。实际的计算本身,加法和乘法,它们仍然消耗能量。但至少我们可以减少将数据传输到计算机并返回的开销。”
这对生态系统的其他部分意味着什么是复杂的,因为不是每个芯片或包都会以相同的方式做事。“为了支持生态系统和产品的复杂性,仍有许多变化必须发生,”公司新市场高级经理兼数字双胞胎项目经理克里斯·穆恩(Chris Mueth)说Keysight。“产品的复杂性是主要驱动因素,因为每个人都想要更小型化。每个人都希望自己的产品有更多的功能。所以需要更多的积分。虽然我们似乎正在接近渐近条件,但我认为我们还没有死。”
事实上,摩尔定律路线图上至少还有几个过程节点,而且这三个节点都是前沿的铸造厂-三星,台积电和英特尔-都有延伸到1的路线图。X纳米范围。Mueth说:“这非常重要,因为我们有两个原因必须让晶体管更小。”“一个是速度,另一个是热量。当你在芯片上计算无数个晶体管时,你会产生大量的热量。解决这个问题的方法是缩小所有内容,但在某个时刻,我们将达到一个渐近峰值。”
史蒂文·吴,杰出的发明家Rambus表示同意。他说:“现在登纳德比例已经基本停止,你真的无法再得到可靠的功率下降。”“因此,如果你想要保持性能,并想要不断增加计算密度,你就必须找到一种方法来散热。只有几种方法可以解决这个问题。这是其中之一。”
例如,在电动汽车中,这意味着ecu必须在整个电力系统的供电非常有限的情况下进行设计。传统上,硬件设计师通过添加许多模式来解决这类问题,这些模式可以被关闭并监视,以衡量系统正在做什么,比如减慢速度。
“我们在人工智能领域看到的更多,可能会在所有领域发挥作用,是软件工程师真正理解系统性能和系统精度之间的权衡,”Woo说。“如果他们在带宽、能量或其他方面受到限制,他们就会把它变成一个软件问题。如果他们需要更多的带宽,他们可以降低数字的精度,他们专门针对降低精度或稀疏性进行训练。在人工智能领域,人们对软件和硬件之间的集成有一个整体的看法。在过去的20年里,同样的道理,程序员不得不更加注意架构,考虑缓存大小和处理器架构。在未来,程序员将不得不更多地认识到系统中的功率限制之类的事情,并尝试使用工具和api来让他们在性能上权衡功率。这种进化将会发生。这需要时间。大约一代程序员才真正明白,当你写程序的时候,你不能再抽象架构的样子了。未来20年可能会朝着这个方向发展。”
在汽车行业尤其如此,因为芯片需要长期可靠地运行,并且需要随着算法和通信协议的变化而更新。
设计方法论负责人Roland Jancke说:“我们看到的一个大趋势是对健康状况的监测。弗劳恩霍夫IIS的自适应系统工程部。“如果你不能在设计时控制芯片的行为,那么你就需要在运行过程中有一些东西来监控它,并切换到备用部件或其他备份。对于汽车电子来说,你需要考虑在运行过程中可能发生的一切。但如果你说,‘让我们基于零件失效的可能性来开发它吧’,然后你加入了一些备用零件,那么你就会超出你的货币预算。”
杨克说,关键是在紧急情况下能够故障转移到另一个系统,但这可能是一个非常复杂的过程。就像芯片设计中正在发生的许多变化一样,它需要打破一些传统的孤岛,即系统、半导体、封装和软件工程师在异构架构上协作工作。
“异构架构不是一个新概念,”Vik Karvat说,他是公司产品、营销和规划的高级副总裁Movellus。“它在许多垂直领域得到了发展和扩展,包括移动、汽车和人工智能。现在不同的是异构计算元素更大,更强大。NVIDIA的Hopper + Grace解决方案、Intel的Sapphire Rapids和Falcon Shore平台就是一个很好的例子。然而,随着这些元素变得越来越大,数据中心计算需求和密度目标继续沿着几何增长曲线发展,异构单片将过渡到异构芯片方法,以继续扩展。这需要系统、半挂件和包装公司共同努力。”
我们讲到哪里了
1974年,罗伯特·登纳德(Robert Dennard)写了一篇关于MOSFET的论文,文中说,随着晶体管越来越小,它们的功率密度保持不变。这种情况一直持续到2005年,当时漏电开始成为问题。“这确实是摩尔定律背后的引擎,”公司高级技术营销总监罗迪•厄克特(Roddy Urquhart)表示Codasip。“登纳德缩放和摩尔定律使你能够利用新一代的硅几何结构,基本上是晶体管数量的两倍,每一代将时钟速率提高约40%。有趣的是,大约在那个时候,英特尔计划推出奔腾5处理器,并希望它的频率达到5或7千兆赫,但由于热问题,他们最终不得不取消了它。”
处理器设计上的另一个限制因素是CMOS时钟速率的上限,如下所示。
由于这些限制,多核设计出现了明显的转变,从移动设备开始。厄克特说:“首先是拥有专门用于特定功能的处理器,比如用于手机图形处理的GPU,专用的微控制器,处理Wi-Fi或蓝牙等功能。”其次,多核系统最初是为双核设计的。如今,像Android这样的系统有四个核心系统。对于运行像操作系统这样的东西,有一些操作可以并行化,而另一些操作本质上是顺序的,这就是阿姆达尔定律适用的地方。”
AI/ML等新兴挑战可以利用数据并行性来创建专门的架构来解决非常具体的问题。嵌入式设备中还有其他的机会。例如,Urquhart描述了Codasip一直在使用传统的三级管道进行的一些研究,32位RISC-V核心使用谷歌的TensorFlow Lite用于微控制器进行量化。然后,该公司正在创建定制的RISC-V指令,以使用非常有限的计算资源加速神经网络。
厄克特表示,这将适用于物联网设备,其中有简单的传感或简单的视频处理。“对于增强现实或自动驾驶等应用程序,你要处理的视频数据量要大得多。利用这一点的方法就是利用数据固有的并行性。有很多这样的例子。据说谷歌正在使用它的张量处理单元(Tensor Processing Units)在其服务器群上进行图像识别。TPU是一个收缩阵列,所以它处理矩阵非常有效。这是该行业正在采取的一种方法。”
我们要去哪里
为了在计算性能上取得进步,一种方法是采用相对传统的核心,并通过额外的指令或额外的处理单元来增强它们,这样可以加速某些事情,但仍然保留一定数量的通用功能。Urquhart说:“否则,你将不得不使用一些人正在谈论的用于AI/ML目的的特殊阵列。”“还有一些新颖的方法。10年前,你不会想到使用模拟来进行矩阵处理,但像Mythic这样的公司已经发现,为了推理的目的,他们不需要超高的精度。所以他们一直在利用模拟数组来进行矩阵处理。”
这说明了转向定制的硅如今,这种方法激增,这对EDA生态系统需要交付的内容产生了拉动效应。EDA一直在努力提供解决方案,以解决设计团队所遇到的架构、设计和验证问题。
的首席执行官Simon Davidmann指出:“EDA并没有驱动这些东西,而是致力于使人们的发明成为可能治之软件他指出,EDA还试图帮助那些挑战一切界限的人。“通常情况是,那些突破界限的人往往会想出自己的做事方式。然后EDA提供帮助,使其更具成本效益、可扩展性和可共享性。这样行业就可以向前发展,不再充斥着专有的、一次性的方法。如果EDA真的有市场,它就会不断发展。如果有人有一个疯狂的想法去做某事,但没有人愿意这样做,EDA不会碰它。他们必须自己建造。然而,如果他们正在开创一种新的做事方式,这是一个普遍的问题,那么EDA就会立即尝试并开发可以出售给他们的技术。”
它还展示了EDA工程师的能力。大卫曼说:“制造半导体和架构的人非常聪明,但EDA必须同样聪明,能够理解他们的需求,然后帮助他们做到这一点,并以一种更通用、更经济的方式来做。”“然而,在发明者的发明和EDA为他们提供帮助之间存在紧张关系。EDA非常努力地接近领导者,并为他们提供有效的解决方案。这些法律的改变/结束影响了EDA,因为行业必须不断地在每件事情上做得更好和更多,就像它一直以来所做的那样。随着体系结构的变化,工程团队需要新的技术。EDA倾听客户面临和应对的挑战,然后尝试为他们提供解决方案。法律的终结让EDA世界保持警惕。你必须非常敏捷并适应EDA行业,否则你的技术就会成为主流,变得无关紧要。EDA的目标是解决世界上的设计实施问题,做得更好,并帮助客户做到这一点。”
即使考虑到管理芯片设计和EDA结束的传统法律的挑战,仍然有很多可能性。“这确实是一个能够解决的优化范围的问题,以及系统如何划分的问题,”尼尔·汉德(Neil Hand)说,他是数字验证技术的战略总监西门子EDA。
直到最近,大多数设计都依赖于最初的尽力而为系统分解,然后对系统的每个部分进行局部实现优化。汉德说:“虽然这已经奏效,但它留下了很多潜在的优化空间。”“释放这一潜力的关键将是新的和/或增强的工具/方法,能够实现基于模型的赛博电子系统工程设计方法(MBCSE),包括系统内的知情功能分配。这些工具和方法将允许系统设计师在设计过程中进行系统分析和权衡,并随着设计的发展进行监控。”
虽然这个概念并不新鲜,并且已经成功地应用于其他设计学科,但它需要适应“电子顶部”系统和传统的EDA工具用户。汉德指出,垂直集成系统公司在这方面有一个优势,因为它们控制着设计的所有部分,各种内部团队可以一起工作。除了这些新的工具和方法,EDA行业还需要与业界合作建立一个生态系统,以共享系统设计数据,并创建几乎垂直集成的系统房屋。因此,这不仅仅是工具和方法的问题,还包括有效的数据和元数据共享。”
这包括工作流。Keysight的Mueth指出,工作流程是EDA行业发展的新前沿。
Mueth说:“在EDA技术中,很多技术已经相当成熟。“虽然每个人都在逐步取得进展,但目前最大的瓶颈是这些复杂系统的工作流程。你必须考虑到整个产品开发周期,因为这是手头的任务。假设你有一个团队,他们把来自多个功能的一些工作流放在一起,他们都朝着这个概念的设计而努力。我们去核实一下。让我们把它转移到生产部。所以它从概念到设计和设计验证,然后到原型DVT测试。这就是硬件领域的验证。然后是试生产,你做一些有限的运行,弄清楚如何使它真正有效地生产。然后是制造业。 This means there are six major steps for a product development flow. The workflow today consists of many manual processes. The trick is to remove those, link everything to share the IP, introduce digital threads, and include interoperability for data and tools. That has to be part of the ecosystem, but things are so complex you can’t manage those manually anymore.”
这在一个定制化设计越来越多的市场中如何应用还有待观察。西门子EDA CSD市场总监Stuart Clubb表示:“我们已经在许多应用中看到,基于软件的SoC或服务器端解决方案不再足够或具有竞争力。“定制硬件加速器作为一种解决方案,能够提供更低的功耗和更高的性能,并能够根据特定的应用需求调整硬件,正在获得广泛的应用。”
许多这样的加速器本质上是高度算法化的,在RTL中设计和验证它们仍然是一个挑战,无论是在时间上还是在工程资源上。系统公司正在通过构建自己的SoC来满足特定的需求。Clubb表示,相比之下,芯片公司则需要提供广泛的产品,通常包括针对不同市场的相同加速器的变体。
这就是高级合成(HLS)和高级别验证(HLV)正在获得关注。
Clubb解释说,与传统RTL相比,HLS/HLV的组合工作可以显著减少设计和验证时间,同时在加速器领域提供更具竞争力的解决方案。他预计,从电池敏感的边缘应用一直到服务器群中的解决方案,这一市场需求和应用将在广泛的垂直市场中继续增长。他说:“系统架构师和芯片设计师需要构建更智能、更专业的硬件,以利用可用的过程节点和晶体管,但要注意我们现在看到的阿姆达尔定律和登纳德缩放开始弯曲和破坏的物理限制。”
Urquhart还指出,计算性能的一些重大改进源于90年代的ASIC革命。
“然后,在21世纪初,更多的通用计算单元开始接管,因为它们能够在当时完成繁重的工作,这得益于包括合成在内的EDA工具,”他说。“随着过去十年向SoC的过渡,以及其他一些有趣的事情,如创建芯片和将系统放在包中,关键的推动因素之一,特别是在SoC中,一直是处理器IP的可用性。但我们看到了它的局限性。即使是Arm也有非常广泛的产品家族,从应用处理器到嵌入式进程。如果你想要获得更好的表现,你就必须进一步专业化。这意味着你将不得不有更广泛的人参与设计,或者更有可能是微调或定制处理器核心。这就成了EDA的问题。处理器设计自动化有很大的机会,随着设计自动化,我们将不得不让更广泛的人来设计或修改处理器。在过去,要么是英特尔和AMD这样的微处理器公司的人,要么是Arm、Synopsys和Cadence这样的工艺或IP公司的人,但我们将不得不向更广泛的社区开放。”
结论
随着芯片制造商从单一芯片转向多芯片解决方案,出现了新的根本性挑战,需要创新的解决方案。Movellus的Karvat表示:“半导体厂商将面临OCV问题和十字线尺寸晶圆片的截止时间。”“在封装层面,将会有装箱和电源方面的挑战,我们需要从性能、验证和可靠性的角度,弄清楚如何使多芯片解决方案表现得像整体解决方案一样。EDA在这方面发挥着关键作用。”
但这需要半导体设计的实质性转变。IBM的雅可比认为,半导体生态系统还没有完全认识到登纳德规模化终结的真正意义。“这将推动创新,也将推动其他变化。建筑师将通过弄清楚事物在这个世界上应该如何运作来做出更多的贡献,在这个世界上,我们无法利用过去20或30年里摩尔定律和登纳德缩放所产生的价值。这种趋势正在改变,建筑行业变得比以前更加重要。”
相关的
半导体工程的通讯注册是在这里。
在一个“无法无天”的行业设计芯片
设计芯片的路标正在消失或变得不那么重要。虽然今天的工程师在定制设计方面有更多的选择,但他们几乎不知道什么最适合特定的应用程序,也不知道这些努力的投资回报是什么。
芯片架构的基本变化
新的存储方法和CMOS扩展的挑战指向半导体设计的根本变化和潜在的巨大改进。
对于遗留流程节点,需要EDA和设计工具。两到三家大型EDA公司收购了竞争对手,扼杀了产品,提高了价格,扼杀了我们在。13到1微米工艺上与亚洲竞争的能力。
基本定律,如欧姆定律和牛顿定律,永远不会失去动力。摩尔“定律”过去和现在都不是基本定律。这是一个观察,一个预测,一个惊人的愿景,持续了几十年,比许多人,包括专家,都要长。
更快的计算是很好,但是……如果代码的执行速度比硬件的改进速度更快,效率越来越低,这又有什么好处呢?
我们终究要面对现实。现代软件设计实际上是在鼓励膨胀。
解决方案不是把越来越多的精力投入到越来越快的硬件上。解决方案是剔除那些培养、鼓励和滋生低效代码的人、系统、语言和软件设计方法。
第一台pc是IBM的PCjr。CPU英特尔8088 @ 4.77 MHz
内存64kb基数。在2个5又1/4英寸磁盘上运行WordPerfect或MS Word,在第二个5又1/4英寸驱动器上运行字典。基本上和我现在用的电脑一样。
软件软件行业确实存在一些严重而根本性的问题。为什么我们需要一台超级计算机来显示简单的病人记录?它的数据与20年前相同。
低效软件是我读这篇文章时想到的。是的,有些东西需要大量的处理能力,但另一些你不得不想知道为什么这个简单的程序需要1gb的磁盘空间和4gb的ram。
是时候找个终结者,把它的CPU挖出来了。
Mueth说:“这非常重要,因为我们有两个原因必须让晶体管更小。”“一个是速度,另一个是热量。当你在芯片上计算无数个晶体管时,你会产生大量的热量。解决这个问题的方法是缩小所有内容,但在某个时刻,我们将达到一个渐近峰值。”
渐近线是极限,而不是“峰值”。
IBM的Z系统解决方案是将人工智能集成到处理器芯片中。“我们可以访问已经存在的数据,”Jacobi说。“如果数据在处理器芯片中,在处理器芯片的缓存中——因为无论其他业务流程是在哪里计算该数据,比如银行交易或信用卡交易——我不需要将这些数据转移到其他地方,转移到不同的设备或通过网络……”
这个人不明白缓存是什么。它是大小有限的处理器本地内存,用于保存经常使用的数据。人工智能通常需要庞大的数据集,而这些数据集并不适合缓存——除非你想重新定义“缓存”这个词。
你错过了Roger Needham教授关于CMOS端点的文章
随着处理能力的每一次提升,软件的效率就会变得越来越低,开发人员更多地依赖于蛮力性能来实现与在更老更慢的硬件上运行的高效软件相同的功能。
现代软件已经变成了一个由订阅服务和低效代码组成的臃肿的烂摊子。