ProteanTecs的首席执行官谈到了芯片上监控的增长,深度数据分析和预测性维护的需求,以及弹性的重要性。
proteanTecs联合创始人兼首席执行官Shai Cohen接受了《半导体工程》杂志的采访,讨论了如何提高芯片和先进封装的可靠性和弹性。以下是那次谈话的节选。
SE:几年前,没有人考虑芯片上的监控。是什么改变了?
科恩:今天,很明显需要一种解决方案来同时优化性能、功率和可靠性。大型超大规模汽车制造商和汽车原始设备制造商都在说同样的话。涉及变异性、停机时间和与电子设备变化相关的安全性的问题太多了。使用16/7/5nm和现在的3nm技术开发芯片或系统非常困难,同时满足高可靠性和高质量的超级功能的所有要求。此外,您还必须满足性能和电源需求。
SE:似乎有一种转变,即一切都必须完美,只要它仍然有效。对吗?
科恩:是的,弹性是其中的一个重要部分。今天的解决方案非常昂贵,这意味着有很多冗余。这不仅发生在硬件领域,也发生在关键任务应用程序的软件领域。您将看到应用程序运行几次才能做出正确的决定,这是非常昂贵和耗时的。我们认为一定有更好的方法来解决弹性问题。拥有更多数据并进行分析的整个概念并不新鲜。我们发现,仅仅分析数据是不够的,因为数据本身可能无法让你做出正确的决定。分析本身仅限于基础数据,如果没有正确的数据,就会有太多的未知。在一天结束时,数据中心必须保持正常运行,汽车必须保持安全。我们在五年前创立proteanTecs时提出了深度数据分析的概念。 We thought it would be adopted first by the automotive market, but the reality was different. Data centers were our first adopters. Today we’re gaining a lot of momentum in the automotive area, and we’re moving fast into other applications as well, such as mobile and communications. There are so many markets that can benefit from deep data solutions.
SE:这是大量的数据,其中一个挑战是能够在本地处理这些数据,对吗?
科恩:这是正确的。在过去,我们讨论了我们的多层解决方案,包括代理,这是创建数据的片上监视器。一旦生成了这些数据,我们的机器学习算法就会对其进行分析,最后,你可以使用云中的软件来分析这些见解。对我们来说还有另一个至关重要的层面,这是一种代理软件,它位于边缘,帮助我们将数据尽可能地接近决策点。这个边缘设备可以是很多东西。它可以是一个测试器、一个ECU、一个服务器或一个交换机。软件加载了基于测量和数据收集,甚至一些更高级别的数据分析的模型。客户将这些模型应用到边缘软件中,以进行接近实时的决策,例如在测试地板上进行内联异常值检测或功耗降低。或者,如果系统在现场,您可以根据阈值监视其性能,以进行连续诊断。例如,如果它是一辆汽车,您可以跟踪是否存在应用程序压力过大,或者是否存在涉及硬件的潜在危险情况。
SE:你说的是预测分析,目标是在潜在问题变成实际问题之前识别出来?
科恩:完全正确。边缘软件和云分析允许您使用模型进行预测决策。但它是基于实际测量的预测,并计算出故障发生的时间。它与失败的物理原理相关,所以你可以很容易地找到根本原因。预测故障-或预测某些事情会出错-允许服务提供商执行预测性维护或规定性维护。为了规范维护,我们在软件中增加了一个元素,即实时应用程序。这些应用可以从已知的东西开始,比如AVS(自适应电压缩放)或DVFS(动态电压频率缩放)。AVS和DVFS可以基于更广泛的参数集,因此它们可以以更准确和高可靠性的方式部署在现场。如今,由于整体精度、安全性和可靠性的要求,节流电压或频率在关键任务应用中没有被广泛采用。但是,基于深度数据分析的见解,您可以以一种可信的方式降低功耗并提高性能。
SE:如果你的数据更加细化,你能做得更多吗?
科恩:这既是粒度,也是更多的数据类型。它正在从今天的预防性维护(预先计划的)转变为预测性维护,甚至是规令性维护,同时提供测量来提高预期寿命,同时提高性能和功率。我们的代理可以与软件交互。这不仅仅是一种限制硬件以获得正确性能、预期寿命或功率的方法。您可以优化和更好地利用硬件,因为您可以看到芯片内部发生的所有事情。
SE:但这需要合作伙伴。生态系统中发生了什么?
科恩:生态系统正在成长。您将开始看到更多关于深度数据分析和生命周期监控的讨论和发展。公司已经在内部进行了调整,因为需求是存在的。也有更多的公司进入这个市场,这是市场验证的标志。我们开创了这个全新的领域,今天我们拥有端到端、整体的解决方案——从芯片的诞生到现场应用。
SE:有没有计划使用芯片内监控来检测安全漏洞或异常活动?
科恩:由于芯片中有如此多的信息,我们有办法找到一个签名——一个唯一的ID,它可以用于供应链安全目的。我们已经开发了一种用于假冒检测和设备认证的解决方案,并让客户与我们合作。但这一切都回到了你的问题,我们可以在哪里扩展这项技术。我们正在解决的主要市场需求是如此巨大,即使没有其他机会,我们也可以在未来几年大幅增长。
SE:芯片内部有很多数据可用。要足够快地利用这些数据,延迟问题有多大?
科恩:我们从一开始就考虑到了这一点。从芯片中传输出来的数据量非常少。它需要的带宽可以忽略不计,而且没有延迟效应。我们正在添加对PPA(功率、性能、面积)影响很小的代理。这是我们的首要任务,否则它将很难实现。我们已经最小化了流向边缘或云的数据量。
SE:当你的技术被用在高级软件包中会发生什么?
科恩:现实是2.5D和3D包装正在发生。人们谈论这件事已经很多年了。我记得在1991年做过一个MCM(多芯片模块)。但现在,在行业中有一个巨大的浪潮来组装这些不同类型的高级包。对我们来说,这是一个很好的机会。几个月前,proteanTecs加入了UCIe (Universal Chiplet Interconnect Express)联盟,这是通用互连的新开放行业标准。我们的高增长产品之一是我们的互连监控解决方案,它可以测量芯片之间的每个凸点的质量。我们发表了一些我们的工作与GUC白皮书这就是最近硅产品的特点。我们的互连监测代理集成在他们的PHY中,提供了以颗粒状方式测量芯片之间的模对模互连质量的能力。这可以在测试中完成,也可以在操作中完成。通过把整个事情联系起来,你突然有了一个完整的画面。否则,你会有成千上万的肿块,你基本上看不到里面发生了什么。对于先进的包装来说,这是一个非常昂贵的风险。
SE:这就是弹性的来源,对吗?最大的应力点可能是芯片角落里的一个凸起。但如果你知道它会发生故障,你可以采取措施保持设备运行。
科恩:完全正确。从互连的角度来看,该技术用于在制造和操作期间为数据选择最佳通道。在重置期间,你可以做车道修复。这就像在每个凸起上放置一个非常小的数字瞄准镜,以提供每条车道的完整特征。有足够的软件在数据之上,我们不仅可以识别电气参数,还可以识别机电参数,这是最大的挑战之一。其中一些包裹被装进了汽车。如果你有一个问题的早期迹象,比如睁眼退化,你可以安排更换。但是正如我们前面所讨论的,弹性在今天是昂贵的——无论是在硬件还是空间方面。
SE:这难道不是冗余的问题之一吗?
科恩:是的,整个2.5D/3D的推动是以更低的成本获得弹性,因为你可以在一个包中混合和匹配不同的技术,并在决定某个解决方案之前进行成本计算。总会有一些冗余。但这和完全冗余是不同的。例如,如果你看看大型人工智能机器,它们有数百个计算元素,也许它们可以去掉一两个。我们的方法是,你可以优化你的系统,以达到一个非常高的可靠性水平,而没有冗余。但是,例如,在死对死连接上实现本地冗余仍然很重要。没有单一的解决方案。
SE:你是说有很多方法可以到达同一个地方,对吗?
科恩:排序的。我们提供了有针对性的解决方案,而不是非常昂贵的解决方案。
SE:你们的客户群有变化吗?你现在是在和不同类型的公司打交道,还是在这些公司中处于不同的级别?
科恩:首先,我们不受与哪些公司合作的限制,因为我们的技术可以使许多应用受益。但我确实看到了更多的合作,比如分析或相互联系合作伙伴。我们开始与生态系统中的更多人合作,帮助最终客户(服务提供商)从他们的产品中获得最大的可见性和洞察力。
SE: proteanTecs的下一步是什么?
科恩:我们现在已经成立5年了,我们公司的员工数量在去年翻了一番。虽然存在一些宏观经济问题,但我们确实看到许多领域对我们解决方案的需求在不断增长。我们有责任继续执行并引领市场。
留下回复