电子元器件
采购平台
扫码手机查询
IC芯片网www.icxpw.com了解到,热量大正成为先进节点芯片和封装中的一个更大的问题,导致关键电子从 DRAM 中泄漏,3D-IC 中出现时序和可靠性问题,以及不同工作负载特有的加速老化。
所有类型的电路都容易受到热量大的影响。热量大会减慢电子在导线中的移动速度,引起电迁移,从而缩短器件的使用寿命,还会影响晶体管的开关周期。在 3D-IC 和其他高密度封装器件中,热量大甚至会扰乱计算。
西门子 EDA Calibre nmDRC 应用产品管理总监 John Ferguson 指出:“这些影响都会影响在芯片和组件封装中正确传输预期信号的能力,通常会导致信号传输速度低于系统设计速度。最终,这会导致传输非预期信息。”
在DRAM中,热量会限制电容器保持电子的能力,而电子对于确定是“一”还是“零”至关重要。
“某些单元有电子意味着它是 1,而某些单元有电子意味着它是 0,” Rambus的杰出发明家 Steven Woo 解释道。“DRAM 需要刷新操作,因为事实证明,当你将电子放在电容器上时,随着时间的推移,它们会离开电容器。你可以想象,如果我在这个电容器上存储了一堆电子,随着温度升高,这些电子会更容易离开。所以现在当你谈论在芯片上有数十亿个电容器来存储所有数据时,每个电容器现在都更小了,实际上用于表示 1 或 0 的电子更少了。”
30 年前这不是什么大问题,当时电容器很大,而且一个位单元上有数千个电子。
“你可能会失去几个电子,但你不会真正注意到,”Woo 说。“如今,当你在一些单元中拥有数十个电子时。如果你开始失去一些电子,那么现在你可能已经接近所需的临界电子水平。随着温度升高,这些电子更容易丢失。因此,当温度超过一定水平时,一些内存(例如 LPDDR 以及其他内存)必须更频繁地刷新,因为电子更容易脱落。这也是 DRAM 现在具有热传感器的部分原因。它有助于确定是否需要增加刷新率。该热传感器/控制器正在监控正在发生的事情,以确定我是否应该担心。”
Ansys首席产品经理 Lang Lin对此表示同意。“如果加热内存,它就是一块硅片,也就是电路。在高温下,所有电气特性都会发生变化。你将面临非常高的漏电,因为随着温度升高,漏电会呈指数级增长。内存的保留基于一些锁存器触发器。锁存器保存数据,因此过热可能会导致很多可靠性问题。它可能会导致锁存器发生故障。这就是热影响。还有机械影响。如果内存芯片处于非常高的温度下,可能会产生应力。任何材料在高温下都会受到影响。电迁移也可能是一个因素。导线中流动的大电流会导致可靠性问题,这可能会导致内存故障。”
IC芯片网-IC芯片电子元器件采购平台分析,这些极端条件需要可靠性模拟。“特定条件可能不会总是发生,但在高温高压下——甚至在高负荷情况下——它可能会发生。手机掉下来,这是一个很大的冲击。像这样的极端条件可能是影响芯片性能的许多问题的原因。”
减少电子滞留的解决方案之一是片上纠错。过去,这曾经是一个增加计算机成本的选项。在许多应用中,它现在是一项要求。
Woo 表示,如今的 DRAM 包含系统其余部分无法访问的附加存储单元。“这些附加位存储在 DRAM 中,”他说。“当你需要从 DRAM 读取一些数据时,它会读取数据,但也会读取一些附加位,即纠错位。它们可以执行诸如计算校验和或综合征之类的操作,从而确定数据包中是否有任何位意外翻转。如果有足够多的附加位,你可以确定是否存在错误,并且在绝大多数情况下你可以纠正错误。此外,每个位都翻转的可能性总是存在的。理论上,这种情况可能会发生,然后你将无法承受你拥有的附加位。因此,你要查看你的设备,并在典型的最坏情况下确定你需要多少附加位,然后将这么多附加位存储在 DRAM 中。”
热量和电阻率
芯片通电时,电子会穿过非常细的导线。导线越长或越窄,驱动信号所需的功率就越大,电阻率也越大。这会产生热量,进而减慢电子的移动速度并导致时序问题。消除这些热量已成为一个越来越棘手的问题,尤其是在先进的封装中。
“在传统的 IC 设计中,这个挑战并不太难,”Ferguson 说。“通常情况下,散热路径相对较近。通常,谨慎使用设计规则和约束可以帮助确保导线足够宽,彼此之间间隔足够远,以防止出现严重问题。这就是为什么如果针对高性能芯片(您愿意牺牲功耗),www.icxpw.com而针对低功耗芯片(您愿意牺牲性能),通常会有不同的设计规则约束的原因之一。”
随着越来越多IC交易电子网的芯片被分解成芯片小体,并在水平和垂直方向上组装成 3D-IC,散热变得更加复杂。
“我们知道,堆叠芯片可以通过更紧密的垂直连接来降低功耗,从而降低产生的热量,”Ferguson 说。“另一方面,一些电源路径可能会更长,延伸到横向放置的芯片,或者路径可能会更窄,例如当使用混合键合技术穿过堆叠芯片之间的窄线时。此外,还引入了封装层压板、TSV、凸块、球和隔热材料等新材料。这些材料对产生的热量的反应各不相同。散热路径也有所增加。对于堆叠的芯片尤其如此,这使得上层芯片上的热量难以散发。结果是,不再可能依赖历史上应用于独立 IC 的简单解决方案。”
这又带来了一些新的挑战。如何知道是否存在与热量相关的问题?如何解决它?如何从一开始就防止这种情况发生?
热分析是一种方法。“热分析功能已经存在了几十年,并且一直是封装和板级设计的可靠工具,”Ferguson 说。“现代热分析通过引入芯片的细节增加了另一个层次的洞察力,可以进行更准确的热分析,可以解释有源芯片产生的热量,并提供将热影响与电气行为联系起来的能力,以了解设计是否会按预期进行电气行为。”
然而,这绝非简单的分析。Ansys 首席产品经理 Suhail Saif 表示:“在设计芯片并确保解决发热问题时,芯片设计师必须处理大量数据。他们还必须确保尽早发现所有热点,并在为时已晚之前解决。当芯片设计公司进行整个严格的设计过程时,他们需要处理的数据量实际上取决于芯片的多功能性。举一个非常简单的例子,假设一个芯片是为家用冰箱的特定应用而设计的。这是一个相对简单的芯片,在非常稳定的环境中,它的功能非常有限,这意味着环境不会发生太大变化。它将放在房子里,环境温度范围将在限制范围内。对于这样一个简单的应用芯片,应用程序工作负载将是有限的、很少的和简单的。数据要求包括从矢量到功率分析需要携带的数据、不同的瞬态数据,以及平均功率分析或长窗口,然后是 di/dt 分析、热分析或机械应力分析等。对于这种应用,所有数据都非常有限,而且芯片通常对热的要求不是那么高。”
现在将其与汽车中使用的芯片进行比较。“在汽车芯片的极端情况下,例如控制汽车主板的微控制器,环境温度将无处不在,”Saif 说。“你将驾驶汽车从阿拉斯加到亚利桑那州。如果半导体芯片要处理来自仪表板摄像头的视频、汽车的所有传感器以及其他所有东西,它就必须执行非常高速的应用程序。特别是对于自动驾驶汽车而言,这些应用程序对数据的要求非常高。芯片必须同时执行许多任务,这就是为什么它要大得多。在这里,热约束将非常严格,与简单场景相比,你需要考虑的实际应用将非常多,以覆盖各种场景。在这里,有很多数据需要处理,必须进行大量分析。数据处理将大量利用网络。将有 EDA 工具处理和处理这些数据。现在一切都如此容易受到数据的影响。您必须在每个阶段部署在数据处理方面最有效的解决方案,因为您在应用芯片时需要处理大量数据。”
事实上,它完全依赖于应用程序。“设计师希望尽量减少数据,因为数据是最大的敌人,也是最大的朋友,”他说。“这有助于他们做出正确的决定。但是,随着数据量呈指数级增长,处理这些数据并保持分析意义就变得非常困难。你很快就会迷失在数据中。我见过一些来自尖端 GPU 设计的功率和热数据文件。人类的大脑无法掌握那里的数据量。你必须依靠高端 EDA 解决方案将这些数据提炼成团队成员可以理解的有意义的报告,然后采取下一步行动。”
如何处理发发热问题?
一旦确定了发热问题,下一个问题就是如何处理它们。对于 3D-IC,有几种方法。
在某些情况下,用户可以选择封装组件中使用的材料。“在这种情况下,可以通过将一种材料换成另一种材料来进行一些权衡,以更好地解决热影响,”Ferguson 说。“然而,随着行业转向异构设计套件,考虑到可用的选择减少,这可能会变得更加困难。另一种方法是重新考虑各个芯片的位置。决定哪些芯片在堆栈中较低,哪些芯片在较高,以及/或者做出放置决定以最好地减少电源路径可能会有所帮助。最后,还可以在芯片本身上采取一些措施,例如引入铜柱,以帮助更快地将热量从上层放置的芯片中拉出到散热器。”
所有这些方法的最大问题是,www.icxpw.com可能需要数月的精心设计才能发现问题,到那时再进行干预以及时纠正并推出目标产品已经太迟了。这就是为什么如此重视早期分析和迭代的原因。任何可以左移的东西都可能有很大帮助。
IC芯片网-电子元器件采购平台指出:“在初始阶段,就像封装设计师过去所做的那样,芯片可以被视为统一的材料,用户可以对电源进行简化设置。” “在早期的布局阶段这样做有助于防止 3D-IC 中出现明显的热点。这种方法还可用于在竞争的 3D-IC 方法和堆叠配置之间做出决策。各种形式的自动化,包括不同的 AI 方法,都可以在此级别应用。随着设计开始成熟,可以应用有关IC供应商芯片几何形状和材料的更多信息。随着功率图开始成熟,可以进行越来越准确的评估,以便在灾难发生之前向设计师提供反馈。当芯片具有完整的电路时,可以提取布局后网表及其相关的热性能,从而可以初步评估由于热量而产生的电气影响,以确定是否有任何信号超出规格。通过遵循这些方法,可以在此过程中进行各种路线修正,最终获得最终签字确认,以确认温度和电气规格均已得到适当满足。”
系统权衡
权衡可能因应用而异。高耗电工作负载(例如 NVIDIA Grace Blackwell 型服务器)主要是为了处理大量数据和快速 AI 乘法/累积计算而开发的。在这些情况下,持续为 MAC 处理元件提供足够的电力至关重要,而这又需要系统级了解热梯度将如何变化。
“当你真正追求性能时,你不仅要担心数据的正确传输,还要担心提供正确的电量,”Rambus 的 Woo 说道。“由于你必须提供越来越多的电力,电力输送正成为一个更加困难的问题。但你还必须提供高质量的电力,这意味着电压不能跳动。它必须非常一致。有时你在电源方面必须做的是转换电压,但在转换电压的过程中,你最终会损失一些电力,因为这样做效率低下。这是另一个问题。”
随着芯片运行速度越来越快,数据的正确传输也变得越来越困难。热量会扰乱或扭曲时序,内存会泄漏电子。因此,除了片上纠错之外,DRAM 和主机之间还可以使用额外的位进行纠错。“额外的位将帮助您确定将数据传回主机时是否出了问题,”Woo 说。“主机或内存控制器负责查看所有这些位,并说,‘我知道我用这种特定的纠错算法对其进行了编码。返回的数据是我通过解码器发送的。它最好看起来正确,如果不对,我有足够的额外位来纠正一定数量的错误,这是我在系统中合理预期的最大值。’有些情况下你会超过这个数字。在某些情况下,你可以真正检测到何时超过了最大错误数。在其他情况下,你无法检测到。”
最大的担忧是静默数据损坏。“这可能发生在IC电子芯片上,也可能发生在数据通过数据湖传输回来时,甚至在 CPU 上,”Woo 说。“当 CPU 处理数据时,即使在处理器上,数据也可能损坏,其中很多问题都与温度有关。当你在 DRAM 和主机之间传输数据时,主机有电路,并试图找出何时对线路进行低电压或高电压采样,以确定它是 1 还是 0。”
采样时间会随着温度和电压的变化而变化,这使其成为一个巨大的挑战。“情况会变得更糟,因为如果处理器上发生了很多其他事情,它们可能会拖累电压或产生大量热量,”Woo 解释说。“然后,接收电路,即使它们没有产生那么多热量或没有占用太多电压,也可能受到相邻电路的影响。这是温度影响数据来回传输的另一种方式,这会影响 DRAM 以及处理器方面。”
资讯排行榜
1
从基本器件到先进技术的全面解读_IC芯片网
2
IC芯片查询网——GB200 硬件架构 - 组件供应链和 BOM
3
电子元器件IC回收价格及行情分析
4
AMD和NVIDIA的需求推动了FOPLP技术的发展——IC芯片网
5
电子元器件耐温性能标准及测试方法
6
探讨电子元器件 IC 回收的价值与流程
7
EDA的未来潜力无限:展望数字设计优化的新时代——IC芯片网
8
IC交易电子网——全球芯片行业一周回顾
9
最新国产模拟芯片厂商实力对比——IC芯片网
推荐文章
利用尖端 HBM4 技术提升 AI_IC芯片网
2024-10-09
基于 AI 的 RTL 生成是否已准备好迎接黄金时段?_IC芯片网
2024-10-09
Synopsys 和 TSMC 为万亿晶体管 AI 和多芯片芯片设计铺平道路_IC芯片网
2024-10-09
2025 年内存市场的 5 大预期_IC芯片网
2024-10-08
EDA 和 IP 收入增长,但市场正在发生变化_IC芯片网
2024-10-08
全球芯片行业一周回顾_IC芯片网
2024-10-08
亚洲推动电子产品增长_IC芯片网
2024-09-30
全球芯片行业一周回顾_IC芯片网
2024-09-29
管理现代 SoC 设计中的性能_IC芯片网
2024-09-27
支持基于多供应商芯片的创新设计_IC芯片网
2024-09-27
英特尔更有可能剥离业务部门而非寻求收购_IC芯片网
2024-09-26
嵌入式技术如何改变德国汽车工业_IC芯片网
2024-09-26
制定针对硬件威胁的安全解决方案_IC芯片网
2024-09-25
Altera 发布 Agilex 3、新软件版本和开发套件_IC芯片网
2024-09-25
Resonac 与 Soitec 联合开发 SiC 功率半导体键合基板_IC芯片网
2024-09-25