嘉峪检测网 2024-12-18 14:54
导读:半导体器件和普通电子设备一样,其故障区域可分为早期故障、偶然故障和耗损故障这三种类型,故障率随时间的变化曲线被称为浴盆曲线。
半导体器件和普通电子设备一样,其故障区域可分为早期故障、偶然故障和耗损故障这三种类型,故障率随时间的变化曲线被称为浴盆曲线。
这条曲线包含随时间单调递减的早期故障率、保持恒定值的偶然故障率以及随时间单调递增的耗损故障率。然而,对于半导体器件来说,在偶然故障期只能观测到发生率极低的软错误之类的现象,偶然故障区的故障率(浴盆曲线底部的高度)应表示早期故障率稳定之后出现的剩余故障。
下面分别对着三个阶段进行简要的说明
一)早期故障
早期故障期的故障率被称为EFR(早期故障率),且该故障率往往会随着时间的推移而降低。半导体器件的许多早期故障主要是晶圆制造过程中产生于器件内部的缺陷所导致的。这些缺陷最常见的原因包括:在晶圆制造过程中附着在晶圆上的灰尘,以及栅氧化膜或硅衬底的晶体缺陷等。
大多数含有制造过程中产生的缺陷的器件,在制造过程中就会被记录下来,然后在最终的筛选工序中作为次品被剔除。然而,一些具有相对轻微缺陷的器件可能会作为合格产品出货,因为在进行最终测量时,它们表现出与合格产品相似的电学特性。由于这些存在细微缺陷的器件会在短时间内发生故障,所以当对其施加高应力(如电压和温度)时,就能够将它们剔除。为剔除具有固有初始缺陷的脆弱器件而进行的筛选,在晶圆状态下被称为“晶圆级老化(wafer level burn-in)”,在封装状态下被称为“老化(burn-in)”。
在最新的自动化生产线中,随着防止缺陷污染的技术的发展和在线缺陷检测的精度的提高,同时,自动设计技术(模拟)的进步也提高了对缺陷的鲁棒性,这使得从开发阶段就能够获得对各种变化具有高可靠性的高质量产品。因此,就早期故障的筛选而言,在晶圆状态下进行应力测试在很多情况下就能确保足够高的质量。
为什么需要老化:以下将阐述作为早期故障筛选方法的老化(Burn-in)的概况:
(1)早期故障期故障分布函数的推导
为了确定老化条件,从而可靠地剔除存在早期(初始)缺陷的器件,就必须得到早期故障期的故障分布函数。要获取该函数,需使用大量包含初始缺陷的样品(通常为数千到一万个样品)在短时间内进行高加速寿命试验。随后,将得到的故障时间数据绘制在威布尔概率纸上,并根据所得的回归线来估计故障分布函数。下图展示了这一过程的示例。从回归线中能够得到确定以下表达式中威布尔分布的形状参数m和特征寿命η。
(2)确定老化条件
通过使用从老化研究中获取的故障分布函数F(t),能够确定将出货后的早期故障率降低至目标值所需的筛选(老化)条件。
当把老化时间设定为t0,并将老化条件与市场环境之间的加速系数设定为AF时,能够通过老化消除的累积早期故障概率为F(AF·t0)。在进行老化之后,到时间t时的新累积早期故障概率F(t)可通过以下表达式获得。
老化条件是根据加速条件和时间的组合来选定的,该组合会将(某个数值)降低到目标早期故障率或者更低的水平。通常,在工艺开发的初始阶段,导致早期故障发生的初始缺陷频率最高,随着工艺的改进和工艺掌握水平的提高,该频率会逐渐降低。由于早期故障率与这些初始缺陷的频率成比例下降,所以必须根据工艺改进的情况对老化时间进行重新评估。这种关系可用下图来表示。
二)偶然故障
当包含早期故障的设备在一定程度上被排除后,从早期故障期到耐用使用寿命结束的很长一段时间内都不会出现故障,这一时期便是设备的稳定期。在此期间,故障分布接近指数分布,所以该时期被称为偶然故障期。
半导体器件在偶然故障期的故障率与刚出货后的早期故障率相比极低,即便在大规模生产的产品中也很难被观测到。从半导体器件故障机制的角度来看,任何故障都难以被明确界定为偶然故障,而且依据使用环境产生的高能粒子(如辐射)所导致的存储器软错误等现象有时也被归为偶然发生的故障机制。
在预测半导体器件故障率时,有时会将器件开始运行一段时间后偶尔发生且原因无法确定的故障视为偶然故障。不过,大多数这类故障被认为是由初始缺陷(如灰尘和晶体缺陷)相对不明显的器件长时间运行后发生故障所导致的,它们原本应处于早期故障率衰减曲线上。在某些情况下,会将指数分布作为假设来估算平均故障率。虽然无法通过少量样本(如可靠性测试样本)的测试结果严格估算该故障率,但它被视作比实际值大的估算值(一种参考),并以“失效时间内的故障数(FIT)”为单位。
此外,根据使用条件,在偶然故障期还会出现静电击穿、过电压(浪涌)击穿(EOS)和闩锁等现象。由于这些现象均受外部因素影响,例如对器件施加超过其绝对最大额定值的过度应力,所以它们被归为击穿而非故障,不包含在偶然故障范围内。
三)耗损故障(又称磨损失效)
半导体器件的耗损故障源于其组成材料的耐久性,或者晶体管、布线、氧化膜等元件,这些是判定器件寿命的指标。在耗损故障阶段,故障率随时间的推移而升高,直至所有器件最终都出现故障或者性能缺陷。
半导体器件主要的耗损故障机制如下:
电迁移(EM)。
热载流子引发的特性波动(HCI)。
特性的偏置温度不稳定性(BTI)。
与时间相关的介质击穿(TDDB)。
激光二极管亮度退化。
基本上,半导体器件的可靠性需要利用针对器件各组件的测试元件组(TEG)来开发和验证。将经过验证的大量数据反映到设计工具中,然后进行产品设计,以达到可靠性目标。通过设计工具检查产品是否被不合理使用以及是否偏离设计规则,从而防止在实际使用环境下发生耗损故障,确保长期可靠性。所以,在半导体产品开发阶段作为验证手段的可靠性测试中,耗损故障很少发生。
可靠性验证的基本概念
一)开发阶段的半导体可靠性验证
半导体器件因耗损失效(即实际失效)而产生的失效周期,也就是器件的寿命,由器件失效机制决定。
在工艺开发阶段,利用适用于验证这些失效机制的测试元件组(TEG)对可靠性进行评估,以检验是否满足规定的可靠性要求。
二)原型制作阶段的可靠性验证
(1)耗损失效(实际失效)的可靠性验证使用少量原型进行长时间评估,以验证在假定的使用周期内、假定的操作环境下不会发生耗损失效。
(2)早期失效(非实际失效)的可靠性验证半导体器件的失效率在运行初期往往较高,之后随时间推移趋于单调下降。
这是因为有一定比例的半导体器件存在制造缺陷,例如灰尘导致故障等情况。由于这种情况在新工艺中更为明显,所以在引入相应生产工艺时,会进行老化研究来验证早期失效率。
当未达到规定的失效率时,就会采用老化(预烧)等筛选方法来去除有制造缺陷的半导体器件。
三)大规模生产阶段的可靠性验证
定期对批量生产的产品进行抽样,在与上述(1)相同的产品层面评估其可靠性,以检查在大规模生产之后是否仍然能够持续保持开发阶段所达到的耗损失效可靠性水平。下表展示了大规模集成电路(LSI)产品典型的可靠性测试项目。
四)开发与设计阶段的可靠性
半导体器件存在半导体特有的失效机制,在工艺开发阶段解决这些问题是确保可靠性的关键要素。在每个工艺要素的开发阶段对所需可靠性进行验证,并将结果反映到设计规则中,就能稳定地保障产品可靠性。
下表展示了工艺开发和设计阶段可能出现问题的典型半导体器件失效机制。随着工艺日益小型化,施加于晶体管和线路(如内部电场、电流密度和线路应力)的应力会增大。此外,更高的电路速度和增加的寄生阻抗(线路电阻、寄生电容)会使操作裕度降低,这就导致在确保晶体管特性波动的可靠性方面出现重大问题。
来源:Internet
关键词: 浴盆曲线