单板由印制线路板和焊接在其上的元器件组成,单板的可靠性取决于三个要素,印制线路板的可靠性、焊点的可靠性、元器件的可靠性。某大型企业对单板失效进行了统计,得出的数据显示器件失效比例高达76%。这类大型公司有严格的集成产品开发流程,每个产品经过严格的设计验证(DV)和产品工程验证(PV),经过严格验证的产品,印制板的可靠性和焊点的可靠性问题都会在产品验证中发现,但器件的可靠性问题却不能在产品验证阶段被充分地发现,会造成在客户使用过程中存在隐患,为了更好的服务客户,让客户更加信赖,需要更多关注器件可靠性。
图1 某公司单板失效类型统计分布
为了满足更多场合的应用需要,器件需要小型化、集成化、高速化,这对器件可靠性提出了更多的挑战,小型化导致器件抵抗PWB变形应力能力变差,同时导致器件容易出现机械断裂,集成化导致器件内部热流密度增加,高速化导致器件特征尺寸变小、工作电压变低,器件对ESD(静电敏感)和外部干扰更加敏感。新的复杂的应用条件和要求让器件面临更多的可靠性挑战。器件封装技术的发展对器件可靠性提出了很多挑战,多芯片封装(MCP)、系统级封装(SIP)、倒装芯片(Flipchip)等新型封装引入了很多新的器件失效模式和失效机理,其可靠性表现出与应用环境的强烈相关性,让可靠性问题表现的更为复杂。
图 2 SIP器件失效模式
器件可靠性的研究历程中,早期研究因当时器件固有可靠性并不高,任何原因都可能导致器件失效,因此把器件的失效看作一个无法克服的随机事件,器件的使用者和提供者约定一个满足器件使用规格的基本失效率,即器件在规定条件下和规定的时间里,其失效率低于器件的基本失效率,这个规格依据器件自身对外界应力的抵抗强度确定,器件的强度因工程制造的偏差呈现出分布特性。如果器件的制造过程控制能够达到3sigma控制限,则缺陷比例为66810PPM(1ppm表示百万分之一);如果器件的制造过程控制能够达到6sigma控制限,则缺陷率大约为3.4ppm,缺陷率极低。
02基于故障机理的可靠性方法
基于统计和数据分析的传统器件可靠性方法主要是通过器件降额的机理来提高器件可靠性,通过器件的基本失效率和应力因子估计系统可靠性。但随着器件技术的快速进步,越来越多的器件失效机理被发现,器件失效理论和实践证明,器件失效并不随机,都是有原因可找的,因此现代器件可靠性的工程方法已经产生巨大的改变,此方法称为基于故障机理的可靠性方法POF(Physics of Failure),此方法是基于大量的器件可靠性工程实践得出的结论。
POF是自然世界因果律的一种具体体现,即任何一个器件的失效必然存在一个导致失效的根本原因,排除这个导致失效的关键因素,则因此因素导致的失效这种果就不会发生,在不断的排除导致器件失效的关键因素的过程中,器件的可靠性不断提升,最终确保单板可靠性达到客户预期。
图3 多层陶瓷电容MLCC失效机理及特征
POF是一种逆向工程方法,从问题中改进产品可靠性。但客户是不会将花钱买来的产品给你慢慢改进的,工程师只能从失败积累的经验中形成设计规则,从设计前端去约束产品设计。那么这些设计经验从何而来,学习借鉴是主要来源,当无可借鉴时,就需要通过高加速寿命试验HALT(Highly Accelerated Life Testing)先制造出问题,再分析问题产生的原因去积累和优化设计规则。POF改变了器件可靠性的一些传统工作方法,加强了对器件失效机理研究,通过器件失效机理的研究可以识别影响器件可靠性的关键要素,对器件可靠性的要求可以转换为具体的可量化规格和可管理的质量要求。
在单板的设计中,单板的设计需求(包括可靠性)需要分解到器件中,但在设计实践中,很多时候是有什么器件设计什么电路,对器件的关键规格没有明确定义,一旦设计定型,产品量产后,进行器件替代将异常困难,作者曾经在实际工作中,遇到这样一个问题:一颗90nm工艺的flash器件在升级到45nm工艺后不能稳定工作,极端情况下出现数据读写错误,经过分析发现原因为90nm工艺的器件对地址线上的上下降沿过冲不敏感,但升级到45nm后,器件接口处理速度变快,过冲改变了FLASH的数据寻址。类似高级不能替代低级的器件问题是对器件应用需求不明确导致的。
POF解决器件问题的过程,类似于图4 所示PDCA循环,目的是通过相关措施的落地防止器件可靠性问题的再次发生。但实际工作过程中,问题的原因查找非常复杂,器件失效烧毁后,在大多数情况下不能确定器件失效的根本原因,依据对失效器件的物理解剖分析,只能发现是电过应力失效,但这只是一个结果,至于电过应力是器件缺陷在正常应力下失效,还是因为外部存在应力超过器件承受极限失效,物理分析很难给出正确的结论。根因分析需要多个PDCA循环,最终才能确定问题的根因,一般情况下,一个受控型号的器件多次失效根因只有一个,一个PDCA循环可以依据原因分析确定几个根因,并制定后续验证措施和相应的工作计划,通过试验验证,检查失效根因的唯一性,依据根因将改进措施落实到相关环节。
图4 器件失效分析的PDCA循环
器件供应商依据PDCA循环原理制定了8D报告模式,但8D报告和PDCA主要用于管理规范,失效根因分析机理阐述往往不是很全面,技术深度也相对不足,对技术技能和失效分析能力提升帮助不大。从提高单板可靠性角度,首先需要选择可靠的器件,其次是依据器件的可靠性特点应用好器件,因此关于器件可靠性保障主要围绕选择可靠的器件和可靠地使用器件来开展。
来源:王文利频道
关键词:
元器件
统计分析
POF