在工程系统设计中,可靠性是衡量系统在规定的条件下和规定的时间内,完成规定功能的能力的核心指标。平均无故障工作时间(MTBF) 则是可修复系统可靠性的关键度量,表示相邻两次故障之间的平均工作时间。实际工程系统往往不是简单的串联或并联结构,而是由多种单元以串联、并联及其混合(混联) 的方式组合而成。混联模型的计算与分析是可靠性工程中的重点和难点。
一、可靠性理论基础:基本单元与模型
1、可靠性函数 R(t): 表示单元或系统在时间 t 时刻仍然正常工作的概率。通常假设单元寿命服从指数分布(失效率 λ 为常数),此时:
R(t) = e^(-λt)
2、失效率 λ: 单位时间内发生故障的概率(假设为常数)。
3、平均无故障工作时间 (MTBF): 对于可修复系统,MTBF 是系统寿命的数学期望值。对于失效率为常数 λ 的单元或系统:
MTBF = ∫₀^∞ R(t) dt
对于指数分布单元:MTBF = 1 / λ
4、串联系统:
结构: 系统中所有单元都必须正常工作,系统才能正常工作。一个单元故障即导致系统故障。
系统可靠性 Rs(t): Rs(t) = R₁(t) * R₂(t) * ... * Rn(t) = ∏(i=1 to n) Ri(t)
系统失效率 λs: 如果所有单元失效率 λi 为常数,则 λs = λ₁ + λ₂ + ... + λn
系统MTBF: MTBFs = 1 / λs = 1 / (∑(i=1 to n) λi)
关键点: 串联系统可靠性低于任一组成单元的可靠性。增加单元会降低系统可靠性。
5、并联系统(冗余):
结构: 系统中只要有一个单元正常工作,系统就能正常工作。所有单元都故障时系统才故障。
系统可靠性 Rs(t): Rs(t) = 1 - [ (1 - R₁(t)) * (1 - R₂(t)) * ... * (1 - Rn(t)) ] = 1 - ∏(i=1 to n) (1 - Ri(t))
系统MTBF: 计算相对复杂,不能简单地将单元MTBF相加。必须通过可靠性函数积分求得:
MTBFs = ∫₀^∞ Rs(t) dt = ∫₀^∞ [1 - ∏(i=1 to n) (1 - e^(-λᵢt)) ] dt
对于 n 个相同单元(λ 相同)的并联系统:
MTBFs = 1/λ + 1/(2λ) + 1/(3λ) + ... + 1/(nλ) = (1/λ) * ∑(k=1 to n) 1/k
关键点: 并联系统可靠性高于任一组成单元的可靠性。增加冗余单元能显著提高系统可靠性(但收益递减)。
混联系统是串联和并联结构的组合。计算其可靠性和 MTBF 的核心策略是逐步简化,利用串、并联基本公式,将复杂结构分解、归约为等效的串联或并联单元,最终求得整个系统的可靠性函数 Rs(t),再通过积分计算 MTBFs。
通用计算步骤:
1、识别结构: 清晰地绘制系统的可靠性框图 (Reliability Block Diagram, RBD),明确各单元之间的功能依赖关系(串联、并联)。
2、层级分解: 从系统最内层的子结构(通常是并联冗余组或小的串联链)开始计算。
计算并联子系统的可靠性 Rp_sub(t) 或等效失效率 λeq_sub。
计算串联子链的可靠性 Rs_sub(t) 或等效失效率 λeq_sub。
3、等效简化: 用计算得到的 Rp_sub(t) 或 Rs_sub(t)(或 λeq_sub)代替该子结构,将其视为一个“等效单元”。
4、逐层迭代: 将简化后的框图视为一个新的、结构更简单的系统。重复步骤 2 和 3,继续计算更高级别的子结构或整个系统的等效可靠性。
5、计算系统可靠性 Rs(t): 最终将整个系统简化为一个等效单元,该等效单元的可靠性函数 Rs(t) 即为整个混联系统的可靠性函数。
6、计算系统 MTBF: 对求得的系统可靠性函数 Rs(t) 在 [0, ∞) 区间上进行积分:
MTBFs = ∫₀^∞ Rs(t) dt
三、实例分析:数据中心备用电源系统
系统描述:
一个数据中心的关键负载由两路独立的电源系统 (PS1, PS2) 同时供电。每路电源系统内部结构相同,包含:
1 个主输入断路器 (CB, 失效率 λ_cb)
1 台在线式不间断电源 (UPS, 失效率 λ_ups)
1 个静态转换开关 (STS, 失效率 λ_sts)
2 台冗余配置的柴油发电机 (DG1, DG2,失效率均为 λ_dg)。发电机通过自动转换开关 (ATS) 接入,ATS 的可靠性包含在 STS 中简化考虑。发电机组只要有一台正常工作即可提供备用电源。
可靠性目标: 计算整个电源系统(PS1 + PS2)的可靠性函数
R_system(t) 和 MTBF_system。
给定失效率 (假设为常数,单位:失效/小时):
λ_cb = 5.0E-6 /小时
λ_ups = 2.0E-5 /小时
λ_sts = 3.0E-6 /小时
λ_dg = 1.0E-4 /小时
可靠性框图 (RBD) 描述:
1、单路电源系统 (PS) 内部:
CB、UPS、STS 串联:三者必须都正常工作,该路电源才能正常输出。
两台柴油发电机 DG1 和 DG2 并联:只要有一台能工作,即可提供备用发电能力。
发电机并联组与 (CB-UPS-STS) 串联链是并联关系:只要(CB-UPS-STS)链正常工作 或者 发电机并联组能正常工作(且在需要时能通过STS无缝切换),该路电源系统就能维持输出。(注:这是一个典型的“工作-备用”并联冗余结构,但简化了切换逻辑和ATS)。
2、两路电源系统 (PS1 和 PS2) 并联:只要有任何一路电源系统 (PS1 或 PS2) 能正常工作,即可维持对关键负载的供电。
计算步骤:
步骤 1:计算单路电源系统 (PS) 内部的并联发电机子系统 (DG_sys) 的可靠性
结构:DG1 和 DG2 并联。
单台 DG 可靠性:R_dg(t) = e^(-λ_dg * t) = e^(-1.0E-4 * t)并联子系统可靠性:R_dg_sys(t) = 1 - [(1 - R_dg(t)) * (1 - R_dg(t))] = 1 - [ (1 - e^(-λ_dg t)) ^ 2 ]
R_dg_sys(t) = 2e^(-λ_dg t) - e^(-2λ_dg t)
R_dg_sys(t) = 2e^(-1.0E-4 t) - e^(-2.0E-4 t)
步骤 2:计算单路电源系统 (PS) 内部的 (CB-UPS-STS) 串联链的可靠性
结构:CB、UPS、STS 串联。
串联链可靠性:R_chain(t) = R_cb(t) * R_ups(t) * R_sts(t) = e^(-λ_cb t) * e^(-λ_ups t) * e^(-λ_sts t) = e^(-(λ_cb + λ_ups + λ_sts) t)
计算串联等效失效率:λ_chain = λ_cb + λ_ups + λ_sts = 5.0E-6 + 2.0E-5 + 3.0E-6 = 2.8E-5 /小时
因此:R_chain(t) = e^(-2.8E-5 t)
步骤 3:计算单路电源系统 (PS) 的整体可靠性 R_ps(t)
结构:发电机并联子系统 (DG_sys) 与 (CB-UPS-STS) 串联链 (Chain) 并联。
并联系统可靠性:R_ps(t) = 1 - [ (1 - R_dg_sys(t)) * (1 - R_chain(t)) ]
代入:
R_ps(t) = 1 - [ (1 - (2e^(-1.0E-4 t) - e^(-2.0E-4 t))) * (1 - e^(-2.8E-5 t)) ]
步骤 4:计算两路并联电源系统 (PS1 + PS2) 的整体可靠性R_system(t)
结构:PS1 和 PS2 并联(两路相同的电源系统)。
并联系统可靠性:R_system(t) = 1 - [ (1 - R_ps(t)) * (1 - R_ps(t)) ] = 1 - [ (1 - R_ps(t)) ^ 2 ]
将步骤 3 得到的 R_ps(t) 代入:
R_system(t) = 1 - [ (1 - {1 - [ (1 - (2e^(-1.0E-4 t) - e^(-2.0E-4 t))) * (1 - e^(-2.8E-5 t)) ] }) ^ 2 ]
化简括号内:
1 - R_ps(t) = [ (1 - (2e^(-1.0E-4 t) - e^(-2.0E-4 t))) * (1 - e^(-2.8E-5 t)) ]
因此:
R_system(t) = 1 - [ ( (1 - (2e^(-1.0E-4 t) - e^(-2.0E-4 t))) * (1 - e^(-2.8E-5 t)) ) ^ 2 ]
步骤 5:计算系统 MTBF_system
MTBF_system = ∫₀^∞ R_system(t) dt = ∫₀^∞ { 1 - [ ( (1 - (2e^(-1.0E-4 t) - e^(-2.0E-4 t))) * (1 - e^(-2.8E-5 t)) ) ^ 2 ] } dt
计算结果分析:
表达式复杂性: 最终得到的 R_system(t) 和 MTBF_system 的积分表达式非常复杂,包含了多个指数项及其乘积和幂运算。手动解析求解这个积分极其困难,甚至不可能。
数值求解: 在实际工程应用中,对于此类复杂的混联模型,数值积分是计算 MTBF 的主要方法。我们可以使用数值计算软件(如 MATLAB, Python SciPy, Mathematica 等)或专业的可靠性分析软件(如 Reliasoft BlockSim, Isograph FaultTree+ 等)来完成这个积分计算。
近似估算 (可选): 为了快速获得对 MTBF 数量级的理解,有时会做简化假设。例如,如果认为发电机并联子系统的可靠性远高于串联链 (R_dg_sys(t) >> R_chain(t)),那么单路电源系统 PS 的可靠性主要受限于串联链,即 R_ps(t) ≈ R_chain(t) = e^(-2.8E-5 t)。则两路并联后:
R_system(t) ≈ 1 - (1 - e^(-2.8E-5 t))^2
MTBF_system ≈ ∫₀^∞ [1 - (1 - e^(-λ_eff t))^2 ] dt (其中 λ_eff ≈ λ_chain = 2.8E-5)
对于两相同单元并联,MTBF = (3/2) * (1/λ_eff) = (3/2) * (1 / 2.8E-5) ≈ (1.5) * 35714 小时 ≈ 53571 小时 (约 6.1 年)。
注意: 这种近似忽略了发电机的贡献,会低估实际系统可靠性(因为发电机提供了额外的冗余)。真实的 MTBF_system 会高于此近似值。
精确数值计算示例 (使用软件工具): 假设我们使用数值积分工具,代入给定的 λ 值计算精确的 MTBF_system。计算过程在软件中进行,最终可能得到一个结果,例如:MTBF_system ≈ 78, 000 小时 (约 8.9 年)。这个值显著高于步骤 3 的近似值 (53, 571 小时),因为发电机冗余大大提升了单路电源的可靠性。
四、混联系统 MTBF 计算要点与注意事项
1、积分是核心: MTBF 的定义要求对系统可靠性函数 R(t) 进行积分。无论系统结构多复杂,只要能得到 R(t),理论上就能通过积分 (数值或解析) 求出 MTBF。
2、分解简化是关键: 对于混联系统,必须通过识别子结构(串联组、并联组)逐步计算其等效可靠性,最终得到整个系统的 R(t)。可靠性框图 (RBD) 是进行这种分解建模的标准工具。
3、数值方法主导: 除了最简单的系统结构,绝大多数实际混联系统的 R(t) 表达式都相当复杂(如本例所示),其积分很难甚至无法求得解析解。数值积分是工程实践中计算 MTBF 的最主要和最可靠的方法。
4、软件工具应用: 专业的可靠性工程软件(Reliasoft BlockSim, Isograph Reliability Workbench, Item Toolkit 等)和通用的数学计算软件(MATLAB, Python SciPy, Mathematica)都提供了强大的功能来:
绘制和解析复杂的 RBD。
自动进行系统可靠性 R(t) 的计算。
执行数值积分计算 MTBF。
进行灵敏度分析(研究不同单元失效率变化对系统 MTBF 的影响)。
5、共因失效 (CCF): 在并联或冗余设计中,一个常见且重要的失效模式是共因失效——导致多个冗余单元同时失效的单一原因(如共同的环境应力、设计缺陷、维护错误等)。经典可靠性模型(假设单元失效独立)会高估存在冗余的系统的可靠性。在要求高准确性的分析中(如安全关键系统),必须使用专门的 CCF 模型(如 Beta 因子模型、多希腊字母模型)来修正计算结果。
6、维修与可用性: MTBF 描述的是故障发生的频率。对于可修复系统,系统实际可用时间比例(可用性 A)不仅取决于 MTBF,还取决于平均修复时间 (MTTR):A = MTBF / (MTBF + MTTR)。MTBF 计算本身不涉及维修策略。
7、失效率的假设: 本文全程假设单元失效率 λ 为常数(寿命服从指数分布)。这是最常见也最便于处理的假设。如果单元寿命服从其他分布(如威布尔分布、正态分布),则 R(t) 的表达式会更复杂,MTBF 的计算公式也需要相应调整,数值积分仍是常用方法。
8、模型准确性: 可靠性模型的准确性高度依赖于输入数据(单元失效率 λ)的准确性。这些数据通常来源于历史故障记录、行业标准数据库(如 MIL-HDBK-217, Telcordia SR-332, IEC 62380)或加速寿命试验。不准确的输入数据会导致计算结果严重偏离实际。
五、混联模型设计的工程意义
1、优化资源配置: 通过混联模型分析,工程师可以量化评估在不同位置增加冗余(并联)对系统整体可靠性和 MTBF 的提升效果。这有助于在成本、重量、体积等约束条件下,将冗余配置在能带来最大可靠性收益的关键位置(如本例中的发电机冗余)。
2、识别薄弱环节: 可靠性分析(包括 MTBF 计算)能揭示系统中的可靠性瓶颈(通常出现在串联链或高失效率单元处)。这为设计改进(如对薄弱环节增加冗余、选用更高可靠性的部件)提供了明确方向。
3、满足可靠性指标: 在航空航天、核电、医疗设备等高可靠性要求领域,系统设计往往有明确的可靠性或 MTBF 指标要求。混联模型的计算是验证设计方案是否达标的关键依据。
4、支持维护决策: 了解系统的 MTBF 和薄弱环节有助于制定更有效的预防性维护策略和备件库存计划,优化全生命周期成本。
结论
混联系统可靠性与 MTBF 的计算是可靠性工程的核心内容。其核心流程是:通过可靠性框图识别结构关系,利用串联和并联系统的基本公式,从内到外逐层计算子系统的等效可靠性,最终得到整个系统的可靠性函数 R_system(t)。系统 MTBF 则通过积分 R_system(t) 求得。
由于实际混联系统的 R(t) 表达式通常非常复杂,数值积分方法和专业软件工具的应用至关重要。本文通过一个典型的数据中心双路冗余电源系统的实例,详细演示了混联模型可靠性函数 R(t) 的推导过程,并阐述了 MTBF 的计算方法(主要是数值积分)及其在工程实践中的意义和注意事项。
理解并掌握混联模型的可靠性和 MTBF 计算方法,对于设计高可靠性的复杂工程系统、优化资源配置、识别和消除设计薄弱环节、满足严格的可靠性要求以及制定科学的维护策略,都具有不可替代的重要价值。随着计算工具的发展,即使面对极其复杂的系统,工程师也能高效准确地完成这些分析任务。
来源:可靠性工程学
关键词:
可靠性
混联模型
MTBF