可靠性 - 南京财经大学统计系

Transcript 可靠性 - 南京财经大学统计系

现代工业统计
第6章
可靠性分析2
第6章可靠性分析
•
•
•
•
•
•
•
•
•
概述
§6.1 从可靠性理论产生发展应用谈起
§6.2 可靠度、失效率与寿命分布
§6.3 系统的可靠性
§6.4 寿命试验与可靠度的非参数估计
§6.5 寿命分布和数据的统计方法
§6.6 使用Minitab进行可靠性分析
拓展阅读：阿波罗载人登月工程
习题6
概
述（四大问题）
• (1)可靠性的内涵是什么?
• (2)怎样对可靠性进行量化?即如何
建立可靠性的数学模型?
• (3)如何取得可靠性数据?
• (4)如何实现模型?
§6.1
从可靠性理论产生发展应
用谈起
§6.1
从可靠性理论产生发展应
用谈起
可靠性概念的产生和发展，可以追溯到
1939年，它经历了以下三个阶段。
（1）初期发展阶段
早期的可靠性研究，重点放在故障占大半的电子管方面。
多用于军工产品。
30～40年代，两次世界大战。特别二战期间，电子设备
常失效。
例如：美国运到远东的航空电子设备60%不能使用（运输失
效）；海军舰艇上电子设备70%失效，其中50%仓库中失效；
1955年美国国防预算30％用于维修和使用，以后又增加
到70％，成为不堪忍受的负担。在整个战争中美国由于飞行
事故损失飞机为21 000架，比被击落的飞机还要多1.5倍。
1939年，美国航空委员会《适航性统计学注释》，首次提
出飞机故障率≤0.00001次/ h，相当于一小时内飞机的可靠度
Rs=0.99999，这是最早的飞机安全性和可靠性定量指标。
二战末期，德火箭专家R·卢瑟（Lussen）把Ⅴ—Ⅱ火箭诱导
装置作为串联系统，求得其可靠度为75%，这是首次定量计算复
杂系统的可靠度问题，标志着对系统可靠性研究的开始。
1942年，美国麻省理工学院，真空管的可靠性问题研究。
1944年纳粹德国试射V—2火箭袭击伦敦，有80枚火箭还没
起飞就在发射台上爆炸。经过研究，人们提出火箭可靠度是所
有元器件可靠度乘积的结论，这是最早的系统可靠性概念。
（2）可靠性工程技术发展、形成阶段
50～60年代，大体上确定了可靠性研究的理论基础及
研究方向。
1952年，美国军事工业部门和有关部门成立AGREE
（Advisory Group on Reliability of Electronic
Equipment，国防部电子设备可靠性顾问团），研究电子
产品的设计、制造、试验、储备、运输及使用。
至60年代后期，美国约40%的大学设置了可靠性工
程课程。
日本，1958年成立可靠性研究委员会。1971年起每
年召开一次可靠性与维修性学术会议。
前苏联，1950年起，开始研究机器可靠性问题。
这一阶段，可靠性研究工作从电子产品扩展到机械产品，
从军工产品扩展到民用产品。
（3）可靠性发展的国际化时代
1965年国际电子技术委员会设立了可靠性技
术委员会TC—56（1977年改名为可靠性与维修
性技术委员会）。
从70～80年代起，可靠性理论研究从数理基
础发展到失效机理的研究；
形成了可靠性试验方法及数据处理方法；
重视机械系统的研究；
重视维修性研究；
建立了可靠性管理机构；
颁布了一系列可靠性标准；…
设备的可靠性（Reliablity）是指在规定的时
间和给定的条件下，设备无故障完成规定功能的能
力，可靠性的概率度量亦称为可靠度。可靠性是部
件（part）、元件（component）、产品（product）
或系统（system）的完整性的最佳数量的度量。可
靠性贯穿在产品和系统的整个开发过程（包括设计、
制造、试验、运行、管理等环节），形成可靠性工
程这门新兴学科。可靠性工程涉及元件失效数据的
统计和处理、系统可靠性的定量评定、运行维护、
可靠性和经济性的协调等各个领域。设备的可靠性
是贯穿于整个寿命周期全过程的一个时间性度量指
标，从设计规划、制造安装、使用维护到修理、报
废为止，可靠性始终是设备的灵魂。
【应用】实例—感受可靠性分析和在此
基础上的改进对现代工业的重要性。
[西门子公司] 宽带传输系统使用大量的微波器件，人
们希望这些元器件从第一次打开起能一直正常工作。
每一个565Mb同轴中继器都采用30个二极管和晶体管
元件，在250公里长的网路上一共需要7000个SP87-11
晶体管。这一网路在15年内不能发生故障。由于电路
的复杂性，无法使用多余的备用电子器件。加速寿命
试验已表明SP87-11晶体管的平均失效率小于1FIT
（failures in hours，即每10亿小时失效的次数），因
此满足15年不发生失效的要求。
[洛克希德公司] 军用飞机造价的约有60%在于其电子
系统，而且很多军用合同都要求制造商在保质期内以
固定的价格为产品提供维修等服务。Lockheed公司生
产逻辑转换元件，这种元件应用在美国海军S-3A反潜
飞机上以进行飞机内外的通信传输。这些元件的失效
率服从帕累托分布，比较高，因此经常要拆卸下来进
行维修，这就会损坏飞机的机身。原来这种逻辑转换
元件两次失效之间的平均时间（MTBF）大约为100小
时。现在改进它的设计，提高筛选方法可以把该元件
的两次失效之间的平均时间（MTBF）提高到500小时。
这样每周从9架飞机上更换掉的该类元件的平均数量就
从1.8个降低到0.14个。既减少了对飞机的损坏，又极
大的降低了维护费用。
[通用公司] 通用公司就是最早引入可靠性概念进行产品设计生
产的公司之一。在2001年3月，在通用汽车实施可靠性工作几年
后，在全球的子公司范围内全面推荐使用可靠性产品。并且和
可靠性行业的领军企业瑞蓝公司进行了深层的合作，一方面由
瑞蓝作为供应商为通用公司提供可靠性项目的技术支持；另一
方面，通用公司也对瑞蓝科学家队伍进行的研究项目提供了长
期的GE全球研究基金资助，在一些产品上进行了许多协作性的
开发工作。经过了长期的可靠性工作开展后，通用汽车的可靠
性水平显著上升。2007年北美地区汽车车辆可靠性(VDS)调查报
告显示，通用汽车旗下别克品牌战胜诸多豪华品牌赢得榜首位
置。排名中，别克品牌以145个问题／每百辆车的杰出表现，和
丰田旗下的豪华汽车品牌雷克萨斯分享了这份殊荣。别克品牌
在2008年的车辆可靠性调查中获得头名，无疑将大幅提升该品
牌在市场上的形象，以及其在二手车市场上的受欢迎程度。在
中国市场，2007年中国汽车市场售后服务满意度(CSI)调研报告，
来自通用的别克品牌也位居三甲。
[海尔集团] 目前，海尔集团质量监测中心已建成了9大类产品、
2800多个台位的产品可靠性测试分析中心。据质量保障检测中心的
介绍，为了提升产品在全球市场上的竞争力，海尔率先在家电行业
开展了家用电器可靠性测试方面的探索，通过研究家用电器产品适
用的可靠性验证方案，以期望实现对用户承诺的保修期向保证期的
过渡。保证期与保修期，虽然只有一字之差，但反映的本质是质量
观念的天壤之别。保修期的承诺缺乏竞争力，因为修一次，用户就
会伤心一次。由于家用电器产品与人们的日常生活紧密相关，其产
品的可靠性就显得更为重要。只有通过可靠性测试的验证，产品才
能进入全球市场，真正实现对用户的保证而不是保修的承诺。
本土企业中联想公司也是电子行业中较早开展可靠性的企业。
经过了几年的发展，在2006年12月，据美国PC杂志对3.5万多用户
进行的调查。在笔记本电脑类的调查中，苹果和联想在笔记本电脑
的可靠性和用户对可靠性的满意度方面的得分都超过了平均水平。
我国可靠性研究现状
我国可靠性工作起步也比较早，
50年代就建立了温热带环境暴露试验机
构。
1972年在这个基础上组建了我国唯一的电
子产品可靠性与环境试验研究所，着手可靠
性与环境试验、失效分析、数据处理等研究
工作。最早也是由电子工业部门开展可靠性
工作，
在60年代进行了有关可靠性评估的开拓性
工作，由于种种原因，直到70年代末、80年
代初可靠性研究才重新受到重视，
特别是八十年代初，随着商品经济和贸易的发
展，国内外市场的竞争日益激烈，民用、工业用
产品和军用产品的用户，不仅要求产品的技术性
能先进，而且要求可靠性高。
国内外的专家都指出，现在和将来，市场竞争
的焦点是可靠性，只有那些了解并能控制自己产
品可靠性的企业，才能在国际竞争中生存。一个
可靠性差的商品，不但不能在国际贸易中占领市
场，在国内市场上也不会站住脚。产品责任法的
推行，消费者组织的建立，对产品的可靠性、安
全性提出了更高等要求。由于产品可靠性、安全
性存在的问题所造成的人身伤害及财产损失，不
但要向生产者追赔直接损失，而且要追赔间接损
失，一个事故就可以导致一个企业的破产。
EAST相关应用
近几年来，可靠性和安
全性分析显得越来越重要，
尤其是对于像核电站、大型
化工厂、空间飞行器等这样
复杂、高风险的系统。
印度博帕尔惨案，大量致
命性毒气在联合碳化厂
（union carbide factory）泄
露，造成上千人丧生
“挑战者”号航天飞机失事，导致上亿美元的经济
损失和七名宇航员丧生……
可靠性是指产品在规定的条件和规定的时间内，完成规定功
能的能力。产品不能完成规定功能，称为故障（或失效）。可靠
性一般用概率表示，也可以根据实际需要，用平均无故障工作时
间或平均无故障里程（汽车、坦克等）表示。
可靠性数据是指在各项可靠性工作及活动中所产生的描述产
品可靠性水平及状况的各种数据，他们可以是数据、图表、符号、
文字和曲线的形式。
可靠性数据主要从两个方面得到：（1）从实验室进行的可靠
性试验得到；（2）从产品实际使用现场得到。
可靠性数据收集与分析的目的及意义
随着可靠性及维修性工作的深入发展，人们越来越深
刻地体会到，有效的信息和数据是开展可靠性、维修性、
保障性分析的基础，是决策的依据：
(1)根据可靠性数据提供的信息，改进产品的设计，制造
工艺，提高产品的固有可靠度，并为新技术的研究，新产
品的研制提供信息。
(2)根据现场使用提供的数据，改进产品的维修性，使产
品结构合理，维修方便，提高产品的使用可用度。
(3)根据可靠性数据预测系统的可靠性和维修性，开展系
统的可靠性设计和维修性设计。
产品的质量主要包括性能指标和可靠性指标两个方面，
产品的质量既要性能优良、使用方便、外观优美大方、又
要经久耐用，极少出现故障。性能指标是指衡量产品完成
规定功能所需要的指标，如手机，显示屏清晰、音质优美、
外观、重量、信号、辐射、电池的待机和通话时间等等都
是性能指标，这是产品的基本指标之一。可靠性是指产品
在规定的条件下，在规定的时间内，完成规定功能的能力。
可靠性指标是产品的另一类质量指标，它往往通过产品寿
命的各种特征表现出来，如产品正常而有效保持其性能所
能持续的时间等。现代社会，可靠性越来越受到人们的重
视，就生产企业而言，提高产品的可靠性是提升企业竞争
力的一种策略，较高的产品可靠性才有可能占领更多的市
场份额；就客户或用户而言，关键时刻的一次失效或故障，
可能会带来巨额财产损失，甚至大量人员的伤亡，生命的
结束。
本章主要解决以下四问题：
(1)可靠性的内涵是什么?
(2)怎样对可靠性进行量化?即如何建
立可靠性的数学模型?
(3)如何取得可靠性数据?
(4)如何实现模型?
以至可以求解.分析可靠性。
本章解决问题的思路：
问题(1)回答，三个规定和一个能力
能力－有统计意义。可靠度、平均寿命、
失效率
问题(2)回答，统计建模
模型1：可靠函数R(t)
可靠度 (6.1)
模型3：失效分布F(t)、f(t)和失效率入(t) 失效
率
(6.3)
模型2：失效曲线、两个失效分布（指数、威布尔）
寿命与平均寿命 (6.2)
问题(3)回答，寿命试验 (6.4)
问题(4)回答，主要是模型2、3，其统计方法。
(6.4) 、(6.5)
§6.2 可靠度、失效率与寿命分
布
•
•
•
•
三个统计模型的建立
模型1：可靠度（定义、模型、估计）
模型2：失效率（定义、模型、估计）
模型3：平均寿命（定义、模型、估计）
可靠性的三个统计模型
下面对可靠性建立统计模型，从定量的角度来刻画可靠性。
模型一、可靠度函数
1. 寿命分布
产品的可靠性往往通过产品寿命的各种特征表现
出来，如何度量产品的可靠性呢？一个产品或系统
的寿命是指该产品或系统从开始工作一直到失效或
发生故障为止正常工作的整个时间段，如果该产品
或系统由于清洁或断电等原因（发生故障或失效以
外的原因）而停工了一段时间，那么这段没有工作
的时间是不计入其寿命中的。产品寿命的单位常用
小时（h）表示，但其他单位如分钟、天、周、月和
年等有时也会使用。产品或系统的寿命T 是一个非
负随机变量，它的分布称为产品或系统寿命分布。
常见的寿命分布
寿命分布有离散型分布和连续型分布，有一维分布
和多维分布。
一维离散型分布常见的有二项分布、几何分布、超
几何分布、泊松分布等。
一维连续型寿命分布常用的有指数分布、伽玛
(Gamma)分布、威布尔(Weibull)分布、极值分布和
对数正态分布等，限于篇幅，这里简单介绍两个常
见的寿命分布。
【例6.2.3】在可靠性理论的很多应用中，参数为的指数分布常被用
来描述某产品的寿命分布。试求该寿命分布的可靠度函数、失效率函
数和平均寿命。
【解】参数为的指数分布的密度函数和分布函数分别为
f T (t )  e
其可靠度函数为
FT (t )  1  e t
t
R(t )  1  FT (t )  et
t0
t0
在该模型中，可靠度函数关于时间以指数的速度由1趋于0。平均寿
命为

  E (T )   tf T (t )dt 
0
1

它恰好是指数分布参数的倒数；失效率函数为
f T (t ) e t
 (t ) 
 t  
R(t )
e
t0
它和时间无关，相互独立，是一个常数，这说明指数分布不能用于失
效率函数不是常数的产品的寿命分布；另外还要注意到指数分布的失
效率是平均寿命的倒数。如果指数分布的参数 λ=1/100，则其平均寿
命为 μ=100（小时），失效率是 λ=1/100，即产品工作到任意时刻之
后，平均每100个产品中大约有1个失效（即出现故障）。
图6.3 参数为100的指数寿命分布的可靠度和失效率
§6.3 系统的可靠性
• 现代工业产品或系统
• 常见系统
• 串联系统的可靠性
• 并联系统的可靠性
• 混联系统的可靠性
◎系统泛指由一群有关连的个体组成，根据预先编排
好的规则工作，能完成个别元件不能单独完成的工作
的群体。
◎系统是普遍存在的，在宇宙间，从基本粒子到河外
星系，从人类社会到人的思维，从无机界到有机界，
从自然科学到社会科学，系统无所不在。它大致可以
分为自然系统、人工系统、复合系统。
◎自然系统包括生态平衡系统、生命机体系统、天体
系统、物质微观结构系统以及社会系统。人工系统包
括生产系统、交通系统、电力系统、电子计算机系统、
教育系统、医疗系统、企业管理系统。复合系统是自
然系统和人工系统的组合。如导航系统、广播系统、
交通管理系统和人一机系统等等。
◎系统三要素：（1）系统是由若干要素（部分）组成
的；（2）系统有一定的结构；（3）系统有一定的功
能，或者说系统要有一定的目的性。
现代工业产品或系统：作为人工系统、复合系统的
现代工业产品，如电子产品，大都是由许多子系统
或部件、元器件等单元组成。整个产品或系统的可
靠性不仅和构成它的每一个单元的可靠性有关，还
与这些单元组成该系统的构成方式密切相关，所以
要综合起来考虑整个系统的可靠性；对系统的失效
率，也是如此。
常见的系统：有串联系统、并联系统、混联系统、
表决系统、冷储备系统和热储备系统，稍复杂一些
的是网络系统。下面仅仅讨论结构比较简单的串、
并、混联系统的可靠性和失效率
本节讨论不可修复系统，即组成系统的各部件失效后，
不对失效部件进行任何的维修。
这里为简化，系统和元器件都只考虑不可修复情况，
即它们只有两种状态：正常工作和失效。
符号说明：
一个系统由n个子系统或部件、单元 C1 , C2 ,, Cn
构成，假设这n个部件各自能否正常工作是相互独
立的。设第i个部件的寿命用随机变量Ti表示，整
个系统的寿命为T；初始时刻t = 0时，所有部件都
是新的，且同时开始工作。
Rsys (t )  P(T  t )
Rsys(t)：表示系统的可靠度，即
，
Ri (t )  P(Ti  t )
Ri(t)：表示第i个部件的可靠度，即
，
 / Rsys
sys ：表示系统的失效率， sys  Rsys
，
 i ：表示第i个部件的失效率， i  Ri / Ri
，
msys ：表示系统的平均寿命MTTF。
一、串联系统
定义：一个系统由n个子系统或部件构成，如果只有所有的部
件都正常工作时，系统才正常工作，而只要有一个部件失效，
系统就失效，这样的系统称为串联系统，下图给出了串联系统
的结构示意图。由串联系统的结构特点可知，上述串联系统的
寿命
T  min{T1 , T2 , , Tn 
C1
C2
Cn
可靠度
根据可靠度的定义得串联系统的可靠度为
s
Rsys (t )  P{T  t}  P{min{T1 , T2 ,  , Tn }  t}
 P{T1  t , T2  t ,  , Tn  t}
n
n
  P{Ti  t}   Ri (t )
i 1
(6.7)
i 1
*上式表明串联系统的可靠度是所有独立部件的可靠度的乘积，串联系统
的构成部件越多，系统的可靠度越低
用 λi(t) 失效率表示串联系统的可靠度为（6.8）


 tn

R
(
t
)

R
(
t
)

exp


(
u
)
du

exp


(
u
)
du
 0 i



s sys
i
i

0
i 1
i 1
 i 1

n
n
t
易计算得串联系统的失效率为（6.9）
失效率
s
sys (t )  
s
 (t )
Rsys
s
Rsys (t )
n
  i (t )
i 1
即一个由相互独立的部件构成的串联系统的失效率是所有部
件的失效率之和，串联系统的构成部件越多，系统的失效率
越高。
再有(6.3)和(6.5)式可得串联系统的平均寿命为（6.10）
平均寿命


0
0

t

msys   s Rsys (t )dt   exp   s sys (u)du dt  
0

0
 t n

exp   i (u)dudt
 0 i 1

例6.3.1：某系统由n个相互独立的部件串联而成，假设每个部件的失
效率都为常数，分别为 1 , 2 ,, n 。求此串联系统的可靠度、失效
率和平均寿命。
【解】由已知条件每个部件的失效率都为常数及第二节的性质2可知，
这n个部件的寿命服从参数分别为
1 , 2 ,, n
的指数分布，由例6.2.3的结论得它们的可靠度分别
为 R (t )  eit , i  1,, n 。由(6.7)式，
i
此系统的可靠度为
s
n
n
i 1
i 1
Rsys (t )   Ri (t )   e
再由(6.9)式得，此系统的失效率为
s

0
0
msys   s Rsys (t )dt  
  n 
 exp   i t 
  i 1  
n
n
i 1
i 1
sys (t )   i (t )   i
由(6.10)则得到系统的平均寿命为

i t
n
  n 
1
exp   i t dt  1 /  i 
i 1
s sys (t )
  i 1  
实际上，由该系统的可靠度函数或失效率函数都容易看出，该系统的
寿命仍然服从指数分布，参数为
均寿命为
n
1 /  i
i 1
n

i 1
i
；由此也可得到该系统的平
例6.3.2：设某种计算机有100个相互独立的部件串联而成，每个部件
正常运行1500小时的可靠度都是R(1500)=0.999(很高了)，求该计算
机正常工作1500小时的可靠度；如果每个部件正常运行1500小时的可
靠度都是R(1500)=0.99(也不低)，试求该计算机正常工作1500小时的
可靠度。
【解】因为是串联系统，所以计算机正常工作1500小时的可靠度为
100
Rsys (1500)   Ri (1500)  0.999100  0.9048
i 1
这一结果说明，尽管每个部件在1500小时内几乎不可能失效，但是由
100个这样的部件串联构成的计算机的在工作1500小时内出现故障的
概率却高达0.1！
当Ri(1500)=0.99时，计算机正常工作1500小时的可靠度为
100
Rsys (1500)   Ri (1500)  0.99100  0.3660
i 1
这一结果让我们感到更为震撼。在电子工业领域，大型产品或系统开
发企业往往对电子元器件可靠度的要求极高。
二、并联系统
定义：一个系统由n个子系统或部件构成，如果有一个部件工
作，系统就能工作；只有所有的部件全部失效时，系统才失效，
这样的系统称为并联系统，下图给出了并联系统的结构示意图。
C1
C2
Cn
并联系统的结构决定了并联系统的寿命
所以并联系统的可靠度为
T  max{T1 , T2 , , Tn 
可靠度
p
Rsys (t )  P{T  t}  P{max{T1 , T2 ,  , Tn }  t}
 1  P{max{T1 , T2 ,  , Tn }  t}
 1  P{T1  t , T2  t ,  , Tn  t}
n
n
 1   P{Ti  t}  1   [1  Ri (t )]
i 1
i 1
(6.11)式表明并联系统的构成部件越多，系统的可靠度越高。
(6.11)
失效率
t
t n1

R
(
t
)


n

e
(
1

e
)，
p sys
由于
所以该系统的失效率为
 (t )
Rsys
ne t (1  e t ) n1

p sys (t )  
1  (1  e t ) n
p Rsys (t )
p
由(6.3)则得到系统的平均寿命为
平均寿命


0
0
msys   p Rsys (t )dt   [1  (1  e
1 1
1
1 n 1
) ] dt  (1      )  

2 3
n
 i 1 i
1
t n
【例6.3.3】某系统有2个相互独立的部件并联而成，假设这两
个部件的失效率分别为常数λ1,λ2。求此并联系统的可靠度、失
效率和平均寿命。P257
n
解
p
p
Rsys (t )  1   [1  Ri (t )]  1  (1  e 1t )(1  e 2t )  e 1t  e 2t  e ( 1 2 ) t
i 1
 (t )  1e1t  2e2t  (1  2 )e(12 )t
Rsys
p
sys (t )  
p
 (t )
Rsys
p
Rsys (t )

1e  t  2 e  t  (1  2 )e (   )t
1
2
e 1t  e 2t  e ( 12 )t


0
0
msys   p Rsys (t )dt   (e 1t  e 2t  e ( 1 2 ) t )dt

1
1

1
2

1
.
1  2
1
2
【例6.3.4】某系统由n个相互独立的部件并联而成，假设每个部件的
失效率都为常数λ。求此并联系统的可靠度、失效率和平均寿命。
【解】由已知条件和第二节的性质2可知，这n个部件的寿命分布都
是参数为λ的指数分布，由例6.2.3的结论得它们的可靠度都为
Ri (t )  et , i  1,, n
由(6.3.5)式，此系统的可靠度为
n
t n
R
(
t
)

1

[
1

R
(
t
)]

1

(
1

e
)

p sys
i
i 1
由于
t
t n1

R
(
t
)


n

e
(
1

e
)
p sys
所以该系统的失效率为
 (t )
Rsys
ne t (1  e t ) n1

p sys (t )  
t n
R
(
t
)
1

(
1

e
)
p sys
p
由(6.2.8)则得到系统的平均寿命为


0
0
msys   p Rsys (t )dt   [1  (1  e
1 1
1
1 n 1
) ] dt  (1      )  

2 3
n
 i 1 i
t n
1
三、混联系统
定义：由串联和并联混合组成的系统称为混联系统。混联系统的结
构形式多种多样，这里仅举几个例子以说明混联系统可靠度、失效
率和平均寿命的计算方法。
1、串—并联系统
可靠度：
失效率
11
21
n1
12
22
n2
1m1
2m2
nmn
mi


Rsys (t )   1   [1  Rij (t )]
i 1 
j 1

n
 (t )
Rsys
mne t (1  e t ) m1
sys (t )  

Rsys (t )
[1  (1  e t ) m ]n
平均寿命
由于计算该串—并联系统的平均寿命复杂一些，这里不再给出。
2、并—串联系统
图6.3.4所示的系统称为并—串联系统。假设各部件的可靠度函数分
别为Rij(t)，i = 1, …, n, j = 1,…,mi, 所有部件的寿命都相互独立。
11
12
1m1
21
22
2m2
n1
n2
nmn
（1）可靠度：
mi
i 1
j 1
Rsys (t )  1   [1   Rij (t )]
（2）指数分布情形：
并—串联系统的可靠度为
失效率为
n
Rsys (t )  1  (1  emt )n
 (t )
Rsys
mne  mt (1  e  mt ) n1
sys (t )  

Rsys (t )
1  (1  e mt ) n
平均寿命为
n
msys
1
1


m i 1 i
【例6.3.2续】假设每个部件正常运行1500小时的可靠度都达不到
0.999，只能是0.9684，如果直接用可靠度是0.9638的100个部件串
联构成计算机系统，则计算机的可靠度仅是 Rsys (1500)  0.9684100  0.0403
假设计算机有足够的空间为每个部件增加备用的冗余部件, 为提高计
算机系统的可靠度，可以用两个可靠度为0.9638的部件并联起来代
替原来的一个部件，这实际上就是一个串—并联系统。根据上面的
公式可得，此时计算机系统的可靠度是
Rsys (1500)  [1  (1  0.9684)2 ]100  0.9049
，这和用100个可靠度为0.999的部件串联的结果一样，比直接用可
靠度是0.9638的100个部件串联极大地提高了计算机系统的可靠度。
【例6.3.8】计算图6.10所示的混联系统的可靠度，其中每个部件的
C2
C1
可靠度标在它们的旁边.
【解】该混联系统最内层是由
0.76
C4
部件C4和C5并联而成的子系统，
C3
记为
C5
C4
0.98
0.75
，先计算其可靠度为
RC 4  1  (1  0.76)(1  0.75)  0.94
部件C1、C2、C3和组成并—
串联系统，根据前面的公式可
得该混联系统的可靠度为
Rsys  1  (1  0.99  0.96)(1  0.98 0.94)  0.9961
§6.4 寿命试验与可靠度的非参
数估计
问题3：可靠性数据即寿命数据如何得到?
答：首先要通过寿命试验获取寿命数据，
然后再通过寿命数据分析，确定寿命分布的
类型以及获得其参数的估计，或者得到寿命
分布本身的估计。只有在对部件、产品的寿
命特性有了定量的认识之后，据此得到的可
靠性指标才比较符合实际；
最后简介加速寿命试验。
一、寿命数据的获得—寿命试验
(一) 寿命试验的定义和目的
1、定义：寿命试验是指从一批产品中随机
抽取n个产品组成一个样本，然后把此样本
放在一定的应力水平(工作温度、工作电压
等)下进行试验，观察其工作状态，对照事
先确定的失效判据，发现有样品失效，立
即记录其失效时间，最后用统计方法对这
些失效时间数据进行处理，获得这批产品
(总体)的各项可靠性指标。
2、寿命数据分析的目的是定量地把握系统或部件寿
命分布和可靠性特征，并把所获的信息反馈到设
计、制造和使用维修中去，以期改善可靠性、降
低成本或合理安排维修和更换，使之获得更好的
使用价值和经济效果。具体地讲，表现在如下几
个方面：
(1)在研制阶段用以暴露试制产品各方面的缺陷，评
价产品可靠性达到预定指标的情况；
(2) 在生产阶段为监控生产过程提供信息；
(3) 对定型产品进行可靠性鉴定或验收；
(4) 暴露和分析产品在不同环境和应力条件下的失效
规律及有关的失效模式和失效机理；
(5) 为改进产品可靠性，制定和改进可靠性试验方案，
为用户选用产品提供依据。
(二) 寿命试验的分类
1、根据试验场所分类：现场寿命试验和实验室寿
命试验
(1) 现场寿命试验这是产品在实际使用条件下观
测到的实际寿命数据，最能说明产品可靠性的特
征，可以说是最终的客观标准。因此，收集现场
中产品的寿命数据很重要。然而，收集现场数据
困难多、投资大，需要时间长，工作情况也难以
一致，而且必须要有相应的组织管理工作。
(2) 实验室寿命试验又称模拟寿命试验，它将现
场主要的工作条件搬到实验室，并加以人工的控
制，所有参试样本都在几乎完全相同的条件下进
行寿命试验。
模拟寿命试验管理简便、投资小、有重复性，
便于产品间的比较。由于现场条件复杂多样，不可
能把现场工作条件全搬到实验室内，只能选择对产
品寿命最有影响的、可控的一、二项条件，如温度、
电流、电压、振动、负载等。这些工作条件通称为
应力，其值称为应力水平，如150℃就是温度这个
应力的一个水平。
模拟寿命试验由于受设备条件的限制，往往只
能对产品施加单一条件，有时也可以施加多种条件，
这与实际使用环境条件有很大差异，因而未能如实
地、全面地暴露产品的质量情况。现场寿命试验则
不同，因为它是在使用现场进行，故最能真实地反
映产品的可靠性问题，所获得的数据对于产品的可
靠性预测、设计和保证有很高价值。对制定可靠性
试验计划、验证可靠性试验方法和评价试验精确性，
现场使用试验的作用则更大。实际中，模拟寿命试
验往往比现场寿命试验使用的更多。
2、根据试验截止情况分类：完全寿命试验和截尾寿命
试验
完全寿命试验是指试验样本全部失效才停止的试验。
这种试验获得的数据完整，统计分析结果也较为可信。
但是所需试验时间较长，甚至难以实现；等到全部失效
时，新产品可能都设计出来了它难以适应产品更新换代
的需要，这种试验常不被采用。
出于经济性和实效性的考虑，可以采用截尾寿命试
验，它是指全部试验样本有部分出现失效就停止的试验。
截尾寿命试验通常又分为两类：定时截尾和定数截尾寿
命试验。定时截尾寿命试验是试验到规定的时间，不管
样本已失效多少，就立即停止试验；这时样本中的失效
个数是随机的，事先无法知道。为了不使失效个数过少
或过多，恰当地规定试验停止时间是实施定时截尾寿命
试验的关键。定数截尾寿命试验是试验到规定的失效个
数时试验就截止；这时试验停止时间是随机的，因此恰
当地规定失效个数或比例，不致于使试验时间过长是成
功地进行定数截尾寿命试验的关键。
假如在截尾寿命试验中还考虑失效产品是否允许
替换，这又有无替换试验与有替换试验之分。进行有
替换试验主要是为了获取更多的试验信息，当一个产
品失效了，就将它从试验位置上取下，为了利用这个
空的位置，可以补上相同产品继续试验。在试验费用
增加不多的场合，可以获得更多信息。假如试验样本
容量为n，按有无替换和截尾方式，可以组合成最常
用的四种情形：
(n, 无, 时) —— n个产品无替换定时截尾寿命试验；
(n, 无, 数) —— n个产品无替换定数截尾寿命试验;
(n, 有, 时) —— n个产品有替换定时截尾寿命试验;
(n, 有, 数) —— n个产品有替换定数截尾寿命试验。
3、根据试验条件分类：
普通寿命试验和加速寿命试验
普通寿命试验是指在正常的工作条件下进行的寿
命试验。随着科学技术的发展，高可靠、长寿命的产
品愈来愈多，即使截尾寿命试验也不能满足实效性和
经济性的需求，这就需要在超过正常工作条件的环境
下进行寿命试验。如不少电子元器件的寿命很长，在
正常工作温度下可达数百万小时以上，进行数万小时
的试验，可能只有一、二个失效，甚至会出现没有失
效的情况；适当提高试验的温度，由于工作环境变得
恶劣，失效个数会增多，大大节省试验时间。
超过正常应力水平下的寿命试验称为加速寿命试
验。加速寿命试验因为很实用，但超出了本书讨论的
范围，这里仅作简介。
(三) 两类寿命数据
在完全寿命试验中，由于所有样本的寿命都可以
完全观测到，所得到的样本称为完全样本，所观测到
得寿命数据称为完全数据(complete data)。在截尾寿
命试验中，先后记录的失效时间为t1≤t2≤…≤tr
，称为截尾样本或不完全样本，所得的数据称为截尾
数据或不完全数据(incomplete data)，其中r称为截尾
数，一般r≤n，当r=n时，截尾寿命试验就成为完全寿
命试验。所以完全寿命试验是截尾寿命试验的特例。
一般说来，截尾样本所含的失效信息总比完全样
本少一些。数据出现截尾的原因除了上述两种情况外，
还有很多，如医学跟踪或随访对象由于各种原因失去
联系，或者试验样本对受试药物不适应而中途停止试
验，或试验样本突然被抽调走用于实际工作，或被盗
窃或丢失等。完全观测数据和不完全观测数据是实际
工作寿命数据统计推断中最常见的两类数据，本节第
二部分和下一节的统计分析都是针对这两类寿命数据
进行。
假设n个独立部件(样本)从t = 0 时刻开始试验；
对完全寿命试验，则每个样本的数据都可以观测到
t1, t2, …, tn。
定时截尾时，假设试验指定的终止时刻为t0，如
果在试验终止时观测到r个失效，其失效时间依次记
为 t1  t2    tr  t0 ，还有n-r个在t0时没有失效。
定数截尾时，假设试验到第r个失效时就停止，
则可以观测到它们的寿命时间为 t1  t2    tr ，还有
n-r个在tr时没有失效。
二、可靠度函数的非参数估计
在实际中有许多情形使得没有一个现实的基础
或理由为某种产品的寿命选择一个分布，甚至是分
布类型。例如，对一个新试制的产品，事先可能就
没有足够的信息来断言其寿命属予哪个分布类。如
果不知道产品的寿命分布是什么，仅仅知道试验样
本的寿命数据(部分或全部)，如何估计该产品的可
靠度(函数)呢？此时，不依赖于分布类型的非参数
方法是比较合适的工具。
估计可靠度函数或生存函数的卡普兰-梅耶尔
(Kaplan-Meier)方法
1.如果数据是完全数据，即n个试验样本的失效
时间 0  t1  t2    tn   都可以观测到，都是已知的，
R(t )  1，而经
 F (t )
那么估计可靠度函数R(t)很简单.因为
验分布函数Fn(t)是寿命分布函数F(t)的一个估计，
所以
t ,tn中  t的个数
N (t )
Rˆ (t )  1  Fn (t )  1 
 1 1
(6.4.1)
n
n
这里N(t)表示样本 t1 ,, tn 中小于或等于t的个数，
即到t时刻失效的样本的个数，上式表示可靠度的估
计就是到t时刻还没有失效的产品数与所有参加试验
的样本个数(样本容量)之比，它称为可靠度函数的
Kaplan-Meier估计。
2.但在许多问题中，由于定时或定数截尾、中途退
出试验、丢失、其他意外原因导致的失效等等，只
能观测到截尾数据或不完全数据，上述公式就不再
适用。假设在寿命试验中，我们得到以下数据
{(ti , i ) : i  1,, n}
，这里ti表示第i个样本在寿命试验中
的工作时间，若第i个样本在ti失效，ti就是它的寿
命，称为未截尾 (或未删失)，若第i个样本到试验
结束时也没有失效，则称ti为截尾(或删失)；如果
i  1 ，如果t 截尾，则令相
ti未截尾，则令相应的
i
(
t
,

)
应的δi=0。这样i i
就完全刻画了第i个试验样本
的实际的寿命情况。引入这种表示方法，主要是为
了分析的方便和利用软件计算的便利。在记录寿命
ti
数据时，有时也常用ti表示第i个样本数据没有截尾，
表示第i个样本数据截尾。这两种表示方法下面都会
遇到.令 t  t    t 表示 t1, t2 ,, tn 的顺序统计量，而  (i )
为 t(i ) 相应的δ值。值得注意的是，在 t(1) , t(2) ,, t(n) 中，
有些数据可能相等；有些数据可能是截尾的。
(1)
( 2)
(n)
如在某次为时18天的寿命试验中，有四件产品
的寿命为10、12、15、15天，有两件产品在第12、
14天时退出了试验(并没有失效)，有31件产品在试
验结束时仍没有失效，则寿命时间的顺序统计量为
10、12、12+、14+、15、15、18+、…、18+。
令ni表示所有大于或等于 t(i ) 的样本点的个数，
包括全部未截尾和截尾观测值，di表示等于 t(i ) 的未
截尾的样本点的个数，即 d i  { j: tt (}j ) ；则截尾数据
情形时的可靠度函数的Kaplan-Meier估计为
( j)
Rˆ (t ) 
 nk  d k


nk
{k : t( k )  t } 
当 t  t(1) 时，符合
(nk  d k ) / nk  1 ，

 ,

(i )
t 0
(6.4.2)
t( k )  t 条件的k不存在，则令
此时 Rˆ (t )  1
。
这个公式看似很复杂，实际上，只需要计算在
所有不相等的未截尾样本点处的可靠度的估计值即
可，而且利用迭代公式很容易计算，截尾样本点处
的可靠度的估计值与小于或等于该点且和该点最近
的未截尾点的可靠度的估计值相等。如假设 t(i )  t( j )
是两个紧相邻的不相等的未截尾样本点，由(6.4.2)
式可得
Rˆ (t( j ) ) 
 nk  d k


nk
{ k : t( k )  t( j ) } 

 n  dk
    k
 { k : t( k )  t( i ) }  n k
n dj
 nj  d j
 
 Rˆ (t( i ) )  j
nj
nj

在 t(i ) 和 t 之间可能有某些项是截尾的，但注意到和
(nl  d l ) / nl 都等于1。可靠度函
这些截尾的项相对应的
数的Kaplan-Meier估计的方差的估计由下式给出
( j)
 
Vâr Rˆ (t )  [ Rˆ (t )]2
dk
. (6.4.3)

{k: t( k )  t } nk ( nk  d k )
【例6.4.1】某种机器在装运给客户之前，一般要进
行为期24小时的试验，30台该种机器同时进行测试，
其寿命数据为13.1、14.0+、15.3、15.3、16.1+、
17.5、17.5+、18.9、19.0、24+、…、24+.试求该
种机器可靠度函数的估计，并画出可靠度函数估计
的图形。
Rˆ (t(i ) )
【解】注意数据后带+号者，说明该机器的在试验中
途退出或到试验结束时仍没有失效，即寿命数据是
截尾的。根据Kaplan-Meier方法，只需计算出在所
有不相等的未截尾样本点处的可靠度的估计值，计
算过程和结果见下表。
i
t(i)
ni
di
(ni - di)/ ni
1
2
3
4
5
13.1
15.3
17.5
18.9
19.0
30
28
25
23
22
1
2
1
1
1
29/30=0.9667
26/28= 0.9286
24/25= 0.9600
22/23= 0.9565
21/22= 0.9545
29/30=0.9667
0.9667(26/28)= 0.8976
0.8976(24/25)= 0.8617
0.8617(22/23)= 0.8242
0.8242(21/22)= 0.7868
所以该种机器可靠度函数的Kaplan-Meier估计为
1
0.9667

0.8976
Rˆ (t )  
0.8617
0.8242

0.7868
0  t  13.1
13.1  t  15.3
15.3  t  17.5
17.5  t  18.9
18.9  t  19.0
19.0  t  
显然，这是一个阶梯函数，其图形见图
0
在截尾样本点14.0+处，n2=29，δ2=0， d 2   2，
所以 (n2  d2 ) / n2  1 ，因为 Rˆ (13.1)  0.9667 ，
n  d2
Rˆ (14.0)  Rˆ (13.1)  2
 0.9667  Rˆ (13.1)
n2
，在其他截尾样本点
处，也有类似结论；即上面提到的：截尾样本点处
的可靠度的估计值与小于或等于该点且和该点最近
的未截尾点的可靠度的估计值相等。
【例6.4.2】为研究维持性化疗是否延长缓解急性骨髓性
白血病复发时间(即缓解期)，将患者经过化疗达到缓解
状态后随机地分成两组，第I组接受维持性化疗，第II组
未接受。测得两组患者缓解期的数据如下(单位：周)：
I组 9、13、13+、18、23、28+、31、34、45+、48、161+
II组 5、5、8、8、12、16+、23、27、30、33、43、45
试求两组患者的缓解期的可靠度函数(即存活函数)
的估计，由此比较接受维持性化疗的患者与对照组的患
者的缓解期有明显差别吗？
【解】根据Kaplan-Meier方法，只需计算出在所有
不相等的未截尾样本点处的可靠度的估计值，计算
过程和结果见下表
Rˆ (t(i ) )
i
t(i)
ni
di
(ni - di)/ ni
1
2
3
4
5
6
7
9
13
18
23
31
34
48
11
10
8
7
5
4
2
1
1
1
1
1
1
1
10/11=0.9091
9/10=0.9000
7/8=0.8750
6/7=0.8571
4/5=0.8000
3/4=0.7500
1/2=0.5000
10/11=0.9091
0.9091(9/10)= 0.8182
0.8182(7/8)= 0.7159
0.7159(6/7)= 0.6136
0.6136(4/5)= 0.4909
0.4909(3/4)= 0.3682
0.3682(1/2)= 0.1841
表6.4.2 I组患者可靠度函数Kaplan-Meier估计的计算
Rˆ (t(i ) )
i
t(i)
ni
di
(ni - di)/ ni
1
2
3
4
5
6
7
8
9
5
8
12
23
27
30
33
43
45
12
10
8
6
5
4
3
2
1
2
2
1
1
1
1
1
1
1
10/12=0.8333
8/10=0.8000
7/8=0.8750
5/6=0.8333
4/5=0.8000
3/4=0.7500
2/3=0.6667
1/2=0.5000
0
10/12=0.8333
0.8333 (8/10)= 0.6667
0.6667 (7/8)= 0.5833
0.5833 (5/6)= 0.4861
0.4861(4/5)= 0.3889
0.3889(3/4)= 0.2917
0.2917(2/3)= 0.1944
0.1944(1/2)= 0.0972
0
表6.4.2 II组患者可靠度函数Kaplan-Meier估计的计算
所以I、II组患者缓解期的可靠度函数的KaplanMeier估计分别为
1
0  t 9
0.8333
9  t  13

0.6667
13  t  18

0.5833
18  t  23
Rˆ II (t )  0.4861
23  t  31
0.3889

31  t  34
0.2917
34  t  48
0.1944

48  t  
1
0.9091

0.8182

0.7159
Rˆ I (t )  
0.6136
0.4909

0.3682
0.1841
0.0972
0  t 5
5  t 8
8  t  12
12  t  23
23  t  27
27  t  30
30  t  33
33  t  43
43  t  50
1.0
可靠度R(t)
0.8
I 组
II 组
图6.4.2 I和II组患者
可靠度函数的
Kaplan-Meier估计
0.6
K a p la n -M eier 法
0.4
0.2
0.0
0
20
40
60
80
100
120
140
160
时间 t
180
以一点为例计算可靠度函数的Kaplan-Meier估计的
方差的估计；对I组患者，


1
1
1 
 1
Vâr Rˆ I (24)  0.61362  



  0.0233
11

10
10

9
8

7
7

6


对II组患者有，


2
1
1 
 2
Vâr Rˆ II (24)  0.48612  



  0.0219
12

10
10

8
8

7
6

5


在t=24处，I组(接受维持性化疗)患者缓解期的
可靠度函数估计的方差比II组(对照)患者的要小，
原因是II组的截尾数据少些，截尾数据的增多一
般会增大估计的方差。
三、加速寿命试验
随着科学技术的迅猛发展，高可靠、长寿命的
产品越来越多，一般的寿命试验、截尾寿命试验也
不能适应需要。一般执行寿命试验之目的在于评估
产品在既定环境下的使用寿命，耗时较久，且须投
入大量的金钱，而产品可靠度信息又不能实时获得
并加以改善，导致失去许多“商机”与“竞争力”。
因此，如何在实验室中以加速寿命试验(Accelerated
Life Testing; ALT)的方法，在可接受的试验时间内
评估产品的使用寿命，便成为整体可靠度试验工作
中相当重要的一环，亦为可靠度试验中最具挑战性
的课题。
加速寿命试验
高压加速寿命试验
HLT高速加速寿命试验
加速寿命试验的统一定义最早由美罗姆航展中
心于1967年提出,加速寿命试验是在进行合理工程及
统计假设的基础上,利用与物理失效规律相关的统计
模型对在超出正常应力水平的加速环境下获得的信
息进行转换,得到产品在额定应力水平下的特征可复
现的数值估计的一种试验方法。简言之,加速寿命试
验是在保持失效机理不变的条件下,通过加大试验应
力来缩短试验周期的一种寿命试验方法。加速寿命
试验采用加速应力水平来进行产品的寿命试验,从而
缩短了试验时间,提高了试验效率,降低了试验成本。
加速寿命试验之基本条件是不能破坏原有特性，
要尽量选择失效机理不变化的试验条件，或失效机
理容易单纯化的试验条件，使加速寿命试验结果之
适用范围明确化。例如某信息设备的输入电压限制
为100~130V，若规划以200V为输入，当然就破坏了
原有的设计特性。
一般说来，加速寿命试验考虑的三个要素即环
境应力、试验样本数及试验时间。假如产品既复杂
又昂贵，则样本数将较少，相对的须增加试验时间
或环境应力，以加速其试验;反之如果产品造价较便
宜，且数量多，则欲缩短试验时间的情况下，可考
虑增加样本数或环境应力。惟如前面所叙述，加速
寿命试验下的失效模式．必须与正常操作环境下之
寿命试验相同，其试验结果才有意义。
加速寿命试验的类型
依其实施的方法可分为应力加速．时间加速及
分析加速三大类型
(1)应力加速寿命试验:此法系加重工作应力或环境应
力，短时间内造成强制劣化效果的加速寿命试验方
法，所施加之应力通常大小一定。但亦有随时间变
化的步进应力(Step Stress)试验法。加速应力试验在
施加应力种类、大小及施加方式等方面均须有适当
考虑选择。所选择应力种类须有效造成强制劣化效
应，而其可施加应力之大小应受“所造成失效模式
与实际操作时发生者相同” 的约束。施加方式须使
应力之传递、分布及作用方式与实际操作情况相同。
凡此种种，在试验规划设计时皆需要注意考虑。
(2)时间加速寿命试验(亦称反复加速寿命试验):此法
系增加产品操作之反复次数或形成连续动作，以造
成加速效应的方法，属于狭义的加速寿命试验。此
法适用于诸如自动电话交换机选择开关等，工作中
以开机关机为必要动作且为造成失效主要原因之机
械。
(3)分析加速寿命试验:此法系应用劣化观测及数据分
析分析技巧，加速判定失效率或寿命状况的方法。
简单一点的说，分析加速寿命试验便是在产品之造
价相当昂贵时，则可斟酌采用增加试验时间，减少
取样的试验方法;反之，若产品产量多且造价低廉，
则可考虑增加样本，并相对的减少试验时间的一种
加速寿命试验。
以下以一例来说明加速寿命试验的思想
【例6.4.3】某厂制造一种新型绝缘材料，专家们预
测其在正常工作温度150。C下的平均寿命要达10000
小时以上。为了获得平均寿命的估计值，预计寿命
试验要进行20000 小时左右，这相当于要进行2年多
时间，在一般工厂里是承受不了的。从绝缘材料的
物理性能知，适当地提高试验温度，可以加速绝缘
材料的老化，从而使击穿时间提前到来，达到缩短
试验时间的目的。通过摸底试验得知，在高温270
oC下该绝缘材料的失效原因仍然是由于老化引起的，
因此选取温度作为加速应力是妥当的，而加速应力
水平应在150。C到270。C间选取。经研究，决定选
190。C，220。C,240。C和260。C四个温度水平作为
加速应力水平，在这四个温度水平下分别安排一个
截尾寿命试验，各获得一个截尾样本，然后再设法
估计各温度水平下的平均寿命，具体估计方法依据
寿命分布而定，所得的平均寿命估计值列于表
i
Ti（。C）
1
2
3
4
190
220
240
260
 i h 
平均寿命
5046
2638
1572
1016
进一步的工作可以从图6.4.3得到启发。以温度T作纵
轴，平均寿命θ作横轴，把前表上的数据点在该坐标
纸上，可以看出一个明显的趋势：随着试验温度T的
下降，平均寿命θ在增加，假如把图上的四个点用一
条光滑的曲线联结起来，并顺势延长，那就可以看
到，当试验温度水平为150。C时，其平均寿命大约
为17000小时，这就是加速寿命试验全过程的简单缩
影。从这个缩影可以看出加速寿命试验的基本思想
是：利用高应力水平下的平均寿命去推正常应力水
平下的平均寿命。实现这个基本思想的关键在于建
立形如图6. 4.3上的曲线。这类曲线称为加速曲线，
这类曲线对应的函数表达式称为加速方程，或称加
速摸型。在物理和化学中已有一些这样的加速模型
可供使用，常用的有如下两个:
图6.4.3 绝缘材料的加速曲线
1. 阿伦尼斯(Anhenius)模型
高温度使产品(如电子元器件、绝缘材料等)内
部加快化学反应，促使产品提前失效，阿伦尼斯在
1880年提出如下加速模型：  AebT
（6.4.4）
其中θ可以是平均寿命或特征寿命等，T等于摄
氏温度加273，A和b是待定常数。
2. 逆幂律模型
加大电压(电流、功率等)亦能促使产品提前失效，
在物理上已被很多实验数据证实，平均寿命θ(或特征
寿命等)与电压V有如下关系：
  A /V d
其中A和d是待定常数。
（6.4.5）
回到例6.4.3中来，在那里已选温度作加速应力，故
应用阿伦尼斯模型(6.4.4)。这个模型告诉我们，随着
温度水平的增加，平均寿命是按指数下降。这样一
来，图6.4.3上的曲线应用指数函数拟合是恰当的。
从回归分析角度看，(6.4.4)是一元非线性回归，取对
数后，可得如下一元线性回归模型：
ln   a  b / T
（6.4.6）
用表6.4.3上的数据和最小二乘法容易算得其中a与b
的估计量，即得： ln   3.6975  5675 / T （6.4.7）
用此方程进行外推，将正常工作温度水平
T0=150。C =150+273=423K
代入（6.4.7）式可算得150 。C下的平均寿命为：
θ0=16624（h）
这与在图6.4.3上作业得到的结果很接近，但此结果不
会因人而异。
§6.5 寿命分布和数据的统计方法
寿命数据的统计分析是对系统或部件的寿命特性
作定量了解的一种重要手段。在参数模型中，模型(即
总体的分布类型已知，只是其中的参数未知)假定是已
知的，这可以由以往寿命数据分析所积累的经验或失
效机理分析来判断总体的分布类型。当总体的分布类
型已知时，常见的如指数分布或威布尔分布，由本章
第二节的知识知道，产品的可靠性指标，如可靠度函
数、失效率函数和平均寿命等都是这些参数的函数或
与这些参数有关，一旦未知参数估计出来，这些可靠
性指标也就完全清楚了；因此，参数模型中核心的问
题是如何由一组寿命数据(通常是不完全的)，来估计
寿命分布中的未知参数。
一、寿命分布为指数分布的统计推断
(二)平均寿命、可靠度和失效率的区间估计
表6.5.1 指数分布检验的计算表
Sn , i
序号
i
t(i )
1
48
720
4.7173
2
69
1014
4.3749
3
190
2587
3.4383
4
1500
18307
1.4815
5
3889
44586
0.5913
6
6112
66816
0.1868
7
7637
80541
ln(Tn, r / Sn, i )
tS(in) , i
Q = 29.580
二、寿命分布为威布尔分布的统计推断
威布尔分布有最弱环模型作为其实际背景。最
弱环原理认为故障或失效发生在产品的构成因素中
最弱部位(环节)，这相当于构成产品链条的各个环
节中最弱环的寿命就是整个产品的寿命，假如各环
节的分布是相同，那么产品链条的寿命就服从威布
尔分布。大量的实践说明，凡是因某一局部失失效
而导致全局停止运行的元器件、设备系统和产品等
的寿命都可看作或近似看作服从威布尔分布。如金
属材料和机械零件或部件(如轴承)、电子元器件、
电容器、光电单元、马达、纺织品以及许多生命体
的寿命都可以用威布尔分布描述。
（二）威布尔分布参数的极大似然估计
§6.6 使用Minitab进行可靠性分析
Minitab的可靠性和生存分析主要功能：检验计
划、分布分析（右删失）、分布分析（任意删失）、
保证分析、可修复系统分析、寿命数据回归、概率
单位分析。图6.6.1 可靠性和生存分析功能菜单
演示如何利用Minitab软件画Q-Q图、概率图。
然后简单介绍怎样用Minitab软件对寿命分布和数据
进行参数分析和非参数分析。
一、Q-Q图：分布的检验
在Minitab软件中，可以画14种常见分布的Q-Q
图，这里简单加以介绍。
Minitab软件使用的方法列于表中，默认方法为
中位数秩，如要选用其他方法，在工具 > 选项 > 单
独图表 > 概率图 > 计算标绘点的方法下选择即可
方法
中位数秩(Benard)
平均值秩(Herd-Johnson)
修正Kaplan-Meier秩(Hazen)
Kaplan-Meier秩
公式
i  0.3
n  0.4
i
n 1
i  0 .5
n
i
n
样本编号
易燃性
1
3.3
2
3.0
3
4.3
4
3.9
5
3.9
6
4.8
7
4.0
8
3.8
9
3.3
10
3.0
11
3.7
12
3.0
13
3.7
14
2.7
15
3.2
【例6.15】某纺织品制造商要评估新布
料的易燃性，检验员随机地选择了几块
布料放在明火上烧一段时间(固定)，然
后测量燃尽部分的长度，数据保存在
eg615.xls中。使用Q-Q图检验该数据是
否服从正态分布。
【解】第一步：用Minitab绘制Q-Q图
①选择菜单栏“文件”—“打开工作表”，打开文件eg615.xls
②选择“图形”—“概率图”，选择“单一”，然后点击“确定”，
弹出对话框“概率图-简单”，见图6.18
③在“概率图-简单”对话框的左边框中双击“易燃性”，使之选
入右边的“图形变量”框中(或在框内直接输入’易燃性’)
④单击“分布”按钮，弹出“概率图-分布”对话框(图6.19)，在
“分布”下选择需要的分布，本例选“正态”；“历史参数”下，
如果相应参数已知，则填上，若未知，则不用填写，Minitab将使
用最小二乘估计(正态分布或对数正态分布)或极大似然估计(其他
分布)来估计参数，这里不填。再单击“数据显示”标签,在“数
据显示”下选择“符号和分布拟合”，“显示置信区间”前不选
择，点击确定(请同学们自己试试选择其它选项会出现什么情况，
这里不再罗嗦)
⑤单击“尺度”按钮，弹出“概率图-尺度”对话框(图6.20)，选
择“转置Y和X”(在前面的方框内打勾)；然后单击“Y尺度类型”，
在“Y尺度类型”下选择“得分”，点击确定(“标签”、“多图形”
和“数据选项”按钮的功能自己探索！)
⑥单击“概率图-简单”对话框中的“确定”按钮，即可得到正态
Q-Q图(图6.21)，对图形进行修改和修饰得到图6.22 (注：正式的
学术期刊、著作常采用图6.22，而不是图6.21)，最后选择菜单栏
“文件”—“将图形另存为”把图形保存为你需要格式
易燃性的概率图
正态
5.0
均值
3.573
标准差 0.5700
N
15
AD
0.310
P 值
0.517
4.5
易燃性
4.0
3.5
3.0
2.5
2.0
-2
-1
0
分值
1
2
第二步：解释结果
上图显示数据点大致在一条直线上，这条直线截距
为3.57，斜率为0.57，这说明平均值为3.57且标准差
为0.57的正态分布似乎与样本数据拟合得不
错。 Anderson-Darling检验的p值为0.517，显著的
大于0.05，这也进一步表明这组数据服从均值为3.57、
方差为0.57的正态分布。
寿命(小时)
【例6.16】某电子产品的寿命
数据保存在文件eg616.xls中，
试用Q-Q图检验该数据是否服
从威布尔分布。
【解】第一步：用Minitab绘制QQ图
108635.600
5548.000
1590.400
12483.600
11.100
63.900
5597.900
1086.000
237.700
58.200
2886.600
38110.800
161.800
4898.900
7499.100
85403.600
1.600
12.000
124.900
0.100
1.200
1377.000
282.400
6016.000
374.000
415.300
458.500
16693.500
2241.100
12.800
789356.300
3193.300
55.300
1.600
122.100
0.001
208.500
143.500
203.800
580.100
312754.100
27297.500
2.600
820552.700
137964.400
454990.500
97.800
3909.800
60605.300
①选择菜单栏“文件”>“打开工作表”，打开文件
eg616.xls
②选择“图形”>“概率图”>“单一”>“确定”，弹出
对话框“概率图-简单”
③在“概率图-简单”对话框的左边框中双击“寿命”，
选入右边“图形变量”框中
④单击“分布”按钮，弹出“概率图-分布”对话框，
在“分布”下选择“Weibull”，“历史参数”下，
“形状”和“尺度”均不填。再单击“数据显示”标
签,在“数据显示”下选择“符号和分布拟合”，选择
“显示置信区间”，点击确定
⑤单击“尺度”按钮，弹出“概率图-尺度”对话框，
选择“转置Y和X”；然后单击“Y尺度类型”，在“Y
尺度类型”下选择“得分”，点击确定
⑥单击“概率图-简单”对话框中的“确定”，即可得
到威布尔Q-Q图(见图6.23)
1.0000E+08
10000000.0
1000000.0
100000.0
10000.0
1000.0
寿命(小时)
100.0
95%置信区间
10.0
1.0
0.1
形状 0.2825
尺度
5135
AD
0.339
p值 >0.250
0.0
0.0
0.0
0.0
0.0
-4
-3
-2
-1
Weibull分布的分位数
0
1
第二步：解释结果
上图显示数据点还算大致在一条直线上，尽管尾部有一写偏离；
这说明尺度参数为5135且形状参数为0.28的威布尔分布似乎与
样本数据拟合得还可以。 Anderson-Darling检验的p值大于0.25，
显著的大于0.05，这也进一步表明这组数据服从尺度参数为
5135且形状参数为0.28的威布尔分布。
该数据的威布尔概率图见下图.
0.999
概率
0.99
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
形状 0.2825
尺度
5135
AD
0.339
p值 >0.250
0.05
0.03
0.02
0.01
00
0.
0.
00
01
0.
1
0.
0
1.
00
0
0
0
0
7
.0
.0
.0
.0
+0
0
0
0
0
E
0
0
0
0
00
10
00
00
00
10
0
0
0
1
寿命(小时)
10
1.
.0
10
0
0.
10
00
图6.24 电子产品的寿命数据的威布尔概率图
二、Minitab的分布ID图和分布概要图功能
(一) 分布ID图功能
Minitab软件能够简化上述做法，可以对寿命数
据同时作11种常见寿命分布的概率图，这11种常见
分布为：最小极值、Weibull、3参数Weibull、指数、
2参数指数、正态、对数正态、3参数对数正态、
Logistic、对数Logistic和3参数对数Logistic。这样
就可以通过比较这11个概率图上点与拟合线的距离
远近来确定哪种分布与你的数据拟合得最好，从而
确定数据所服从的分布。
【例6.16续一】某电子产品的寿命数据保存在文
件eg616.xls中，试检验它服从什么分布。
【解】这里使用分布ID图。第一步：利用Minitab的
分布ID图功能。
①选择菜单栏“文件”>“打开工作表”，打开文件eg616.xls
②选择“统计”>“可靠性/生存分析”>“分布分析(右删
失)”>“分布ID图”(见图6.25)，弹出对话框“分布ID图-右删
失”(图6.26左边图)
③在“分布ID图-右删失”对话框的左边框中双击“寿命”，选
入右边“变量”框中，然后选择“使用所有分布”
④单击“选项”按钮，弹出“分布ID图-选项”对话框(图6.26
右边图)，“估计法”选择“极大似然”，然后点击“确定”，
⑤在“分布ID图-右删失”(图6.26左边图)中单击“确定”按钮，
即可得到11种分布的概率图(见图6.27)
第二步：根据概率图进行分析，选择合适的理论分
布。由这11个概率图可以看出，威布尔分布拟合这
组数据最好，因此最终选择威布尔分布作为这组数
据的总体分布。
分布ID图
(二) 分布概要图的使用
前面利用分布ID图识别和判断出了数据服从
的分布，使用“分布概要图”对该分布可以生成一
个汇总图，这样就能在一个图形中了解寿命数据的
各种指标或特征(如可靠性函数、密度函数等)。可以
通过为数据选择一种分布来绘制参数概要图，或者
是非参数概要图。参数概要图显示包括概要图(用于
所选分布)、生存(或可靠性)图、概率密度函数和故
障图。非参数概要图取决于数据的类型：如果是右
删失数据，则Minitab将显示Kaplan-Meier生存图和
故障图或精算生存图和故障图。(如果是任意删失数
据，则Minitab将显示Turnbull生存图或精算生存图
和故障图)。这些函数都是描述失效时间数据分布的
典型方法。
【例6.16续二】某电子产品的寿命数据保存在文件
eg616.xls中，试用该数据绘制威布尔分概要图。
【解】利用Minitab的分布概要图功能。
①选择菜单栏“文件”>“打开工作表”，打开文件
eg616.xls
②选择“统计”>“可靠性/生存分析”>“分布分析
(右删失)”>“分布概要图”(见图6.25)，弹出对话框
“分布概要图-右删失”(图6.28左边图)
③在“分布概要图-右删失”对话框的左边框中双击
“寿命”，选入右边“变量”框中，然后选择“参
数分析”>“分布”选择“Weibull”
④单击“选项”按钮，弹出“分布概要图-参数选项”
对话框(图6.28右边图)，“估计法”选择“极大似
然”，然后点击“确定”
⑤在“分布概要图-右删失”(图6.28左边图)中单击
“确定”按钮，即可得到该数据威布尔分布的概要
图(见图6.29)
概率密度函数
1.0000E+07
1000000.00
100000.00
10000.00
1000.00
100.00
10.00
1.00
0.10
0.01
0.00
0.00
寿命( 小时)
0.000075
0.000050
0.000025
0.000000
0
400000
800000
寿命( 小时)
1200000
0.01
0.1
0.5
0.9 0.999
概率
可靠度(或生存)函数
失效率(或危险)函数
100
统计量表
形状
0.282531
尺度
5135.11
平均值
63105.4
标准差
389726
中位数
1403.34
四分位间距
16254.5
失效
50
删失
0
AD*
0.613
0.00015
比率
百分比
PDF
极大似然估计-完整数据
Weibull
50
0.00010
0.00005
0
0.00000
0
400000
800000
寿命( 小时)
1200000
0
400000
800000
寿命( 小时)
图6.29 威布尔分布概要图
1200000
如果在上述步骤3中，选择“非参数参数分析”，步
骤4改为单击“选项”按钮，弹出“分布概要图-非参
数参数选项”对话框，“估计法”选择“KaplanMeier”，然后点击“确定”，则可得到非参数分布概
要图，见图6.30。非参数可靠度图和失效率图不对总
体分布作任何假设，可以按照参数可靠度图和失效率
图方式一样进行解释，主要差别在于：非参数情形下
为阶梯函数，而参数情况下为平滑函数。
可靠度(或生存)函数
失效率(或危险)函数
1.0
80
0.8
60
0.6
比率
百分比
100
40
0.4
20
0.2
0
0.0
0
200000
400000 600000 800000
寿命(小时)
0
200000
400000 600000 800000
寿命(小时)
说明：Minitab输出中的生存函数即可靠度函数，生
存概率就是可靠度，危险函数就是失效率函数，累
计失效率函数就是寿命分布函数。
三、非参数分析
当研究者拥有产品的实际寿命数据(即失效数
据)或右截尾数据，但却不知道这些数据服从何种寿
命分布时，可以利用Minitab软件进行非参数分析。
在Minitab软件中进行非参数分析，可以估计可靠度
函数、累积失效率函数即寿命分布和其他函数，并
且可以绘制生存图、累积失效图和故障图。估计方
法包括Kaplan-Meier估计或精算估计；对各种截尾
方案的表格数据，可以用Turnbull估计或精算估计。
以例6.9的数据演示如何使用Minitab进行非参数分析。
【例6.9续】某种机器在装运给客户之前，一般要进
行为期24小时的试验，30台该种机器同时进行测试，
其寿命数据为13.1、14.0+、15.3、15.3、16.1+、
17.5、17.5+、18.9、19.0、24+、…、24+.试求该
种机器可靠度函数的Kaplan-Meier估计，并画出可
靠度函数估计的图形。
【解】数据保存在文件eg69.xls中，共有3列，第
一列是寿命数据，第二列表明相应第一列的数据
是否截尾，1表示未截尾，0表示截尾，第三列表
明相应第一列的数据出现的次数，即频数。利用
Minitab的可靠性分析中的非参数分布分析功能。
①选择菜单栏“文件”>“打开工作表”，打开文件eg69.xls，文件类型选
Excel
②选择“统计”>“可靠性/生存分析”>“分布分析(右删失)”>“非参数分布分
析”(见图6.25)，弹出对话框“非参数分布分析-右删失”(图6.31左图)
③在该对话框的左边框中双击“寿命”，选入右边“变量”框中，再把光
标移到“频率列”下面的框中，然后双击左边框中的“频数”，使之进入
“频率列”下面的框中
④单击“删失”按钮，弹出“非参数分布分析-删失”对话框(图6.31右图)，
点击“使用删失列”下的框，再点击左边框中的“C2 是否删失”变量，
然后单击“选择”按钮，在“删失值”右边的框内填写“0”，然后点击
“确定”，(根据数据格式，也可以选择“时间删失在”，“失效删失在”
选项)
⑤单击“估计”按钮，弹出“非参数分布分析-估计”对话框(图6.32左图)，
在该对话框中“估计法”选择“Kaplan-Meier”，再选“估计生存概
率”(即可靠度)，“置信水平”和“置信区间”进行相应填写和选择，单
击“确定”
⑥单击“图形”按钮，弹出“非参数分布分析-图形”对话框，在该对话
框中选择“生存图”和“在图中显示置信区间”，再单击“确定”(图
6.32右图)
⑦单击“结果”，弹出“非参数分布分析-结果”对话框，选择“此外，
Kaplan-Meier生存概率或精算表格”，再单击“确定”(图6.33左图)
⑧单击“存储”，弹出“非参数分布分析-存储”对话框，选择前4项，再
单击“确定”(图6.33右图)
习题6
6.1下面是420只某种部件在12天内的失效数据，试画出此部件的可靠
度函数。
组号
失效时间范围
失效数
1
2
3
4
5
6
7
8
9
10
11
12
0 ~ 24
24 ~ 48
48 ~ 72
72 ~ 96
96 ~ 120
120 ~ 144
144 ~ 168
168 ~ 192
192 ~ 216
216 ~ 240
240 ~ 264
264 ~ 288
222
48
32
26
22
15
17
7
13
9
7
2
6.2 对1575台电视机迸行高温老化试验，每隔4小时测试一次，直到
36小时后共失效85台，具体数据统计如下：
测试时间ti
t内失效数
i
4
8
12
16
20
24
28
32
36
39
18
8
9
2
4
2
2
1
试估计t=0,4,8,12,16,20,24,28,32的失效率各是多少，并画出失效率
曲线。
6.3 由5个相互独立的单元组成的一个串联系统，每个单元在t= l000
小时的可靠度皆为0.970，试问在相同的规定时间内此系统的可靠度
是多少?假如用类似的10个单元组成一个串联系统，其系统可靠度
又是多少?
6.4由串联和并联混合组成的系统称为混联系统，试计算下图6.7.1
所示的混联系统的可靠度，其中每个单元的可靠度已在图6.7.1上标
明，它们都是在同一规定时间的可靠度。
阿波罗11号登月
• http://6.cn/watch/1861309.html
• [纪录片] 《阿波罗11号登月全记录》官方
数码修复版阿波罗登月之飞船介绍
• http://v.youku.com/v_show/id_XMTA4Mj
MzNzI0.html
• 珍贵阿波罗11号登月彩色纪录片
• http://v.youku.com/v_show/id_XMTA2ND
k2ODI0.html
• 探索频道节目之阿波罗登月
可靠性——作为衡量产品质量的一个重要指标，
早已不是一个新的概念。长期以来，重视产品信誉
的厂家都在追求其产品具有良好的可靠性，因为只
有可靠性好的产品，才能长期发挥其使用性能而受
到用户的欢迎。不仅如此，有些产品如汽车、轮船
和飞机，如果其关键零部件不可靠，不仅会给用户
带来不便，而且会耽误时间，推迟日程，造成经济
损失，甚至还可能直接危及使用者的生命安全。像
美国“挑战者”号航天飞机、苏联切尔诺贝利核电
站等发生的可靠性事故所引起的严重后果，都足以
说明因产品的可靠性差会引起一系列严重问题，甚
至会危及国家的荣誉和安全。而1957年苏联第一颗
人造卫星升天，1969年美国阿波罗11号宇宙飞船载
人登月等可靠性技术成功的典范，不仅为其国家带
来荣耀，而且说明了高科技的发展要以可靠性技术
为基础，科学技术的发展要求高的可靠性。
图6.7.1 阿波罗11号
阿波罗载人登月工程是美
国国家航空和航天局于20世纪
60年代至70年代初组织实施的
载人登月工程，或称“阿波罗”
计划。它是世界航天史上具有
划时代意义的一项成就。工程
开始于1961年5月，至1972年12
月第6次登月成功结束，历时约
11年，耗资255亿美元。在工程
高峰时期，参加工程的有2万家
企业、200多所大学和80多个科
研机构，总人数超过30万人。
阿波罗计划采用月球轨道交会法，用强大的土
星Ｖ号运载火箭把50吨重的航天器送入月球轨道。
航天器本身装有较小的火箭发动机，当它接近月球
时，能使航天器减速进入绕月轨道。而且，航天器
的一部分——装有火箭发动机的登月舱能脱离航天
器，载着航天员登上月球，并返回绕月轨道与阿波
罗航天器结合。第一次载人阿波罗飞行，由于发生
了悲惨的事故而推迟，因为在一次发射演习时，航
天器突然着火，3名航天员死亡。在几次不载人的地
球轨道飞行之后，于1968年10月11日阿波罗7号载着
3名航天员绕地球飞行了163圈。
阿波罗8号迈出了载人月球探测的第一步，它从绕
地球轨道进入绕月球轨道，在完成绕月飞行后安全返
回地球。阿波罗9号在绕地球轨道上进行了长时间的
飞行，对登月舱进行检验。阿波罗10号则飞入绕月球
轨道，然后登月舱下降到离月面15公里以内，以检验
其性能。1969年7月阿波罗11号在月球着陆，使逐步推
进的阿波罗登月计划达到高潮，N·阿姆斯特朗成为人
类第一次踏上月球的航天员。1970年4月发射的阿波罗
13号，因氧气瓶爆炸发生事故，但仍然安全地回到了
地球。其余的阿波罗飞行对月面进行了广泛的考察，
搜集了大量的月球岩石标本，并把许多仪器安装在月
球上进行科学研究，如太阳风实验和月震测量等。阿
波罗计划的最后一次飞行——阿波罗17号是在1972年
12月进行的。
阿波罗登月成功可以说是可靠性技术成功的典范，
为什么呢?
连接阿波罗系统的指挥和服务单位（command
service module）就有将近2百万个机能部分，好几
里长的电线系统和成千的连接处，我们可以将这些
部分、电线及连接处分成某式样的子系统
（subsystems）。假设每一个子系统的可靠性是已
知的，而且阿波罗整个系统的物理程序又能够被抽
象的变成数学模型，那么我们利用组合机率的理论
即可预测阿波罢系统的可靠性。随后我们将讨论一
些简单的模型，以了解概况。
阿波罗的指挥和服务单位可以被分成某些式样
的子系统，且每个子系统有一个指定的可靠性。事
实上，我们是从实验的数据，利用统计理论，估计
求得这些子系统的可靠性，而不是先定的。因此，
估计阿波罗系统的平均可靠性，根本上即是根据子
系统可靠性的估计值求得的。
图1“阿波罗”舱的简化模型
为了便于叙述如何建立可靠性理论的数学模型，
我们将对阿波罗系统的基本单位略作简单的说明，
如图1所示。假设仅当阿波罗所有的五个成分均能
适当的操作，则阿波罗系统才能成功的工作。也就
是说，假如这个系统中有任何一个成分失败，那么
整个系统也就失败。如此的系统称为系列系统
（series system）。
假如图1的一系列系统能以略微抽象化的简单黑
箱（black box）代替，如图2所示
图2 串联系统的黑箱图示法
而且每个黑箱不是成功的操作，即是失败。那么五个
成分中的任何一个在登月期间失效，则整个登月任务
也将失败。如果可以假设图一中的五个阿波罗成分是
彼此独立作业而且连接成串，则由五个成分的可靠性，
我们可以轻易的求得阿波罗整个系统的可靠性。兹说
明如下：
设五个成分的可靠性分别为RA,RB,RC,RD和RE，则由
机率理论得知，整个系统的可靠性R为：
R=RARBRCRDRE
（公式一）
例如：每一个成分圆满达成任务的可靠性为0.999，那
么阿波罗系统完成登月任务的可靠性即为
R=(0.999)5=0.995。
（三位有效数字）
在计算整个系统的可靠性之前，我们必须严密
的调查各个成分的可靠性，同样的，我们也必须小
心的考虑下列问题：这些成分的特性是否彼此相互
影响？主要引擎操作成功能否预测登月引擎也将有
相同的操作？一个子系统的特性降低是否大大的增
加另一个子系统的负担？假如这些问题（或是类似
的问题）的回答是对的，那么我们就不能假设这些
子系统的操作是彼此互相独立的。不幸的，假如各
成分是彼此相关的（即不是独立的），则计算整个
系统的可靠性将需要另一个庞杂的数学式子，在此
从略。
另一种简单的结构模型为平行结构（parallel
configuration）。如果主要引擎A是由两个较小的
引擎A1和A2所组成的。并且假设在执行任务时，两
个引擎均打开使用，而且A1和A2之中只要有一个操
作成功，主要引擎A即能令人满意的执行任务。也
就是说，唯有主要引擎失败，则两个引擎A1和A2皆
失败。如此的一个平行结构，我们也可利用简单的
黑箱来代表，如图3所示。
图3 并联系统的黑箱图示法
在阿波罗计划中，一个平行结构的实例是用在
第二阶段的农神火箭（注二），它拥有五个平行结
构的J.2型火箭动力，譬如：在阿波罗13号登月时，
由于太空舱内的氧气缸发生爆炸，中心引擎失效，
我们仍然可以继续延长其它引擎的燃烧时间，使太
空舱安全的返回地球。
同样的，如果我们假设并联的两个成分A1和A2
是彼此互相独立作业，那么再度利用机率理论，我
们也可轻易的求得这个系统的可靠性。设A1和A2的
可靠性分别为RA1和RA2，则：
RA=1-(1-RA1)(1-RA2) （公式二）
因为唯若主要引擎A的操作失败，则A1和A2两个较
小引擎的操作同时失败。因此，A引擎的失败率（即
是1-RA）应为两个小引擎A1和A2失败率的乘积，是
(1-RA1)(1-RA2)。例如：A1和A2的可靠性均为0.9800，
则：
RA=1-(1-0.9800)2
=1-(0.0200)2=0.9996（四位有效数字）
事实上，假如图2中主要引擎的可靠性改为0.9996，
则图4的黑箱就足以代表整个系统。
图4 “阿波罗”系统中主机部件混联黑箱图示法
第三种结构是备用并联系统。若A1和A2两个发
动机按照图4的方法连接起来，使A2发动机只在A1
发动机发生故障时才开动，那么发动机组A1和A2
则可以看作是一个并联备用系统。下面，我们举一
个支持平行系统的实例来说明。譬如：不吉利的阿
波罗13号在执行登月任务时，由于指挥和服务单位
的氧气缸破裂，无法供应航天员的氧气，当时航天
员所使用的氧气，实际上是来自登月旅行单位
（lunar excursion module）所支持的。
除了正规平行结构和支持平行结构外，还有
一种额外的单位，称为多余单位（redundant
units）。它们存在的目的在于增加所有系统的可靠
性，例如：一个系统的可靠性只有0.85，我们额外
的增加一个平行结构的单位，那么由公式二，我们
得知这个新系统的可靠Rn变为：
Rn=1-(1-0.85)2=1-(0.15)2=0.98（两位有效数字）。
但是，通常增加多余单位将损耗费用和增加
重量，因此，关于可靠性的设计有很多有趣而且
重要的问题，都是在于重量和成本的双重限制下，
求出一个具有最大可靠性的系统。
假如所有复杂的系统都可以被分解成互相独
立的串联和并联的系统，那么可靠性的计算即变
得相当的简单。可是，有些特殊的情况，像阿波
罗系统，是如此的庞杂，以致于我们必须应用高
速的电子计算器来计算整个系统的可靠性。而且
我们必须储存如此的计算机程序，以便改变设计
时，用以评估新系统可靠性的效果（注三）。
注一：当宇宙飞船的方向偏差，航天员可用反作用控
制推进器来纠正航线，作很小的调整，或者用服务部
推进系统（ service propulsion system ）作较大的航
线变更。
注二：第二阶段的农神火箭用以使太空舱越过地球轨
迹，迈向月球。
注三：阿波罗计划的每一项目都必须用计算机彻底的
检查，而且太空舱从起飞到着水，一路上都需要仰赖
计算机来计算它所应遵循的途径。因此，没有计算机
高速的计算能力，我们根本无法看到登月的壮举。
注四：属性检定的数据，不是「成功」，即是「失
败」；而寿命检定的数据是时间的数值。
注五：(0.90)230=0.000000,(0.99)230=0.09910因此，可
靠性为0.90是不可能发生连续230个单位被检定为成
功的，但是可靠性为0.99时，我们观察连续230个单
位10次，平均就有1次是全部成功的。更详细的理论
可用两项分配或常态分配求得，在此从略。

可靠性 - 南京财经大学统计系

Transcript 可靠性 - 南京财经大学统计系

Directory