MTBF
求助编辑百科名片
MTBF,即平均无故障时间,英文全称是“Mean Time Between Failure”。是衡量一个产品(尤
其是电器产品)的可靠性指标。单位为“小时”。它反映了产品的时间质量,是体现产品在规
定时间内保持功能的一种能力。具体来说,是指相邻两次故障之间的平均工作时间,也称为
平均故障间隔。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故
障次数的比值为 MTBF。磁盘阵列产品一般 MTBF不能低于50000小时。
目录
MTBF 是平均故障间隔时间
温度与器件的寿命
1MTBF与电脑的关系温度与电脑的可靠性
1风扇与散热效果
1灰尘对伺服器的影响
展开
编辑本段MTBFMTBFMTBFMTBF 是平均故障间隔时间
随着伺服器的广泛应用,对伺服器的可靠性提出了更高的要求。所谓 “可靠性”,
就是产品在规定条件下和规定时间内完成规定功能的能力;反之,产品或其一部分不
能或将不能完成规定的功能是出故障。概括地说,产品故障少的就是可靠性高,产品
的故障总数与寿命单位总数之比叫“故障率”(Failure rate),常用λ
示。例如正在运
行中的100只硬碟,一年之内出了2次故障,则每个硬碟的故障率为0.02次 /年。当产
品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间(Mean Time
Between Failures),简称 MTBF。即: MTBF=1/λ 笔者最近看到一款可用
于伺服器的 WD Caviar RE2 7200 RPM 硬碟,MTBF 高达 120万小时,保修 5年。
120万小时约为137年,并不是说该种硬碟每只均能工作137年不出故障。由 MTBF=1/λ
可知λ=1/MTBF=1/137年,即该硬碟的平均年故障率约为0.7%,一年内,平均1000
只硬碟有7只会出故障。 上图所示为著名的浴盆曲线,左边斜线部分为早期故障
率,其故障率一般较高且随着时间推移很快下降。曲线中部为使用寿命期,其故障率
一般很低且基本固定。最右部为耗损期,失效率急速升高。电子产品制造商一般通过
测试、老炼、筛选等手段将早期故障尽量剔除,然后提供给客户使用。当使用寿命期
将尽,产品也即将进入故障高发期,需要报废或更新换代了。
编辑本段温度与器件的寿命
明白了 MTBF 和“浴盆”曲线的基本概念,我们对评估产品的使用寿命有了一定的
掌握。在合适工作条件下器件使用寿命期内的故障率很低。广大电子爱好者都知道电
子元器件的寿命,与工作温度是有密切关系的。以电脑主板上常用的也常出故障的电
解电容器为例,其寿命会受到温度的影响。因此,应尽可能使电容器在较低的温度之
下工作,如果电容器的实际工作温度超过了其规格范围,不仅其寿命会缩短,而且电
容器会受到严重的损毁(例如电解液泄漏)。因此,在
电脑主板上电容器的工作
温度时,不仅要考虑机箱内整体环境温度及电容器自身的发热,还要考虑机箱内其他
发热元件的热辐射(特别是 CPU、稳压器、电源供应器等)。 根据测试,通常2.0G
的 CPU 消耗功率达56.7W,生成温度达70℃;而当频率提高至3.0G 时, CPU 温度
往往超过90℃。在这样的高温烘烤下,主板上的电容器寿命会发生什么变化? 为
简化起见,不考虑纹波、频率、ESR 等因素,电容器的估计寿命可用下述公式表示:
其中,L0表示最高工作温度下的寿命,Tmax 表示最高工作温度,Ta表示实际环境温
度。由此可见,如果环境温度每升高10℃,电容器寿命将下降一倍! 由上图右
面的曲线可明显看出,随着电容器工作环境温度的上升,其有效寿命急剧缩短。其中
有效寿命(Useful life)是指该种电容器达到给定故障率的时间。
编辑本段MTBFMTBFMTBFMTBF与电脑的关系
温度与电脑的可靠性
电源供应器对电脑来说,重要性不言而喻。影响电源供应器寿命的因素很多,如
负载大小、振动和周边的环境温度等。其中,环境温度很重要,所以选择合适的风扇,
排放出由电源供应器内部的热量非常关键。电源供应器的 MTBF,在很大程度上是由
其内部的电解电容器 MTBF 值所决定的。因随着温度的上升,电容器的寿命急剧缩短,
所以电源供应器的工作温度如能得到降低,其寿命就会更长一些。 当评价电源
供应器所标称寿命时,电源供应器是否运行在额定的满负载状况是另一重要考虑因
素。如果电源供应器装有合适的散热器而散热风扇风量足够大,在低于满负载的情况
下连续工作,电源供应器就能有更长的寿命。一般电脑电源供应器寿命按照3-5年计
算元件的可能失效周期,MTBF 在80,000-100,000小时之间。 不同的电源供应
器厂家,其产品
、用料也往往差别很大,工作寿命自然不同。在 DIY 1U 伺服器
时 ,优质的电源供应器选择不多,台湾新巨 Zippy 是一个不错的选择。中国内地一些
名牌伺服器例如著名的曙光也采用该品牌电源供应器,在一些 DIY 市场可购到的
P1H-6400P 400W 电源供应器,随着双核心 CPU 推出,400W 电源供应器可能不够
用,推介使用 H1H-6507P 、M1G-6500P 500W。 如上图所示,HG2-6400P 采
用了主动 PFC,虽然增加了成本,但具有更高的效率,能够在90V-260V 的任何电压
环境下稳定工作。该电源供应器大量部采用稳定性和寿命是普通电容器的3倍以上的
日本电容器。在一些劣质的电源供应器产品中,EMI 电路往往是重点的省略对象。从
这款 HG2-6400P 的 EMI 电路上可以看出,用料十分充足,符合电磁兼容
,稳定
的表现当然是情理之中。 除电源供应器外,硬碟的温度也不可小视。现在的硬
碟动不动就7200rpm-15000rpm,想想看硬碟内的马达每天转24小时,平均工作温度
在四、五十度的高热是免不了。笔者曾测量过一台散热不够好的伺服器硬碟,温度超
过40℃。对硬碟来说,如果机壳内部的温度降低了,这将意味着减少主轴马达液态轴
承的轴承润滑剂以及磁碟润滑剂的蒸发,这将大大降低其损坏的机率。据 Seagate
公司公开的某型号硬碟数据,在34℃时的 MTBF 为150,000小时,但在25℃时,会达
到230,000小时。
风扇与散热效果
为降低硬碟温度,可增加散热风扇。市面上是有卖硬碟专用的散热模组,有的则
是一颗风扇再加上一块硬碟大小的铝制散热片,其实没有必要这么复杂。 笔者
采用北京生产千际牌“暴风雪”十风机1U 机箱1U 进行过散热改造,使用 Sanyo1.5万
转4cm 电流0.55A 风量20.83CFM 及新推出9CRA0412J502 1.58万转4x5.6CM 风量
31.8CFM 放在硬碟前、硬碟后增加散热,测量其温度约只有 28℃,已经很接近室温
了。 笔者也将广州五舟 SF5100双至强的准机箱将原装台达牌2700转小风鼓作
CPU 散热更换成三洋 (Sanyo)9BAM12GA2 5800转的小风鼓后,CPU 在占有率100%
的情况下,温度由66℃下降到55℃!该风扇的使用寿命很高,在60℃环境下工作
40,000小时,残存率仍有90%。要知道 Intel 原装 CPU 风扇,都大部份采用 Sanyo
的产品。 如采用小型风鼓(BLOWER),风量增加,散热效果更好。但是,增加
风扇或风鼓一定要考虑振动的问
。要知道风扇较高的转速才能达到一定的风量,但
如采用较劣质的风扇,转速虽高,但寿命短且振动厉害,对硬碟寿命会带来不利影响,
安装硬碟时加吸震软垫、机箱机壳底部的吸震片都有一定效用。 优质的电源供
应器当然要搭配高品质的风扇,如 HG2-6400P 选用的是 NMB 钢珠轴承风扇,比传
统油封轴承风扇寿命高出2倍。这款电源供应器还加入了风扇转速控制线路,可以根
据电源内部的温度调节风扇转速,在延长使用寿命的同时,也更好的控制了风扇噪音
和震动。
灰尘对伺服器的影响
如何保养和维护好伺服器,最大限度的延长其使用寿命,是大家都非常关心的话
题。灰尘对伺服器构成的威胁不容忽视。按笔者的电子产品维修经验,在灰尘比较大
的环境中工作,由于 PCB 吸附灰尘,而灰尘的沉积会影响电子元器件的热量散发,
这将导致元件温度上升,进而出现热稳定性下降甚至产生漏电,严重时导致烧毁。另
外,灰尘也会吸收水分,腐蚀电子线路,造成一些莫名其妙的短路问题。所以灰尘体
积虽小,但对伺服器的危害不可低估。 尽管伺服器机房有相对较好的环境,但
灰尘仍会不断累积。所以,有必要定期进行清理,可使用上图美国生产 CRC 牌防尘
喷剂、也可用有防静电(ESD)功能的小毛刷小心进行清扫,或使用吹风球清洁灰尘,
减少出故障的机率。在清理机箱内部的灰尘时,切记断开电源,小心操作,特别是面
板进风口和电源(排风口)的附近,以及板卡的插接部位灰尘最多。清理电源里的灰
尘最好将电源供应器拆下,用防尘喷剂、吹气球仔细清扫干净后再装回。