|
一个 SCSI 硬盘的平均故障间隔时间〈MTBF, Mean Time Between Failure〉,都在数万小时以上,在正常使用情况下,要坏掉一个硬盘已经很不容易了;在同一系统内,两个磁盘驱动器同时坏掉的机率,更是微乎其微。但是,如果把磁盘驱动器放在布满杀手的环境内,就另当别论了。
构建一个磁盘阵列储存系统,可靠度远比速度来的重要。因此,不但要选一个高性能的阵列控制器,更要慎重地挑一个高可靠度的磁盘阵列柜。因为,宝贵的数据不是存在数组控制器里,而是存放在磁盘驱动器里;而磁盘驱动器又是放在磁盘阵列柜内。所以,要仔细挑选一个可靠的磁盘阵列柜,来当磁盘驱动器的神盾,千万不要挑一个磁盘驱动器杀手!
磁盘阵列柜的设计挑战
由于磁盘驱动器的技术以及传输接口的技术不断的发展,磁盘阵列系统的设计随时都面临新的挑战,以便符合与日俱增的要求。一个优质的磁盘阵列柜,必须在设计阶段,就要考虑到其规格必须符合更大容量、更高转速磁盘驱动器的需求,提供:
稳定、高容量、容错的电源供应系统
可靠、高性能、容错的冷却系统
能够克服震动的机械结构
支持SCA2 热抽换接头之被动背板
一体成型、无主动组件之磁盘载盒
数组柜环境监控与警示功能
直接热抽换且方便的维护操作功能
最佳的空间利用
以下我们就针对这些规格和功能,提供一些建议。
稳定、高容量、容错的电源供应系统
如果各位仔细看看磁盘驱动器的规格书,您会发现磁盘驱动器马达启动时,需要很大的启动电流〈约2A〉,约为平常读写时〈约0.66A〉的 3 倍;磁盘驱动器在 SEEK 时,需要很大的瞬间电流〈约2.1A〉,约为读写时〈约0.66A〉之 3 倍。因此,电源供应系统必须能提供足够、稳定之瞬间电流,否则会造成磁盘驱动器无法启动,甚至造成数据写入错误〈此为导致 RAID 磁盘驱动器被 RAID 控制器判定为 Down,但磁盘驱动器送回原厂测试却无故障之原因〉。当磁盘驱动器转速越来越快,SEEK 速度也越来越快时,电源供应器必须提供足够的容量,以因应将来扩充的需求。
具备容错,热抽换、负载分享之双电源供应器,是不可或缺的,更重要的是,如果电源供应器发生故障,要能不必下螺丝就能热抽换电源供应〈使用螺丝起子解螺丝会造成震动及摇摆,会损害工作中之磁盘驱动器〉。
有了双电源供应器,更要具备两组电源输入,一个接到市电,一个接到 UPS。如此,无论突然断电,或 UPS 故障,都不会造成 RAID 当机。
好的电源供应系统,还须具备交流电压与频率自动选择及调整,以适用不同电压及频率,更重要的是,要能克服电压及频率不稳之状况。在用电尖峰时段,市电电压可能降到100伏特以下,而在非用电尖峰时段,市电电压可能升到120伏特以上,因此电源供应系统必须能够容忍这些电压变化,提供磁盘驱动器稳定的电压和电流,否则可能造成磁盘驱动器故障,甚至数据写入错误。磁盘阵列柜的电源供应系统,最好能够提供从85到260伏特无段自动调整,如此,无论插到哪种插座,市电品质如何变化,都不会影响磁盘阵列的功能。
可靠、高性能、容错的冷却系统
在许多案例中,我们发现冷却系统设计不完善的磁盘阵列柜,只能装设7200转的磁盘驱动器,若使用10,000 转的磁盘驱动器,系统就会过热。现在,Seagate 已经推出15,0000转的磁盘驱动器了,如何挑选一个具备可靠、高性能、容错之冷却系统的磁盘阵列柜,就更显得重要了。
一般磁盘阵列柜之设计,在每个磁盘驱动器载具上加装小风扇,整个系统再装数个大风扇,用边吸边吹的方式散热,不但散热效果不好,而且是产生磁盘驱动器故障的潜在因素:它带来的危害有以下这些:
产生大量气流将粉尘吹入系统,污染磁盘驱动器及风扇本身造成故障。
采用一般PC用小风扇,且数量多〈转动机械零件越多,故障机率越高〉,系统可靠度因而巨幅降低?/li>
一旦有一个小风扇故障,相关磁盘驱动器便无法获得足够散热而故障。
一个优质磁盘阵列柜之冷却系统的设计,必须完全符合热力学理论之全方位冷却:热传导、热对流及热辐射之三相散热方式,才能更有效率、可靠度更高: |
|
【收藏】【打印】【进入论坛】 |
|
|
|
|
|
|
|