当我和正在研究在服务器端固态硬盘使用的用户与厂商交谈时,我发现许多人认为服务器固态硬盘必须是那种由比如Fusion-IO, Micron, Virident和LSI这样的厂商制造的超高性能的SLC PCIe闪存卡。虽然人们非常清楚地知道售出的大多数固态硬盘是2.5英寸尺寸的设备,带有SAS或SATA接口,他们似乎认为这些设备只适用于笔记本电脑和台式机爱好者的。
当然,市场上大多数的SATA固态硬盘达不到严酷的数据中心应用,但是在Akbar and Jeff's Computer Hut卖的这种低价的固态硬盘与不计成本只求快的家伙生产的PCIe之间还有很多级别。大多数人都害怕他们要在磁盘阵列或服务器中安放固态硬盘,而且在某些时候它们会耗尽耐力并弄丢他们的全部数据。
我认为一部分问题是我们在数据中心的设备实际上已经坏了好长时间了。如今的密封的硬盘在任何可以预见的方式下都不会用坏--它们只会偶然的出错,大多数存储系统把硬盘视为二元设备,要么工作正常,要么完全不能用。因此当一个驱动器有一头前置放大器故障,它连接的RAID控制器会认为驱动器已经损坏并停止使用。
固态硬盘写入损耗不是不可预见的故障,但它是一个相对好理解的过程,固态硬盘里的闪存已经被编程过并擦写了足够多次,由这个闪存的错误阵列开始超出闪存控制器的能力来改正这个错误。这种损耗不会一下发生在整个固态硬盘上,而是一个个地闪存页,只有很少能维持正常运转的闪存了。最终完全没有空闲的闪存,固态硬盘就不能再写入了。
多数闪存控制器很注意记录它们覆盖闪存每个页的频率,并可以通过智能诊断系统扩展报告给存储系统多少写寿命已经被消耗。如果我能在闪存损耗将要出现问题的几周或几个月前就已经知道,那么在它达到寿命的80%或90%的时候,更换它就是一件很容易的事情。
RAID控制器可以发送一个信息,SSD 14已经达到了其寿命阈值,确定一个新的或空闲的固态硬盘,并且为新的存储器重建RAID.如果固态硬盘作为读缓存使用,它不会包含有意义的数据,那这种更换就会更容易。
因为MLC固态硬盘(写寿命仅为5000个程序擦写周期)通常成本是eMLC或SLC固态硬盘的十分之一,把MLC固态硬盘当成一次性设备对于数据中心来说就行得通了。虽然我们也许不能预测MLC固态硬盘是否能持续18个月或5年之久,但买三个MLC固态硬盘并随需要时更换仍然比买一个实质上更贵的SLC固态硬盘便宜。
当然,这不只是人们为数据中心购买设备的方式--我们购买设备基于对未来峰值需要的推测,乘以我们觉得也许必要的因子来防止储存库用光。就我个人而言,我喜欢乘上圆周率。如果一个项目需要10TB的存储,我们对该项目要确保的预算包括30TB的存储,以便我们在将来不会陷入短缺。
当然,对数据中心引入一次性设备的概念可能给人带来更多工作来替换一个快挂了的服务器固态硬盘。在我们将来有了神奇的非易失性存储器之前,这也许是在没有巨大资本支出下获得性能的一种方式。
当然,有些人可能会关心人们会从你废弃的固态硬盘上恢复敏感的公司数据的问题。虽然这的确是个担忧,但它很容易就能解决,只要把你不用的固态硬盘放进一个Blendtec搅拌机里运行就成了。如果它能把一个iPad碾成灰,那它同样可以对付Micron P400 RealSSD。
摘自:硅谷动力