
Google实验室发布了一篇论文, 详细描述了在大规模磁盘环境下硬盘发生故障的模式.
论文概括
我们分析并确定了SMART(自我监视功能)的几个参数跟磁盘的故障有很大的关系. 根据这样的关系, 我们得出结论: 基于SMART参数的模型单独来看不能预测个人磁盘的故障. 不过令人惊讶的是, 我们发现温度和活动程度对磁盘故障的影响没有过去报道的那么大.
论文下载
Failure Trends in a Large Disk Drive Population (本地)
论文图片

图2: 按年龄组计算的年故障率(AFR)

图3: 按使用状况计算的年故障率

图4: 平均温度和故障率的曲线图分布

图5: 按平均磁盘温度计算的年故障率

图6: 按磁盘扫描错误计算的年故障率

图7: 按重新分配数计算的年故障率

图9: 按离线重新分配数计算的年故障率

图10: 按试用数计算的年故障率

图14: SMART错误的故障磁盘百分比
相关论文
Disk failures in the real world:
What does an MTTF of 1,000,000 hours mean to you?
参考
Failure Trends in a Large Disk Drive Population
Recent Papers Written by Googlers - Distributed Systems and Parallel Computing
备注
转载请保持文章完整性, 欢迎到blog.zhaoke.com网站与赵珂交流.
Islab

第二人生实时统计




发表回复