真没想到!家用NAS的raid5竟然这么不安全?

真没想到!家用NAS的raid5竟然这么不安全?

文章图片

真没想到!家用NAS的raid5竟然这么不安全?

文章图片


兄弟们 , 3 月 8 日晚 7 点 , 锁定淘宝synology群晖昊天专卖店直播间!
届时我将与大家畅聊NAS:
1、权限混乱、数据丢失、跨平台协作困难…… 公司 NAS 选不对 , 分分钟让你怀疑人生!NAS 型号全面分析 , 根据公司规模和业务需求 , 选出最适合的 NAS 。
2、NAS 搭建全攻略 , 让你轻松搞定数据存储和管理!从硬件选购到系统安装 , 从 Raid 配置到域名设置 , 手把手教你如何在工作室搭建 NAS 。
直播间还有群晖定制礼品等你抱回家 , 这场直播盛宴 , 绝对不容错过 , 咱们不见不散!
在 NAS 领域的新手群体中 , 大多会选择搭建 RAID 5 阵列 , 普遍觉得这是一套相当平衡的方案 。 毕竟它既能收获与 RAID 0 相近的数据读取速度 , 又能享有类似 RAID 1 那般凭借 1 块冗余盘来保障数据安全的特性 , 如此组建 RAID , 可谓一举两得 , 自然备受青睐 。

实际上 , RAID 5 的运作机制是将数据以块为单位分散存储至各个硬盘 。 它并非对数据做直接备份 , 而是把数据以及对应的奇偶校验信息分别存储于 RAID 5 组成的多块磁盘上 , 且奇偶校验信息与对应数据分布在不同磁盘 。 当 RAID 5 中某一磁盘的数据出现损坏时 , 便可依靠剩余的数据和对应的奇偶校验信息来恢复受损数据 。

这样子一听 , 感觉RAID 5也是十分靠谱的 , 只要不同时坏掉2块及以上的硬盘 , 那么我的数据就没事了 。 而且相比较于其他方案来说 , 这个方案存储成本较低 , 性能又很不错 , 所以被大众所普遍接受也是正常的事 , 但是它是否真的能保障数据安全呢?

讲到这里我要先提一个概念 , 叫做URE (Unrecoverable Read Error rate) “不可恢复性读取错误率” 。 现在有的厂商也叫做Non-recoverable Errors per bits read或者Nonrecoverable Read Error rate 。
一般来说 , SATA硬盘具有 1x10^-14 次方的不可恢复性读取错误率 , 意思是说每100000000000000 Bit(11.3687 TB) , 就会有1个Bit是硬盘用尽了所有的方法也读不出来的 , 这个Bit 是这块硬盘的黑洞 。
我们来看一下市场上各个NAS硬盘的不可恢复性读取错误率 , 这个数据可以在各品牌官网上查询 。
西部数据NAS红盘Plus的URE为小于1in10^14 。
希捷IRONWOLF酷狼系列的URE根据硬盘容量不同也有不同 , 其中6~14 TB为最大1 per 10E15 , 6TB以下的为最大1 per 10E14 。
希捷还有一个酷狼Pro系列 , 该系列的URE则全部为最大1 per 10E15 。
【真没想到!家用NAS的raid5竟然这么不安全?】西数红盘说的是小于1 in 10^14, 希捷酷狼说的是最大是1 in 10^15 , 厂商都喜欢玩文字游戏 , 咱们不去咬文嚼字 , 直接按照1 in 10^14来计算概率 , 那么就是一百万亿分之一 , 咱们应该很多人会小看这个概率 。
实则不然 。
假设我们用4块4 TB的硬盘组建RAID 5阵列 , 突然抽掉一块磁盘 , 那么剩下的3块4 TB硬盘会从头到脚全部读一遍来重建冗余信息 。
3 × 4 TB =12 TB
那么这三块硬盘一共读取的这12 TB的容量里面碰到一个URE的概率是多少呢?
1—(1—1in10^14)^ (12 × 8 × 1024× 1024× 1024× 1024) ≈0.652
通过计算得到概率为65.2% , 这个概率真的不算小了 。
而且这个这个错误并不是硬盘的坏道导致的 , 所以硬盘SMART根本无法感知出来 , 而且一般超过12TB的RAID 5阵列重建机制会强制对全盘数据进行CRC校验 , 校验的结果会因为这个URE黑洞的出现导致校验出错 , RAID 5所以也必然重建失败 。
但是在实际应用中 , 重建失败的概率并不如以上所讲的那么低 , 那是为什么呢?
以群晖DS1522+为例:
1、打开存储池可以看到一个功能 , 计划数据清理 , 通过定期执行数据清理可确保数据一致性 , 并降低在发生硬盘故障时数据丢失的风险 。

2、目前大家很多人用的盘都是企业盘以及专业NAS盘 , 本身带有数据纠错服务 。
3、最后是NAS所采用的文件系统会对该错误进行纠错修复 , 并不会造成数据丢失 。 群晖DS1522+就提供了2种文件系统供大家使用 , 强烈建议大家使用btrfs文件系统 , 因为它支持共享文件夹快照和复制、共享文件夹空间配额、高级数据完整性保护等高级功能 , 这些功能也能有效避免因为URE黑洞的出现导致RAID5重建校验出错 。

    推荐阅读