对象存储是管理大量非结构化数据的最佳选择吗?

根据调研机构IDC公司预测,到2025年,80%的数据将是非结构化的数据 。需要使用正确的存储架构来管理和保护大型数据集比以往任何时候都更为重要 。
如今,由于流媒体应用、物联网部署以及高分辨率视频和图像的兴起,各种规模的组织都在产生大量非结构化数据 。根据调研机构IDC公司预测,到2025年,80%的数据将是非结构化的数据 。需要使用正确的存储架构来管理和保护大型数据集比以往任何时候都更为重要 。
对象存储正迅速取代存储区域网络(SAN)和网络连接存储(NAS),因为它们的创新特性使企业能够轻松地管理庞大的数据集 。
以下列出对象存储提供的五个主要优点:
(1)其可扩展性并不复杂
鉴于数据量的快速增长,存储容量是大多数生成和使用大量非结构化数据的组织面临的首要挑战,这并不奇怪 。传统的存储系统是按容量上限设计的 。为了适应容量增长,组织必须购买更多的存储基础设施,并将其堆叠在现有基础设施之上 。这种方法在非结构化数据线性增长的情况下有效,但对于处理当今出现的指数级数据增长来说,它既繁琐又低效 。
对象存储消除了这种可扩展性限制 。该架构将所有数据作为对象存储在平面地址空间中,而要扩展部署,企业只需将节点添加到该平面地址空间即可 。通过采用横向扩展方法而不是传统的纵向扩展方法,对象存储可以在不中断的情况下达到EB级容量 。
(2)可以遍布全球的单个存储池
随着物联网、遥感技术以及低成本4K摄像头的出现,实时创建连续的非结构化数据流无处不在 。除了可扩展性的挑战之外,这种模式的转变对存储网络技术提出了新的要求 。对象存储通过分布式系统来解决这个问题,在这个系统中,节点可以部署在任何需要的地方 。这样就可以在收集数据的地方执行分析,而不必通过网络发送所有原始的非结构化数据进行处理 。
(3)无缝集成云计算
现在大多数组织都计划同时使用公共云和内部部署存储 。因此,分析人士预测,这两种存储模式都将继续快速增长 。对象存储通过其对S3 API(内部部署和公共云中对象存储的事实上的标准协议)的支持来使用云计算语言 。
由于对象存储支持S3存储桶并结合了数据管理功能以简化数据放置,因此公共云和内部部署存储成为单个全局命名空间的两个部分 。这意味着对象存储使集成公共云和内部部署环境变得更加简单,因此组织可以轻松地在两者之间移动数据,并且始终可以选择将内部部署的存储扩展到云平台 。
(4)强大的元数据功能
元数据是关于数据的数据 。它可以描述任何内容:何时创建数据,谁创建数据,在何处创建数据,以及该数据的内容和所需的详细信息 。元数据使搜索数据变得更加容易,因此组织可以通过大数据分析和开发人工智能/机器学习模型等工作,从数据中获得更多价值 。
对象存储具有内置的丰富的元数据标记功能,这与元数据非常有限的网络附属存储(NAS)或没有元数据的存储区域网络(SAN)不同 。此外,对象存储提供了完全可自定义的元数据,并且可以容纳无限量的元数据 。例如,X光片可以包含识别患者姓名、年龄、损伤细节,以及对X射线检查身体的哪个区域的元数据,从而可以更轻松地获得特定的X射线数据 。
(5)节省大量成本
传统的单位容量存储的购置成本往往会随着规模的增加而增长 。组织实际上要支付更多的费用,而不是获得批量折扣 。但是对象存储系统的成本随着规模扩大变得越来越低 。原因之一是对象存储是一种点对点架构,并随着组织需求的成长而保持一致 。每个节点都是一个控制器,因此组织不必添加(或管理)单独的控制器 。唯一随着增长而变化的是,添加节点后,数据保护变得更加高效,从而降低了成本 。

推荐阅读