传统的存储架构(如NAS或SAN)多年来一直支持各种工作负载,而且还在继续这样做。然而,日益多样化的数据的大量增长,再加上现代应用技术和工作流的复杂性,已经使这些架构的能力达到了极限。
为了满足当今的存储需求,许多IT团队正在基于可组合架构部署存储、抽象化存储和其他物理资源并将其作为服务交付。但是在组织走上这条道路之前,应该了解传统存储与可组合式架构的优缺点。
传统的网络附属存储(NAS)系统
大多数数据中心的存储通常以网络附属存储(NAS)、存储区域网络(SAN)或直连式存储(DAS)的形式实现。每一种形式都有其优点和缺点,在将传统存储与可组合基础设施进行比较时应分别进行评估。就是说,这三种架构具有共同的特征,这些特征在考虑向可组合性转变时有助于理解。
在网络附属存储(NAS)配置中,多个用户和应用程序从局域网(LAN)上的共享存储池访问数据。网络附属存储(NAS)易于部署、维护和访问,并且像存储区域网络(SAN)一样,具有内置的安全性、容错性和管理功能。但是,网络附属存储(NAS)通常比存储区域网络(SAN)价格更低。
网络附属存储(NAS)的挑战之一是存储请求必须与其他网络流量进行竞争,从而产生潜在的争用问题。另一种选择是在自己的专用网络上实施网络附属存储(NAS),但是这种方法可能导致需要更多的维护和更高的成本。即使在专用网络上,太多的并发用户也可能使存储驱动器不堪重负。此外,入门级网络附属存储(NAS)系统的可扩展性有限。尽管高端网络附属存储(NAS)具有更高的可扩展性,但与存储区域网络(SAN)相比还是比较有限的。
传统的存储区域网络(SAN)
寻求更多存储空间的IT团队通常会使用存储区域网络(SAN),这是一个专用的高性能网络,该网络将多个存储系统互连,并将其作为存储资源池呈现出来。存储设备与运行存储管理软件一起控制数据访问的应用程序服务器共享网络。存储区域网络(SAN)具有高可用性和可扩展性,以及故障转移保护和灾难恢复功能。
尽管存储区域网络(SAN)得到广泛使用,但并非没有面临挑战。它们可能难以部署和维护,通常需要采用专门技能。尽管这些因素就足以提高成本,但SAN组件也可能变得昂贵。另外,SAN很少达到性能预期,其部分原因是它们的复杂性。但是,SSD硬盘在提高存储区域网络(SAN)性能方面已经走了很长一段路。
直连式存储(DAS)
网络附属存储(NAS)和存储区域网络(SAN)都依赖于网络连接,即使在最佳情况下,这也会影响性能。因此,某些组织将直连式存储(DAS)用于要求更高的工作负载。直连式存储(DAS)比网络附属存储(NAS)或存储区域网络(SAN)更易于实施和维护,并且它包含的组件数量最少,所有这些因素使直连式存储(DAS)成本更低。直连式存储(DAS)可能缺少高级管理功能,但是Hadoop和Kafka等应用程序自己管理存储,因此管理并不是什么问题。
直连式存储(DAS)面临的更大问题是它不能像网络附属存储(NAS)和存储区域网络(SAN)一样被池化和共享,其可扩展性也有限。其结果是缺乏灵活性、高度孤立的存储环境,常常导致资源配置过度和利用不足。但这种僵化并不是直连式存储(DAS)所独有的。
对于这三种架构,它们的结构都是固定的,很难更改,每种结构都存在于自己的孤岛中。满足现代应用程序不断变化的工作量需求、修改配置或重新配置设备并非易事。为此,需要灵活的并且能够支持自动化和资源编排的存储资源,而这是传统存储技术无法独自完成的。
存储和可组合的基础设施
可组合的基础设施抽象存储和其他物理资源,并将它们作为服务交付,这些服务可以随着应用程序需求的变化而动态组合和重新组合。可组合的基础设施支持在裸机、虚拟机和容器中运行的应用程序。为满足第三方应用程序的自动化程度高的应用程序接口(API),以动态分配池化资源以满足特定的应用程序要求,从而有可能支持高度的自动化和编排。
在可组合的基础设施中,存储资源与其他资源保持分离,并且可以独立于其他资源进行扩展。按需分配存储,然后在不再需要时释放存储,使其可用于其他应用程序。可组合软件可在后台处理这些操作,而无需IT管理员重新配置硬件。此外,可组合的基础设施可以将直连式存储(DAS)、网络附属存储(NAS)或存储区域网络(SAN)系统整合到其环境中,并作为其灵活存储容量池的一部分。
由于可组合基础设施并未针对特定工作负载进行预配置,因此它可以支持各种应用程序,而无需事先了解配置要求。与传统存储相比,这种方法可带来更大的灵活性和资源使用。可组合的基础设施还简化了操作,加快了部署,最大程度地减少了管理开销,并保证了几乎无限的可扩展性,而存储资源可以在需要时分配。
尽管这些听起来不错,但可组合的基础设施也存在挑战。这是一项仍在发展的技术,驱动可组合性的软件仍在日趋成熟。此外,还缺乏行业标准,甚至没有对可组合性的定义。供应商根据自己的规则定义和实现可组合的基础设施系统,这可能导致供应商锁定,并可能导致集成问题。
可组合的基础设施很复杂,可能难以部署和管理,通常需要其他专业知识。对于许多组织而言,可组合架构的分解将需要转变思维,以使业务重新适应新方法。在传统的数据中心中,应用程序是作为离散的操作进行开发、测试和部署的,而资源却是零散的。在现代数据中心中,应用程序生命周期是一项统一的工作,将持续的集成和交付以及自动的资源分配结合在一起,使其非常适合可组合的架构。没有这种转变,IT团队就有创建另一个存储孤岛的风险。
尽管存在这些挑战,但可组合的基础设施仍然可以使各种工作负载受益。例如,人工智能和机器学习通常需要动态资源分配以适应处理操作和波动的数据涌入。DevOps流程(例如持续集成和交付)也可以从可组合的基础设施中受益,尤其是当与基础设施即代码一起使用时。同样,想要使更多业务自动化的IT团队也可以从可组合性中受益。
实际上,任何运行具有不可预测或不断变化的存储需求的应用程序的组织都应考虑可组合的基础设施。这并不是说没有传统存储空间。使用传统方法,运行具有相当稳定的需求且不需要连续重新配置或资源重新分配的工作负载的组织可能会更好。
传统的存储系统并非为当今的现代应用而设计。随着这些应用程序变得更加动态,数据集变得更大、更加多样化,IT团队需要更快地适应它们。
可组合架构可以证明是解决当今存储管理复杂性的一种有效方法。但是,这项技术并不成熟,要在所有商品硬件上实现真正的可组合性,还有很长的路要走。即便如此,采用组合模型的厂商比以往任何时候都多。在考虑采用可组合架构时,IT团队可能会问的最主要问题是,是否准备好采用一种新的方式来考虑基础设施和分配存储资源。