云爆发的定义与应用
云爆发和存储
如何在云爆发场景中实现数据存储?
首先,存储在使应用程序可以移入和移出公共云方面发挥着重要作用。将应用程序爆发到公共云的过程通常基于将应用程序和数据一起移动或将数据移动到已经存在的另一个应用程序实例。
例如,目前的大多数应用程序都打包为虚拟机。 Velostrata(被谷歌公司收购)、Zerto和Racemi等供应商都提供将整个虚拟机迁移到云端的功能。
云计算提供商也有自己的解决方案。其中一些工具专注于在一次性过程中移动整个虚拟机。但是,例如Velostrata提供了只是移动活动数据,并以真正动态的方式将虚拟机更新带回内部部署的功能。
此功能突出了此类迁移的主要问题之一,即保持应用程序和数据同步。
在整个网络中移动多个虚拟机(或多组虚拟机)既昂贵又耗时。在将虚拟机移回内部部署时尤其如此。超大规模的云计算提供商对出口的数据收费,对于用户来说,将其应用程序和数据从云端返回内部部署的方法并不可行。
还需要考虑延迟时间。通常,在公共云平台之间移动时,应用程序不可用,这可能是一个问题。延长的中断将影响用户体验,需要尽可能地解决这个问题。
以存储为中心的云爆发
如何将数据移动到公共云?简单地使用公共云作为内部存储的扩展已经存在了一段时间。备份供应商以及主存储解决方案供应商和辅助存储解决方案供应商都提供了将数据作为存档形式推送到公共云的功能。
从控制非活动数据成本的角度来看,这很好,但是活动应用程序?企业需要考虑一些事项,以使主动存储云爆发变得切实可行。
第一个问题是数据视图的一致性。这意味着需要管理与数据关联的元数据。对于块存储来说,需要跟踪和访问任何单个块的最新版本。对于文件和对象存储,这意味着了解文件或对象的最新版本。
元数据一致性是一项挑战,因为所有数据更新都会更改元数据,无论是新文件的信息还是现有文件的更新。这些更改必须尽可能快速高效地分布在数据的所有端点上。这导致了元数据管理的另一个问题——锁定。
为了确保两个位置不会试图同时更新相同的内容,一个或其他位置将获得对数据的锁定,其他位置必须等待。
这个锁定过程可能会带来显著的问题(例如不可接受的延迟)。另一种解决方案是不会导致锁定(将一个副本设为只读),或者像对象存储中看到的那样,采用“最后写入者获胜”的过程,其中最后一次更新有效地反映为数据的当前副本。
“最后写入者获胜”对于像对象存储这样的存储平台来说是一个可以接受的解决方案,但对于基于块的存储解决方案来说是完全不切实际的,其中数据一致性是通过确保每个读写都按时间顺序准确反映来确定的。
数据保护
构建分布式存储和应用程序架构的最后一个考虑因素是了解如何从故障中恢复。
如果内部部署服务器出现故障会怎样?如果云计算提供商的服务中断会发生什么?当数据位于多个位置时,如果其中一个平台出现故障,则很难知道最后一致的数据副本的存在位置。为了避免数据丢失,人们需要很好地理解故障场景。
云爆发存储解决方案
供应商如何应对存储云爆发?主要的云计算提供商在早期阶段就确定了这一要求。AWS公司具有存储网关产品,该产品可以在内部部署数据中心中作为虚拟机部署,并作为iSCSI LUN公开提供给本地应用程序。将数据存档回AWS云平台,可以在那里远程访问。AWS存储网关现在可以满足文件和虚拟磁带格式。
几年前,微软公司收购了StorSimple,为AWS 存储网关提供类似的iSCSI功能。最近,该公司收购了Avere Systems的vFXT技术,该技术允许将内部部署文件系统扩展到公共云。
包括NetApp(Data Fabric),Scality(Zenko),Elastifile(CloudTier)和Cloudian(HyperFile / HyperStore)在内的存储供应商都能够跨越内部部署和公共云来按需移动数据。整个行业中还有更多可用的类似解决方案的例子。
人们的期待
在未来,人们将看到应用程序被重写,使它们分布在多个公共云和内部部署位置。在这种情况下,云爆发将是其设计的固有特征。
与此同时,存储供应商正在使人们接近一个更加实时的分布式数据生态系统,尽管有的企业还在采用专有解决方案。
图片新闻
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论