服务中断和数据丢失是企业中业务连续性最大的两个威胁。硬件故障,功率丢失,软件错误,人为错误和黑客都为组织面临其运营,收入和生产力所面临的威胁做出了贡献。
实际上,正常运行学院的2022年停电分析报告发现过去三年中,所有组织中有20%面临“严重”中断(涉及财务损失,受到其声誉甚至丧生的损失)。更重要的是,所有失败的60%(不仅是严重的失败)使该组织损失了100,000美元以上。而且这两个数字都在上升,预计上升时间可以预测,在可预见的将来,每年至少有20次严重的,引人注目的中断。
“总体停电率的不足不足是最新投资数字基础设施的巨大投资以及运营商在过渡到混合,分布式体系结构时面临的所有相关复杂性的结果,”正常运行时间的执行董事安迪·劳伦斯(Andy Lawrence)说。研究所。
“随着时间的流逝,技术和运营实践都将改善,但目前,停电仍然是客户,投资者和监管机构的首要关注点。”
快速有效灾难恢复的经过深思熟虑的计划是需要持续的时间数据保护和正常运行时间在任何IT环境中。
与大多数其他事情一样,与本地数据中心相比,云在灾难恢复(DR)中具有可争议的优势 - 在成本和复杂性上都具有可争议的优势。诸如SaaS之类的常见云技术内置了备份和DR选项。对于本地数据中心(和旧版环境),云提供了可以按比例付费的SaaS或IaaS DR Solutions,可以根据自己的独特需求进行缩放和自定义这生意。
基于云的灾难恢复的情况
Cloud DR是工具,方法和服务的组合或灾难。在大多数情况下,Cloud DR解决方案是负担得起的,可扩展的,提供的服务为服务和管理简单,可以快速部署。
因此,毫不奇怪的是,全球市场灾难恢复作为服务(DRAA)据据,预计到2027年,目前的88亿美元将增长到235亿美元,复合年增长率超过21%市场和市场的研究。
“云改变了灾难恢复的经济学。几年前,只有最大的组织才能完全实施DR,因为即使是通过第三方提供商,重复基础架构和系统非常昂贵,”菲尔·古德温说,IDC的研究总监。“钟摆肯定已经转向云和德拉斯的灾难恢复。”
来源:M247
云的按需模型产生的TCO节省可能是基于云的DR的最大优势。该组织不需要购买或维护硬件,甚至不需要内部专家来灾难。这与设置常规备份和订阅费一样简单。
福特威(Fordway)首席执行官兼创始人理查德·布兰福德(Richard Blanford)说:“ Cloud对DR的内部自我保护的主要优势之一就是使用付费。”“与云与本地的所有事物一样,这是固定成本与云托管DR Services的经常性成本之间的决定。”
云博士的好处传统博士
影响DR(以及逻辑扩展,备份)函数的决定的主要优点是什么?
现收现付:
Cloud DR Services只需每月一次的重复费用,用于存储和备份中使用的资源,而测试和实际恢复或恢复可以以每次使用费用。这不仅节省了大量的资本支出设置,并管理DR的现场设施防止供应商锁定由托管提供商在很大程度上。
云提供商没有余地迫使组织达成长期服务协议,但他们经常为同一协议提供折扣,将球留在客户的法庭上。大多数组织都有静态的DR需求,该模型更适合它们。
无复杂性的冗余:
传统上,企业设置了辅助数据中心场外,以存储数据和应用程序的冗余副本,生产工作负载失败了。这样的设置需要专用的设施来容纳硬件和维护人员。所有设备均以与生产环境相同的容量运行。最后,通常需要大量的网络基础架构,VPN或高带宽互联网,以使员工能够远程连接到辅助数据中心。
使用Cloud DR,公司无需建立任何物理基础架构。他们可以访问其数据以及存储,平台和基础架构资源,以使操作顺利进行 - 同样在几分钟之内使用连接到Internet的设备。很多时候,已经连接到云环境的远程最终用户将无缝切换到云DR基础架构正确的Draas解决方案。主要提供商倾向于提供高级软件定义的网络和边缘服务服务,可提供快速,一致的性能。它们还确保24*7的维护和升级基础设施。
从本质上讲,云DR还提供了次要数据中心以外的其他物理冗余层。数据可以在多个存在点(POP)或位于多个地理位置的存储设备上进行备份或镜像。这消除了DR设置中的“单点失败” - 即使云提供商的数据中心之一失败,客户端的数据仍可始终可用。
可伸缩性:
可伸缩性是云的固有强度。所有存储,计算和网络资源,应用程序和VM都可以根据组织的需求或策略更改在几分钟内上下扩展。在增长过程中,公司绝不需要购买其他硬件或扩展其设施,以确保运营的连续性。
尽管Cloud Dr显然比其传统数据中心对应物具有重大好处,但在安全性和合规要求方面,部署也存在很大的差距。最多公共云安全问题也适用于Draas。
劳伦斯说:“尽管有改善的技术以及该行业对弹性和预防停机时间的强劲投资,但数字基础设施运营商仍在努力满足客户期望和服务水平协议需求的高标准。”
这加剧了对深度云DR策略的需求。
创建云灾难恢复计划
构建全面的云DR计划遵循与现场DR计划相同的步骤和基本策略。差异仅在于执行中使用的云技术(例如DRAA)。
Smart CIO和Admins坚持预防,准备,响应,恢复(PPRR)灾难恢复计划。很快,这就是每个的含义:
- 预防 - 主动发现并消除可能导致灾难的所有可能漏洞,风险和威胁。
- 准备 - 预期并期待灾难;做需要做准备的活动。
- 响应 - 创建一个行动线,以规定灾难袭击以减轻影响时该怎么办。
- 恢复 - 回收和收回数据和资源,同时最早将操作提高到最佳水平。
建立万无一失的云DR计划的基本步骤包括:
1.了解基础设施
不仅要考虑云,而且要考虑组织IT基础架构的非云组成部分。硬件和软件资产是什么?哪些工作负载至关重要,哪些工作是非关键的?哪些数据存储在哪里?谁可以访问哪些数据和文件?一切值多少钱?
这些问题的答案以及对IT和数字资产的所有审核也将有助于了解失败或灾难时这些资产的风险。是否有机会收集个人身份信息(PII)?哪些数据弱加密?有火或洪水风险吗?
2.进行业务影响分析
在这里,IT和物理基础架构的建筑师和管理员都聚集在一起,对环境和工作流程进行详细的审查,识别和评估潜在的风险以及组织对停机时间的容忍度。
每个公司对停机时间的定义都不同。进行业务影响分析(BIA)将告诉组织在中断开始影响业务连续性之前,它可以维持多少损失(财务,运营和其他)。
在此过程中计算了两个关键的DR指标:
- 恢复时间目标(RTO) - 在业务面临巨大损失之前,IT资源或基础设施可能无法访问的最长持续时间
- 恢复点目标(RPO) - 每个数据集中数据集的数据集和最大阈值,这些数据集可能会在当时丢失或折衷的,而不会造成企业造成重大损失
来源:企业存储论坛
这样,IT领导者还可以更好地了解每个工作量和应用的关键任务,从而帮助他们更多地关注灾难袭击时的重要领域。BIA是对停机时间本身以及组织采取的PPRR措施的成本效益(或相当说是低成本的)分析。
3.选择正确的云供应商
Draas服务有三种口味:
- 自助服务:客户计划并购买备份和恢复服务的正确组合,配置,维护和测试它们,并在需要时调用恢复措施。这适合具有熟练人员并经验运行DR程序的组织。
- 协助:可以聘请Draas供应商或顾问来帮助计划和为组织建立解决方案。备份和还原(在一定程度上)仍在内部进行管理,但在特殊情况下可以雇用其他定制支持。
- 托管:DR操作已完全外包给托管服务提供商(MSP)谁创建和实施了DR策略,选择云供应商和平台,并根据SLA中定义的RTO,RPO和其他关键指标负责恢复。
但是,为DR选择合适的云供应商所涉及的不仅仅是选择实施方式。他们提供的恢复,可伸缩性,可靠性和安全性的速度和程度至关重要。主要的云供应商通过满足解决方案要求所需的复杂性和资源来定价其解决方案。例如,AWS有四类DR解决方案:
来源:AWS
安全性,监管和合规性问题可能会阻止许多企业将DR纳入公共云中。控制组织数据至关重要。话虽如此,现在有更多的提供商支持机密数据存储,并提供了更多的地理位置选择。
该组织的最大风险是云供应商倒闭(或接管)或合法阻止在感兴趣的地区运营。
4.验证和测试
测试DR计划是否实际工作是影响准备性的最关键因素。一些要问的关键问题是:
- 可以从DR Cloud到生产环境中安装所有应用程序和平台吗?所有软件是否已获得许可?
- 可以恢复关键数据并在RTO和RPO阈值中恢复功能吗?
- 恢复的环境是否符合与生产环境完全相同的安全性和合规性控制?
定期测试运行将有助于确定DR策略中的差距,并计划采取纠正措施。在可能的情况下,应该有多个始终运行的恢复途径。
保护业务
古德温(Goodwin)预测,满足应用程序以及以基础架构为中心的DR的高可用性云服务将很快接管。如果正确实施,这可能会导致其临近恢复。
Cloud DR为CTO和CIO提供了强大的自定义选项。但是,解决方案的性质对于不同的业务可能会大不相同。最终,组织最了解其需要保护的数据以及在多大程度上。