在现代世界中,任何企业都可能不时遭受数据损坏和关键任务运营中断的困扰。然而,即使是短暂的服务中断也会损害客户的信任,并最终导致重大损失。企业,尤其是在虚拟机上运行服务的企业,必须创建虚拟机灾难恢复(DR)计划,以确保高可用性和业务连续性。我们在这里讨论故障转移和故障恢复在灾难恢复过程中的作用,并讨论了如何使用这些策略来保护业务。
虚拟机灾难恢复
是在灾难发生后将业务基础架构恢复到正常状态的过程。灾难可能意味着任何使组织的运营面临风险的事件,包括自然灾害和人为灾害。虚拟机容灾的本质是恢复组织的虚拟化环境。任何灾难恢复流程的最终目标都是几乎立即恢复业务运营并保护最关键的数据,以确保业务连续性。
灾难恢复措施分为三种类型。
灾难场景几乎总是出乎意料地发生。在灾难恢复事件中,在造成任何重大损害之前尽快恢复企业的虚拟化基础架构至关重要。故障转移和故障回复,可以帮助确保业务继续正常运行,即使生产站点受到灾难影响也是如此。
什么是故障恢复?
作为灾难恢复一部分的故障转移和故障回复过程
在DR事件期间,将启动故障转移和故障回复操作。该过程执行如下:
确保合规:
检查许可:查看软件文档并确定应用程序堆栈中是否存在任何许可限制。如果是这样,必须提前解决任何问题并确保满足所有要求。
定义灾难恢复计划的范围:VMDR计划的范围确定应保护哪些系统并确定预期结果以及任何可能的限制。确保虚拟环境具有足够的技术能力来涵盖计划的所有方面。
决定谁负责故障转移和故障恢复:管理层应指定恢复团队的成员,并为每个团队成员分配具体的职责。确定谁负责监视故障转移和故障回复操作,以避免在重要的实际恢复场景中出现混乱。
对IT员工进行故障转移和故障回复操作培训:继上一点之后,请确保IT员工具备执行故障转移和故障回复操作所需的知识和资格。负责的员工应做好充分准备,以防出现意外情况;他们必须对运营有深入的了解,以便能够相应地适应并处理出现的任何问题。
查看服务级别协议(SLA):服务级别协议是服务提供商与其客户之间的合同,确定提供商应满足的要求和服务标准。因此,请确保SLA是最新的,并且它们的适用性扩展到灾难恢复环境。
定义
故障转移操作是大多数SR工作流程不可或缺的一部分。仅当您之前创建了要保护的源虚拟机的副本时,才能执行涉及故障转移的站点恢复;当灾难发生时,这些被用作故障转移的目标。工作负载从受影响生产站点的源虚拟机传输到灾难恢复站点的虚拟机副本。
计划故障转移
当希望在DR故障转移后恢复生产环境时,会执行生产模式下的故障回复。在生产模式下,只能按需执行站点恢复作业。生产模式下的故障恢复基本上遵循与测试模式下的故障恢复相同的步骤。但是,从虚拟机副本到源虚拟机的复制会执行两次,以确保过程中数据零丢失。复制操作完成后,原始源虚拟机(位于生产站点)将打开电源,而灾难恢复站点的虚拟机副本将关闭。