【VMware vSAN】vSAN Data Protection Part 3:模拟故障。
前面文章“vSAN Data Protection Part 1:安装部署。”和“vSAN Data Protection Part 2:配置管理。”了解了 OVA 虚拟机的部署以及 vSAN Data Protection 功能的使用,这篇文章继续了解当 vSAN Data Protection 出现一些故障后会发生什么,在进行运维和监控的时候应该关注和考虑那些事情。
当前,vSAN Data Protection 功能正常情况下,保护组正在调度任务创建 vSAN 虚拟机快照,每 30 分钟一次,最近一次是在13点52分。
现在,我们关闭 VMware Snapshot Service Appliance 设备虚拟机的电源,模拟 VSSA 虚拟机自身故障。
此时,vSAN 集群配置“数据保护”和虚拟机“快照”视图下都出现“no healthy upstream”错误,vSAN Data Protection 功能不可用。
如果正常情况下,下一次自动调度任务创建 vSAN 虚拟机快照的时间应该是14点22分,我在14点24分之后去重新启动 VMware Snapshot Service Appliance 设备虚拟机的电源,看看会有什么情况。
vSAN Data Protection 功能恢复正常,但是不会按照计划任务立即创建 vSAN 虚拟机快照,而是会重新等待 30 分钟后才进行创建。
我们来看看 VSSA 虚拟机正常的情况下,当 vCenter Server 故障后会发生什么,这里进入 VAMI 管理后台直接将 vCenter Server 关机。
vCenter Server 关机后,没法查看 vSAN Data Protection 功能的状态,如果正常情况下,下一次自动调度任务创建 vSAN 虚拟机快照的时间应该是15点25分,我在15点25分之后去重新启动 vCenter Server 的电源,看看会有什么情况。
vSAN Data Protection 功能的状态,vCenter Server 故障期间不会按照计划任务创建 vSAN 虚拟机快照,而是要完全恢复后重新等待 30 分钟后才进行创建。