云服务器故障应急预案 一、目的 为了确保云服务器(以下简称云平台)使用过程中遇到突发事件后能正确、有序、高效地进行应急处理,保障工作的正常运转,结合实际,特制定本预案。 二、适用范围 本预案适用于云平台中可能出现的各类突发事件。 三、预案流程 云平台服务故障预防措施包括分析风险,建立检测体系,准备应急处理措施,控制影响扩大。 3.1 上报 各部门在云平台使用过程中遇到突发问题导致系统无法正常运转时,报技术部系统对接人确认,情况属实立即报知运维工程师和数据库管理员。 3.2 了解和分析 根据实际情况,技术部安排应急值班(附表 1),确保到岗到人,联络畅通,技术人员即时开展软件的检修工作,对具体情况进行了解并进行初步判断、处理,并将初步情况上报运维工程师知晓。 3.3 处理方法 3.3.1 如突发问题为操作系统引起 首先由技术人员对突发问题进行分析,确定引起问题的具体原因,如操作系统已无法启动,则由技术人员将具体情况通报运维工程师,进行系统备份恢复,如操作系统可启动,则由技术小组根据实际情况进行妥善快速处理。 3.3.2 如突发问题为软件引起 首先由技术人员收集系统日志,对突发问题进行分析,确定引起问题的具体原因,通过讨论确定初步解决方案,并对突发问题进行初步解决,如仍无法解决,则由技术人员备份数据库后,重装云平台解决。 3.3.3 如突发问题为网络引起 技术人员先将问题反馈给数据中心运维人员,协调网络管理员进行初步检查后确定问题原因,并在最短时间内给予解决。在事件处理过程中,技术人员要随时将突发问题处理情况上报数据中心运维人员。 3.3.4 如突发问题为数据库引起 技术人员先将问题反馈给数据库管理员和服务器运维人员,确定问题。数据库软件本身问题,可切换至实时备份数据库。也可以采用新建立数据库,恢复备份的数据库文件,如果原云服务器都无法恢复,可以采用其他云服务器进行恢复。 3.3.5 特殊情况处理 准备好阿里云平台的帐号、域名备案、服务器,如遇目前云平台UCLOUD 都无法使用的特殊情况,全部迁移至阿里云平台。 技术部负责每周二和周五 15 点检查 ucloud 余额情况,若余额低于 5000 元当天申请续费付款流程,确保余额大于5000 元;检查完成后,需登记《云服务器例行检查记录表》 注:定期对服务器进行检查,填写云服务器例行检查记录表。 四、信息安全事件分类 4.1 有害程序事件 有害程序事件是指蓄意制造、传播有害程序...