工商银行上海数据中心灾备系统运维实践 一、“两地三中心”建设历程 工商银行于 1999 年开启了数据中心集约化建设的先河,在北京、上海分别建设两大数据中心后,于 2002年 1 月在国内同业率先启动了主机灾难备份工程。经过多年的建设和持续投入,已经实现了高等级的核心系统灾备体系建设,完成了全行应用分等级灾备体系建设。为进一步提升信息系统灾难恢复能力,工商银行启动了 “两地三中心”工程建设。根据规划,2014 年将在上海嘉定建立同城数据中心,与上海外高桥数据中心构成同城双中心,同城双中心整体与北京异地灾备中心组成异地灾备模式(如图 1 所示)。 “两地三中心”模式可以满足不同灾难场景下的恢复要求,实现更灵活的风险应对。在架构布局上,上海同城双中心具备基本相同的业务处理能力并通过高速链路进行实时数据同步,两个中心之间距离约 55 千米,日常情况下可按主/ 备或双活模式运行。在发生区域级灾难某个中心失效时,可在基本不丢失数据的情况下进行双中心间的应急切换,保持业务连续运行。北京异地灾备中心用于同城双中心的灾难恢复,当出现因大范围自然灾害等原因导致同城双中心同时失效时,异地灾备中心可以用灾备系统接管全行核心业务。 二、“两地三中心”技术手段和实施策略 工商银行通过技术攻关,完成了“两地三中心”模式下的信息系统业务连续性架构设计和方案研究,提出了可以提供多层级业务连续性保障水平的解决方案。信息系统可以给银行业务应用提供A/A、A/Q 和 A/S 等多种部署模式,最终以业务影响分析结果作为应用部署模式选型的决策依据。 在具体实施中,工商银行坚持“全面覆盖基本保障能力、重点针对关键核心应用部署高等级灾备保障技术”原则,做好资源分等级和差异化配置。如ATM、POS、柜面业务、资本市场等核心业务系统是银行的关键应用,与其相关的应用系统就具有较高的业务连续性等级。自 2010 年工程启动以来,项目进展情况良好,完成方案规划设计和验证评审,在数据库复制技术全面推广、智能网管改造、55 千米磁盘同步镜像等关键技术领域取得了突破;完成了核心主机并行系统投产,即双园区模拟同城双活的试运行,目前主机并行系统主要运行可分离查询交易,分流了部分核心生产系统的负载压力;完成 13 个开放平台应用服务器双活改造,预计今年将完成近 50 个开放平台应用的双活改造。同时,工商银行积极探索“两地三中心”运行模式,按照“一体化管理”原则,初步制定了“两...