在移动集团内部,BOSS集中化在带来业务快速响应等众多优势的同时,也存在着系统故障点集中、风险集中的危险。中国移动业务运营支撑系统容灾(以下简称BOSS容灾系统)建设开始得比较早。另外一个方面,由于移动集团一级法人和二级法人并存的管理制度,大多数移动省公司选择了单独建设容灾系统。由于各个移动省公司在多个方面具有类似性,因而具有可比性,把移动的容灾建设作为一个容灾策略选择的研究样本具有极高的价值。

  在移动各省分公司进行容灾策略选择的决策流程可以分为四个关键的环节,每个环节都有需要考虑的关键。

  第一环:数据、应用Vs业务级

  选择容灾策略有两个关键性指标,RTO(Recovery Time Objective,使系统恢复所需要时间)和RPO(Recovery Point Objective,可接受的数据损失程度)。按业务恢复指标可以把容灾策略分为三类:数据、应用和业务级。

  数据级容灾是仅将生产中心的数据完整地复制到容灾中心的容灾方式。数据级容灾是异地容灾的最低级形式,也是最基本的方式,是实现更高级容灾方式的基础,但仅可以保证数据是可用的,若技术策略选择得当,可以保证业务数据的完整性。

  应用级容灾是指在数据级容灾实现数据可用的基础上,进一步实现应用的可用性,确保业务可以快速恢复。BOSS容灾系统的应用不改变原有的业务处理逻辑,是对生产中心系统的基本复制。

  业务级容灾是生产中心与容灾中心对业务请求同时进行处理的容灾方式,能够确保业务持续可用,但投资很高。

  目前各个省移动公司基本是以应用级容灾为主,部分非关键的业务是数据级,业务级还只是远期的目标。

  第二关:关键业务Vs全业务

  在明确了实施应用级容灾为主体的前提下,进一步从涉及业务范围可对容灾模式进行划分,可以分为关键业务容灾和全业务容灾。关键业务指的是客户服务、账务、计费等影响程度大、客户感知度强的业务。非关键业务是结算、统计报表、系统管理等影响程度较小、客户感知度较弱的业务。

  关键业务容灾是仅完成BOSS所有的关键业务的容灾,从移动试点的省份来看主要包括:客户服务、产品管理、客户管理、资源管理、订单管理、服务开通、综合采集、融合计费、综合账务等业务功能域。全业务容灾不仅完成BOSS所有的关键业务的容灾,而且还完成非关键业务的容灾。要根据业务分析结果,确定相应的RTO和RPO指标,判断容灾范围是关键业务还是全业务。目前辽宁移动选择的是全业务容灾。

  第三关:主备中心Vs双中心

  从运营方式,可以划分为主备中心和双中心。主备中心运营方式下备中心可承担辅助生产任务。生产中心BOSS承担主要生产任务,容灾中心主要承担容灾功能或仅承担辅助生产任务功能,如:承担软件开发、性能测试、个性化统计或临时的统计分析功能,此种运营方式称为“主备中心”运营方式。

  而在双中心下,两中心均承担生产任务,管理上由省公司集中管理。生产中心和容灾中心均承担BOSS生产任务,两中心负荷分担,互为容灾,任务分割可按照BOSS系统功能域或地域划分。此种运营方式简称为“双中心”运营方式。

  对这两种模式可以从设备投资分析、资源利用率分析、应用软件设计分析、人员组织、管理维护分析等方面进行对比。在移动首批的四个试点省份中,只有云南选择了双中心。

  第四关:同级Vs降级

  根据容灾规模可以划分为降级和同级。降级指的是容灾中心处理能力等方面为生产中心70%以上,而同级的两中心功能和处理能力相同。从工程实施的角度,降级容灾可先建设能力超过原生产中心的系统作为主中心,再将原生产中心改造为备份中心。一般考虑业务需求及投资规模,判断是同级还是降级容灾。从目前来看,移动公司采用降级的比较多。

  从两中心局址选择,可以划分为同城异地和异城。同城异地指的是两中心在同一个城市的不同地方,而异城指的是两中心不在同一个城市。在移动的首批四个试点省份中,只有江苏选择异城,两中心相距200公里。

  在不同的策略选择下,有不同的实施难度和成本的组合,各个移动分公司需要根据自身业务的特点作出合适的选择,决策过程可以参考决策流程图。移动的业务支撑系统首批选择了四个容灾试点,分别是江苏、辽宁、云南、吉林。江苏已完成第一阶段计费、营业、账务等应用级远程容灾(RTO=4小时;RPO=0),正在启动双中心(关键业务负荷分担、互为容灾)改造工作。辽宁实现关键业务应用级+非关键业务数据级容灾(RTO=2小时;RPO=0),借机实现BOSS搬迁,提升系统处理能力,现已完成系统切换、回切演习工作。云南实现关键业务应用级容灾,双中心运营方式,现已完成切换、回切测试工作。吉林利用容灾系统建设,重建BOSS系统,提升系统处理能力。

  2005年,移动业务支撑系统开始了第二批容灾试点,试点省份达到六个。在天津、青海、湖北采用的是关键业务应用级容灾。在浙江采用的是关键业务+数据级。上海采用的也是关键业务+数据级。山东是关键业务应用级容灾,为主备中心运营方式。

 


  阅读关于 容灾 通信 的全部文章