您的当前位置:首页4、中国移动重大故障应急预案指导分册

4、中国移动重大故障应急预案指导分册

2022-02-16 来源:爱问旅游网
CM-IMS设备重大故障应急预案

中国移动集团公司

二零一零年六月

发布

前言

“低成

为切实保障网络安全,避免重大故障发生,落实刘爱力副总裁“

本”绝不能以牺牲网络质量为代价,绝不是设备采购、网络建设、容灾备份、维护人员等方面低品质下的低成本”,应“纠正由于认识不足而导致的质量保障资源的投入不足”重要指示。

网络安全是电信企业正常运营的核心,是保证网络品质和保障客户利益的基础。

为提升网络安全,特制定本容灾备份指导手册。

参与编写人员张彬管益文叶健景技楼剑帅

第一部分核心网容灾................................................. 1.核心网容灾意义、原则、实施策略

....................................

1.1核心网容灾意义.............................................. 1.2核心网容灾总体原则.......................................... 1.3核心网容灾实施策略.......................................... 2.核心网容灾人员保障及职责分工

......................................

3.核心网容灾总体要求................................................

3.1核心网容灾资源管理要求...................................... 3.2核心网容灾传输方面要求...................................... 3.3核心网容灾割接时限要求

......................................

3.4核心网容灾人员配备及能力提升

................................

3.5核心网容灾演练要求.......................................... 3.6其他........................................................ 4.容灾备份方案及主要流程...........................................

4.1 MSC/MSC Server容灾备份方案.................................

4.1.1 MSC POOL容灾备份方案................................. 4.1.1.1容灾资源需求....................................... 4.1.1.2应急数据制作....................................... 4.1.1.3应急资料要求....................................... 4.1.1.4 容灾操作........................................... 4.1.2 MSC Server N + 1

非实时容灾备份方案..................

4.1.3 MGW割接容灾备份方案................................. 4.1.3.1 容灾资源需求....................................... 4.1.3.2 应急数据制作....................................... 4.1.3.3 应急资料要求....................................... 4.1.3.4 容灾操作........................................... 4.1.4 BSC/RNC割接容灾备份方案............................. 4.1.4.1 容灾资源需求.......................................

6666677888999999101010101112121213131414

4.1.4.2 应急数据制作和定义................................. 4.1.4.3 应急资料要求....................................... 4.1.4.4 容灾操作........................................... 4.2 MGW容灾备份方案...........................................

4.2.1 MSC POOL容灾备份方案................................ 4.2.1.1 容灾资源需求....................................... 4.2.1.2 应急数据配置....................................... 4.2.1.3 应急资料要求....................................... 4.2.1.4 容灾操作...........................................

4.2.2 BSC(RNC)割接容灾备份方案........................... 4.3 HLR容灾备份方案...........................................

4.3.1 HLR的1 + 1实时容灾备份方案......................... 4.3.1.1 容灾资源需求...................................... 4.3.1.2 容灾准备要求...................................... 4.3.1.3 容灾步骤.........................................

4.3.2 HLR的N + 1动态容灾备份方案......................... 4.3.2.1 容灾资源需求....................................... 4.3.1.2 容灾准备要求....................................... 4.3.1.3 容灾步骤.........................................

4.3.3 HLR的N + 1静态容灾备份方案......................... 4.3.2.1 容灾资源需求....................................... 4.3.1.2 容灾准备要求....................................... 4.3.1.3 容灾步骤..........................................

第二部分

无线网容灾..............................................

1.无线网容灾意义、原则、实施策略

...................................

1.1无线网容灾意义............................................. 1.2无线网容灾总体原则......................................... 1.3无线网容灾实施策略......................................... 2.无线网容灾人员保障及职责分工

.....................................

1415161616161717171818181818191919192020212121232323232324

3.无线网容灾方案及主要流程.........................................

3.1容灾ABIS端口割接..........................................

3.1.1 应急资源需求........................................ 3.1.2应急数据制作和定义................................... 3.1.3操作流程............................................. 3.2. 利用容灾BSC整体割接法....................................

3.2.1应急资源需求......................................... 3.2.2应急数据制作和定义................................... 3.2.3操作流程.............................................

4.无线网容灾启动及流程.............................................

4.1无线网容灾启动要求......................................... 4.2无线网容灾启动流程......................................... 5.无线网容灾相关要求...............................................

5.1无线网容灾方案的总体要求5.2无线网容灾资源管理要求5.3无线网容灾割接时限要求

.................... ..................................... .....................................

...............................

27272728282829293030303024

错误!未定义书签。

252526262630

5.4无线网容灾人员配备及能力提升

5.5无线网容灾演练要求......................................... 5.6无线网容灾传输方面要求

.....................................

6.后续.............................................................

第一部分核心网容灾

1.核心网容灾意义、原则、实施策略

1.1核心网容灾意义

核心网容灾备份直接影响用户感知,

并体现通讯恢复能力,在重大灾害、主

设备故障、电源故障等场景中发挥着重大作用。

1.2核心网容灾总体原则

一、核心网容灾网元范围

P-CSCF、I/S-CSCF、BGCF、HSS、SLF、MGCF、IM-MGW、VIG(VIG Server/MGW)、MRFC、MRFP、ENUM/DNS、SBC、计费网关二、核心网网元容灾比例应针对核心网内各类网元实现有容灾备份路由。

三、充分考虑重大灾害、电源故障,制定跨机房、跨区域的容灾备份方案,即至少满足主用设备和备用设备物理上不在同一个机房或同一通信楼。有条件的情况下,考虑跨区域容灾。

四、备用设备接管业务,应保证在非节假日忙时容灾过程中呼损不超过

20%。

100%容灾备份,即核心网任意一台设备均设置

1.3核心网容灾实施策略

一、以最快速恢复业务为最根本策略,特别是重点区域的基本通信业务。二、核心网容灾方案应考虑到极端情况下的可操作性、便易性,如重大自然灾害、火灾、机房重大电源故障等。

三、重点MSC、MSC Server下的MGW、BSC/RNC具备优先割接条件,根据实际情况确定割接优先次序。

2.核心网容灾人员保障及职责分工

各公司成立核心网容灾备份指挥小组,主要职责

1、负责制定本省应急指导手册、审核具体的核心网容灾方案2、审核、批准应急方案的启动

3、定期组织应急演练,针对存在问题进行分析,督促整改

各公司成立核心网容灾备份实施小组,小组成员包括无线专业、交换专业、传输专业、IP承载专业、计费技术骨干,并确保成员熟练掌握应急方案,主要职责

1、具体执行应急预案的实施2、具体执行应急预案的演练

无线、交换、传输保障小组成员、主要职责在各省具体的容灾方案中明

确。

A/B角备份,实施小组

3.核心网容灾总体要求

一、各省公司根据集团公司下发的应急指导意见及本地具体情况,确定本省的应急手段并制定具体的应急方案。

应急方案中明确容灾备份流程、各网元

容灾备份责任人、省内分工界面。在重大故障发生时,本着抢通原则,有秩序,有重点恢复业务。

二、根据核心网网络的优化调整和业务发展对容灾备份方案进行及时的调整和完善,确保应急方案的时效性。

三、重点做好跨机房传输通道的准备,明确每个机房、每个机房楼层的传输应急割接方案。

四、本着最快恢复业务的原则,在不影响备份设备运行情况下,依据应急方案,提前制作容灾备份数据和准备运行脚本,

最大限度的减少业务倒换时延。

在条件允许的情况下,提前在备份设备上制作备份数据,如不具备条件,则应提前准备运行脚本,紧急情况下直接运行脚本。

五、对于跨计费区域实现容灾备份的,需要提前制定计费验证方案,并在容

灾后确认计费情况。

3.1核心网容灾资源管理要求

一、按照日常维护标准对备份设备、备份路由、备份传输进行维护,保障备份资源的完好性、可用性。

二、应急资料准确、细致,要求细化到传输端口,并根据网络的调整及时更新。

应急数据批处理文件和传输资料需进行专人维护,制定日常维护更新流程:当每BSC/RNC下有10个以上(或3个VIP)基站或10条A/IU接口传输变更或BSC/RNC光口变更应在次日完成相应资料更新,

每BSC/RNC下有5个以上基站变

更或5条A接口传输变更应在三个工作日内完成相应资料更新。

三、各类应急资料有专门的存放服务器,资料必须在本地机房内存放,并做好保管。

四、传输应急跳线专线专用,放在机房明显位置,禁止挪作它用。

并且做好备份;传输应急割接端口

3.2核心网容灾传输方面要求

核心网容灾方案中涉及的备份传输资源应提前调通至设备所在机房跨机房应急传输资源应满足各机房被容灾

BSC跨机房割接的带宽需求。

DDF架,

选择2M跳线方式割接的方案:每个机房内配备长跳线数量满足容灾跳线要求,跳线长度根据现场实际

DDF布局进行选取。

3.3核心网容灾割接时限要求

交换核心网出现重大故障时,各省容灾备份保障指挥小组应在动容灾备份方案。

MSC/MSC Serve/MGW故障:从启动容灾备份方案开始,30分钟内恢复重大故障。

HLR故障:从启动容灾备份方案开始,

5分钟内恢复重大故障业务。

15分钟内启

3.4核心网容灾人员配备及能力提升

所有应急保障实施小组成员必须配备第二联系方式

,避免网络故障发生后影

响现场人员通讯,小组成员必须有机房开门门卡权限,确保第一时间进入机房现场。

请各省公司高度重视对应急人员的能力培养,织应急体系内人员进行操作步骤及方法的学习,的熟悉程度。

定期组织跨专业交流,定期组

定期检查应急人员对资料及工具

3.5核心网容灾演练要求

各省公司每半年组织一次核心网容灾演练,每个地市任选

1套MSC Server

演练,同时制定详细演练方案,确保方案切实可行、各专业配合顺畅、满足实战要求。演练后一周内上报演练总结报告。

总部定期进行不预告演练,并通报存在问题。

3.6其他

本指导手册不对具体容灾方案限制,各省根据实际资源情况自行制定。

4.容灾备份方案及主要流程

4.1 MSC/MSC Server

容灾备份方案

4.1.1 MSC POOL容灾备份方案

MSC POOL方案能够实现MSC Server设备的实时容灾备份,各省应积极应用MSC POOL方案,POOL内网元应至少分布在两个及以上不同机房。通过实现POOL内MSC Server设备的实时备份。

MSC POOL作为有效的容灾备份方案,各省应积极推广,

2011年底前完成省

POOL技术

内软交换端局60%的MSC POOL组网。

4.1.1.1容灾资源需求

合理控制MSC POOL内设备利用率,确保MSC Pool内任何一个Server(MSC)故障时,其他Server的剩余容量能够实现容灾。

4.1.1.2应急数据制作

无需制作数据,按照正常的数据的一致性。

MSC POOL维护要求,确保MSC POOL内所有设备

4.1.1.3应急资料要求

第一:明确MSC POOL组网、节点分布情况

第二:明确MSC POOL内设备版本、容量情况(容量情况列出明细表)第三:提前准备好拨测表格和性能统计分析表格,

性能统计分析必须包含全

部常用指标(至少系统接通率、系统应答率、网络接通率、中继、信令负荷每线ERL、中继拥塞率、VLR、BHCA利用率)

第四:在组POOL的网元、网络结构、节点数量、版本、容量发生变化后必须及时更新应急资料

4.1.1.4 容灾操作

第一、通过告警监控、性能监控,或者其他途径发现MSC POOL内Server(MSC)重大故障时,保障指挥组人员迅速到位。

第二:确保MSC POOL数据同步,在MSC Server(MSC)发生重大故障时,用户应能实时转移到POOL内其他MSC Server(MSC)。

以下第三、第四步骤并行第三、核心网保障人员迅速查看

POOL内各Server(MSC)以及各节点告警

和性能,检查位置区小区数据,确保用户登记正常,业务正常。

第四、分公司拨测保障人员迅速在故障确保业务正常。

Server(MSC)的各BSC/RNC下拨测,

第五、处理故障Sevrer(MSC),故障恢复后尽快安排倒回。

4.1.2 MSC Server N + 1

该方案用于在不具备

非实时容灾备份方案

MSC POOL功能且MSC Server故障情况下,启用备份

Server替代故障Server恢复业务的情况。

如省公司已具备独立的备份

Sever,则可选择此种方案。

4.1.2.1 容灾资源需求

确保备份Server的容量能容灾N个Sevrer中最大容量的Server。备份SERVER必须与STP开通足够的信令链路,且链路处理开通状态。

4.1.2.2 应急数据制作

1、备份SERVER对应IP承载网CE数据制作。

备份SERVER对应的IP承载网CE需要修改跟备份SERVER间的信令IP地址为故障SERVER信令IP地址,并确认该明细路由已经

IP承载网上发布。

故障SERVER对应的IP承载网CE需做好关闭到故障SERVER的相关物理及逻辑端口,确保该CE不发布故障SERVER的明细路由。2、 STP数据制作。

STP需制作采用故障SERVER的信令点编码,制作到备份SERVER的信令链路组。

3、关口局、HLR数据制作。

遇有关口局及HLR到故障SERVER间信令走直达链路时,需修改关口局及HLR到故障SERVER的路由,首选STP。

4.1.2.3 应急资料要求

第一:明确备份关系和各设备版本

第二:明确备份Server的机房位置、设备维护和登录信息;第三:明确数据备份及存放信息;

第四:STP到备份Sevrer的信令传输打通,平时保持激活空载状态;

第五: IP承载网负责人做好备份Server的IP地址路由修改准备并关闭故障SERVER对应CE的相关物理及逻辑端口(准备应对各

第六:提前准备好拨测表格和性能统计分析表格,部常用指标。

Server的脚本);性能统计分析必须包含全

4.1.2.4 容灾步骤

第一:通过告警监控,或者性能监控,或者用户投诉等途径发现重大故障时,保障指挥组人员迅速到位。(15分钟内)

以下第二、三、四步骤并行操作:

第二:在备份Server上启用故障Sevrer的备份数据,确保业务接管准备(涉及数据导入、设备重启等操作,应在

30分钟内完成);

15

Server(MSC)

第三:在IP承载网做相应修改,确保网络连通(涉及数据修改,应在分钟内完成);

第四:在STP做相应修改(明确数据修改或是传输跳接,都应在完成);

第五:如有必要,在相关关口局及

HLR做数据配置修改;

15分钟内

第六:保障组责任人员通过拨打测试、性能统计分析来判断业务恢复情况(30分钟内确认)

4.1.3 MGW割接容灾备份方案

当MSC Server故障时,割接故障网元所辖

MGW至其他MSC Server,实现业

务的倒换。如容灾方案跨计费区域,需一并考虑计费解决方案。

4.1.3.1 容灾资源需求

确保备份MSC Server的容量和处理能力能够容灾,建立容灾对应表

4.1.3.2 应急数据制作

1、备份MSC Server侧配置以下数据:1) 应急接入的MGW的基础数据配置;

2) 应急接入的MGW的H248和M3UA数据配置;

3) 应急接入的MGW下BSC/RNC信令数据配置(M3UA\\SCCP等相关数据)4) 应急接入的MGW下BSC/RNC局向话务数据配置(局向接口中继群电路等相关数据)

5) 应急接入的MGW下BSC(RNC)无线数据配置(位置区数据)

2、其他网元配置数据:

1) 应急接入的MGW上制作到备份Server的H.248和M3UA数据

3) IP承载网修改CE路由,确保备份MSC Server与应急接入的MGW能连4) BSC/RNC创建至备份MSC Sever的信令、电路数据

3、如方案跨计费区域,事先应先确定备份MSCID,在备份Server上制作MSCID相关数据,并在核心网据;

汇接局关口局直连端局相关HLR制作相关数

小区切换等相关对应MGW\\A(IU)

4.1.3.3 应急资料要求

第一:明确资源情况和备份关系(资源情况列出明细表,特别是容量和各模块处理能力,须确保资源充足)

第二:对于需临时加载数据的网元准备数据修改脚本,并及时更新。第三:提前准备好拨测表格和性能统计分析表格,部常用指标

第四:在资源、备份关系、MGW组网、MGW数据、BSC(RNC)信令以及BSC(RNC)局向数据发生变化时都必须及时更新应急资料和备份设备数据;

第五:在BSC(RNC)的A(IU)接口电路发生变化时,相应资料和备份设备数据应及时更新。

第六:在BSC(RNC)位置区小区数据发生变化时,相应资料和脚本应及时更新。

性能统计分析必须包含全

4.1.3.4 容灾操作

第一、通过告警监控,或者性能监控,或者用户投诉等途径发现

Server(MSC)

重大故障时,保障指挥组人员迅速到位。(15分钟内)

以下第二、三、四步骤并行操作:

第二、在备份MSC Server设备上制作数据并激活MGW(30分钟内)第三、在IP承载网做相应修改,确保网络连通(

5分钟内)

第四、保障组责任人员通过拨打测试、性能统计分析来判断业务恢复情况

4.1.4 BSC/RNC割接容灾备份方案

当MSC Server故障时,割接故障网元所辖

BSC/RNC至其他MSC Server,实

现业务的倒换。如容灾方案跨区域,需一并考虑计费解决方案。

4.1.4.1 容灾资源需求

第一:确保备份Server的容量以及Server和MGW的处理能力、链路电路资源能满足紧急割入的BSC(RNC)容量需求,建立容灾对应表,明确备份与应急接入BSC/RNC的对应关系,应注意同一个Server。

第二:各省可以考虑设备利旧来补充不足容量和资源;第三:A接口资源预留,备份

Server下的MGW提前预留容灾端口,确保至

Server

LAC的BSC(RNC)应备份到同一

少能容灾应急接入的BSC(RNC)50%的电路,重要BSC(RNC)应根据实际情况预留更大比例资源。

第四:传输资源预留,提前部署被容灾机房应急传输资源应满足各机房被容灾

BSC(RNC)到备份设备的传输,跨

BSC跨机房割接的带宽需求。

选择2M跳线方式割接的方案:每个机房内配备长跳线数量满足容灾跳线要求,跳线长度根据现场实际

DDF布局进行选取。

4.1.4.2 应急数据制作和定义

1、备份MSC Server侧数据

1)增加割入BSC(RNC)的信令数据(明确M3UA\\SCCP等相关数据)2)增加割入BSC(RNC)的局向话务数据(明确局向

对应MGW\\A(IU)接口

中继群电路等相关数据)

3)增加割入BSC(RNC)的无线数据(明确位置区2、其他网元侧数据

1)备份MGW侧增加割入BSC的信令及中继层面数据(明确令和中继,包括MTP3/MTP3B等)

2)BSC/RNC创建至备份MSC Sever的信令、电路数据

3、如方案跨计费区域,事先应先确定备份MSCID,在备份Server上制作MSCID相关数据,并在核心网据;

汇接局关口局直连端局相关HLR制作相关数

A接口/Iu-CS信

小区切换等相关数据)

4.1.4.3 应急资料要求

第一:明确资源情况和备份关系(资源情况列出明细表,特别是容量、传输、链路资源、电路资源、处理能力等,须确保资源充足)

第二:提前做好各类型BSC(RNC)到不同Server(MSC)的业务测试第三:做好Server(MSC)中BSC数据准备:

(1)能提前制作备份数据的备份设备,应做数据并及时更新;

(2)不能提前制作数据的备份设备,应准备脚本并及时更新,以便容灾使

用。

第四:传输容灾端口准备到位,准备传输跳接表传输资料准确、细致,要求细化到每个

DDF架端口。制定被容灾

BSC/RNC

割接信息表,包括BSC/RNC名称、所属server、A接口端口号、传输端口号、所属传输机房、割接目标接口端口号等。

提前在机房内准备割接所需的长跳线和相关工具,跳线数量根据实际需要准备,跳线长度根据各分公司实际

DDF布局进行选取。应急割接端口使用醒目

DDF标签用醒目颜色标识。

MGW、割接目标传输端口号(应急端口)、割接目标A

颜色标出,不可挪做它用。同时冗余应急端口的

第五:提前准备好拨测表格和性能统计分析表格,性能统计分析必须包含全部常用指标

第六:在资源、传输、备份关系、

MGW组网、MGW数据、BSC(RNC)信令以

及BSC(RNC)局向数据发生变化时都必须及时更新应急资料和备份设备数据;

第七:在BSC(RNC)的A(IU)接口电路发生变化时,相应资料和备份设备数据应及时更新。

第八:在BSC(RNC)位置区小区数据发生变化时,相应资料和脚本应及时更新。

4.1.4.4 容灾操作

第一:通过告警监控,或者性能监控,或者用户投诉等途径发现重大故障时,保障指挥组人员迅速到位。(15分钟内)

以下第二、三步骤并行操作:

第二:各BSC(RNC)传输跳接,注意通过指令或者跳线传输确保到Server(MSC)的链路全部中断后进行传输挑接,并在据修改(应在30分钟内完成)

第三:在容灾Server\\MGW设备上制作BSC(RNC)数据并激活,已经提前制作备份数据的激活链路(应在

30分钟内完成)

BSC(RNC)Server(MSC)

BSC(RNC)上做相应数

第四:保障组责任人员通过拨打测试、性能统计分析来判断业务恢复情况(30分钟内确认)

4.2 MGW容灾备份方案

4.2.1 MSC POOL容灾备份方案

积极应用MSC POOL方案,已纳入MSC POOL范围的MGW,在端口及传输资源允许的情况下,BSC/RNC 应至少连接2个MGW,实现MGW设备的实时冗余备份

4.2.1.1 容灾资源需求

第一:严格控制70%的设备资源利用率,明确量和容量;

MSC Pool内Server(MSC)数

第二:明确BSC(RNC)连接MGW情况,各省严格遵照集团文件,在端口及传输资源允许的情况下,BSC (RNC)应至少连接2个MGW。

第三:确保POOL内任何一个MGW故障时,故障BSC(RNC)能通过其他MGW容灾。

4.2.1.2 应急数据配置

无需制作数据,按照正常的数据的一致性。

MSC POOL维护要求,确保MSC POOL内所有设备

4.2.1.3 应急资料要求

第一:明确MSC POOL组网、节点分布情况(要考虑布在不同机房)

第二:明确MSC POOL版本、容量情况(容量情况列出明细表)第三:提前准备好拨测表格和性能统计分析表格,部常用指标

第四:在组POOL的网元、网络结构、节点数量、版本、容量发生变化后必须及时更新应急资料

性能统计分析必须包含全Server(MSC)、MGW分

4.2.1.4 容灾操作

第一、通过告警监控,或者性能监控,或者其他途径发现重大故障时,保障指挥组人员迅速到位。(15分钟内)

第二: MGW发生重大故障时,其下业务。(实时)

以下第三、第四步骤并行第三、核心网保障人员迅速查看

POOL内各Server(MSC)、MGW以及对应BSC(RNC)应能实时通过其他MGW恢复

MSC POOL内MGW

BSC/RNC的告警和性能,检查位置区小区数据,确保用户登记正常,业务正常。

(30分钟内确认)

第四、分公司拨测保障人员迅速在故障务正常(30分钟内确认)。

第五、处理故障MGW,故障恢复后尽快安排倒回。

MGW下的各BSC/RNC下拨测,确保业

4.2.2 BSC(RNC)割接容灾备份方案

未纳入MSC POOL范围的MGW,采用BSC(RNC)割接的容灾备份方案(详见4.1.4)

4.3 HLR容灾备份方案

HLR保存的用户数据分为静态数据和动态数据,

以下方案要求的静态数据指

HLR通过MSC得到的

HLR通过BOSS系统得到的用户签约业务数据,动态数据是用户位置信息等非签约数据。

4.3.1 HLR的1 + 1实时容灾备份方案

该方案用于同厂家两台HLR互备或其中一个HLR做备份,重大故障发生时,业务实时倒换到备用HLR的情况。

4.3.1.1 容灾资源需求

明确备用HLR的容量,确保HLR故障时,备用HLR能完全接管。

4.3.1.2 容灾准备要求

第一:明确HLR组网、备份关系、版本、容量情况第二:明确静态数据、动态数据备份方式

第三:提前准备好拨测表格和性能统计分析表格,性能统计分析必须包含全部常用指标

4.3.1.3 容灾步骤

第一、通过告警监控,或者性能监控,或者用户投诉等其他途径发现重大故障时,保障指挥组人员迅速到位。(15分钟内)

第二: HLR发生重大故障时,备用HLR应能实时接管业务,需要注意确保STP到故障HLR的信令中断,避免双活。(实时)以下第三、第四步骤并行

第三:核心网保障人员迅速查看已经接管业务的备用确保用户登记正常,业务正常。(30分钟内确认)第四:分公司拨测保障人员迅速对故障(30分钟内确认)。

第五:处理故障HLR,故障恢复后尽快安排倒回。

HLR下用户进行拨测,确保业务正常

HLR告警和性能,

HLR

4.3.2 HLR的N + 1动态容灾备份方案

该方案用于对同厂家多台重大故障,能实时倒换到备份

HLR设置一个备份HLR,当其中一个HLR发生HLR的情况。

4.3.2.1 容灾资源需求

备份HLR的容量大于等于N个主用HLR用户容量的总和,其处理能力不小于N个主用HLR中最大容量HLR的处理能力。

4.3.1.2 容灾准备要求

第一:明确HLR组网、备份关系、版本、容量情况第二:明确静态数据、动态数据备份方式

第三:明确N + 1的N值(根据设备厂家提供的设备容灾备份能力,个HLR静态容量和小于1000万)

N

第四:提前完成备份路由数据的制作

STP:增加省内所有主用HLR的备用信令路由至备份MSC/GMSC/SCP等相关网元:设置主用

HLR。

HLR。

HLR的备用信令路由至备份

STP到备份HLR的信令链路创建,平时保持激活状态

第五:提前准备好拨测表格和性能统计分析表格,性能统计分析必须包含全部常用指标

4.3.1.3 容灾步骤

第一、通过告警监控,或者性能监控,或者用户投诉等其他途径发现重大故障时,保障指挥组人员迅速到位。(15分钟内)

第二: HLR发生重大故障时,备用HLR应能实时接管业务,需要注意确保STP到故障HLR的信令中断,避免双活。(实时)

以下第三、第四步骤并行

第三:核心网保障人员迅速查看已经接管业务的备用确保用户登记正常,业务正常。(30分钟内确认)

第四:分公司拨测保障人员迅速对故障正常(30分钟内确认)。

第五:处理故障HLR,故障恢复后尽快安排倒回。

HLR下用户进行拨测,确保业务

HLR告警和性能,

HLR

4.3.3 HLR的N + 1静态容灾备份方案

该方案用于对非同厂家(或同厂家,但动态技术达不到要求)的多台HLR设置一个备份HLR,当其中一个HLR发生重大故障,能实时倒换到备份的情况。

HLR

4.3.2.1 容灾资源需求

备份HLR的容量大于等于N个主用HLR用户容量的总和,其处理能力不小于N个主用HLR中最大容量HLR的处理能力。

4.3.1.2 容灾准备要求

第一:明确HLR组网、备份关系、版本、容量情况、设备维护和登录信息。

第二:明确静态数据、动态数据备份方式

第三:明确N + 1的N值(根据设备厂家提供的设备容灾备份能力,个HLR静态容量和小于1000万)

第四:提前完成备份路由数据的制作

STP:增加省内所有主用HLR的备用信令路由至备份

HLR。

N

MSC/GMSC/SCP等相关网元:设置主用HLR的备用信令路由至备份HLR。STP到备份HLR的信令链路,平时保持激活状态

第五:提前准备好拨测表格和性能统计分析表格,性能统计分析必须包含全部常用指标

4.3.1.3 容灾步骤

第一、通过告警监控,或者性能监控,或者用户投诉等其他途径发现重大故障时,保障指挥组人员迅速到位。(15分钟内)

第二: HLR发生重大故障时,确保打死

STP到故障HLR信令,激活STP

HLR

到备份HLR信令,备份HLR接管业务(应在5分钟内完成)

第三:发送Reset消息,让故障HLR用户更新到备份HLR(应在10分钟内完成)

以下第四、五步骤并行

第四:核心网保障人员迅速查看已经接管业务的备用确保用户登记正常,业务正常。(30分钟内确认)

第五:分公司拨测保障人员迅速对故障

HLR下用户进行拨测,确保业务

HLR告警和性能,

正常(30分钟内确认)。

第六:处理故障HLR,故障恢复后尽快安排倒回。

5.核心网容灾启动及流程

5.1核心网容灾启动要求

MSC、MSC Server、MGW、HLR发生宕机,或者由于设备不能正常运行导致超过10万用户*小时话音通信中断,或超过

20万用户*小时单向通信中断

(不能主叫或被叫)时,立即启动容灾备份方案。

5.2核心网容灾启动流程

省公司负责制定本省具体的启动流程,确保判断准备、启动及时、落实到人、跟踪到位。

第一、应急指挥小组并审核并启动应急实施。

第二、接到通知后应急保障小组启动核心网容灾准备工作:

1、应急小组

人员到位;2、工具及相关资料准备到位;3、按照应急方案实施业务倒换。

第三、应急保障小组成员按照分工尽快实施,并及时反馈进展情况。

第二部分无线网容灾

1.无线网容灾意义、原则、实施策略

1.1无线网容灾意义

无线网容灾位于整个移动通信应急的最末端,

它直接关系到给用户提供

信号的基站能否快速工作;在重大灾害、主设备故障、电源故障等场景中发挥着重大作用,在应急通信保障中举足轻重。

1.2无线网容灾总体原则

第一、无线网容灾网元范围BSC设备

第二、无线网网元容灾比例

应针对无线网内所有BSC设备进行容灾备份,即任意一台容灾备份路由。

第三、无线网容灾方案采用基站割接的方式实施。第四、容灾基站选取原则

主要覆盖省市各级应急指挥保障机构、政府机关、部队驻地、交通主干道、重要集团单位等区域,且选取的基站应满足连续覆盖,满足区域用户基本通信需求。

第五、在各类业务中优先恢复话务业务,再次恢复数据业务,最后考虑其他业务。

第六、容灾方案中必须有明确的基站应急割接分级实施次序基站、VIP基站、一般基站由高到底的顺序。

, 总体按VVIPBSC设备均设置有

1.3无线网容灾实施策略

第一、以最快速恢复业务为最根本策略,特别是重点区域的基本通信业务。

第二、无线网容灾方案应考虑到极端情况下的可操作性、便易性,如重大自然灾害、火灾、机房重大电源故障等。

第三、重点BSC内VVIP及VIP基站优先具备割接条件;具体实施时,根据现场实际情况确定基站割接优先次序。

2.无线网容灾人员保障及职责分工

各公司成立无线网容灾备份指挥小组,主要职责:

1、负责制定本省应急指导手册、审核具体的无线网容灾方案2、审核、批准应急方案的启动

3、定期组织应急演练,针对存在问题进行分析,督促整改

各公司成立无线网容灾备份实施小组,小组成员包括无线专业、交换专业、传输专业技术骨干,并确保案,主要职责:

1、具体执行应急预案的实施2、具体执行应急预案的演练

无线、交换、传输保障小组成员、主要职责在各省具体的容灾方案中明确。

A/B角备份,实施小组成员熟练掌握应急方

3.无线网容灾总体要求

第一、各省公司根据集团公司下发的应急指导意见及本地具体情况,选取本省的应急手段并制定具体的应急方案。

第二、在确保无线网容灾基站区域连续覆盖的基础上,重点做好覆盖重要区域基站的应急工作,如覆盖省市各级应急指挥保障机构、抗洪救灾通信保障、政府机关、部队驻地、车站、大型居民聚居地等区域。

第三、应急资料准确、细致,要求细化到传输端口、应急基站硬件及参数配置。

第四、重点做好跨机房传输通道的准备,明确每个机房、每个机房楼层

的传输应急割接方案。

3.1无线网容灾资源管理要求

第一、按照日常维护标准进行容灾

BSC维护。

第二、各类应急资料有专门的存放服务器,并且做好备份;传输应急割接端口资料必须在本地机房内存放,并做好保管。

第三、传输应急跳线专线专用,放在机房明显位置,禁止挪作它用。第四、及时做好资料的更新工作

A.若在网运行BSC间基站发生批量割接,ABIS口有较大变动(超过三个VIP基站或10条ABIS口),一天之内对应急资料进行更新。

B.若有新建BSC入网或老BSC退网导致ABIS口变动,三天之内对应急资料进行更新。

C.若无大规模调整,应急资料应保证至少每周一次的更新频率。D. 传输网元大规模割接导致预留应急端口发生变化时,料进行更新。

一天内对应急资

3.2无线网容灾割接时限要求

BSC/RNC所带VIP基站少于5个(含重要基站),半小时之内恢复VIP基站业务。

BSC/RNC所带VIP基站多于5个,一个小时之内恢复VIP基站业务。2小时之内恢复故障BSC/RNC下全部被容灾基站的业务。

传输割接完成基站数据下载完成

基站发射

8-10分钟10-15分钟7-15分钟

合计(25-40分钟)

备注:以批量站割接为例(

5个BTS以上)

3.3无线网容灾人员配备及能力提升

所有应急保障实施小组成员必须配备第二联系方式

,避免网络故障发生

后影响现场人员通讯,小组成员必须有机房开门门卡权限,确保第一时间进入机房现场。

请各省公司高度重视对应急人员的能力培养,定期组织跨专业交流,定期组织应急体系内人员进行操作步骤及方法的学习,定期检查应急人员对资料及工具的熟悉程度。

3.4无线网容灾演练要求

各省公司每半年组织无线网容灾演练一次,

每个地市任选1套BSC演练,

同时制定详细演练方案,确保方案切实可行、各专业配合顺畅、满足实战要求。演练后一周内上报演练总结报告。

省公司定期进行不预告演练,并通报存在问题。

3.5无线网容灾传输方面要求

在网运行BSC与容灾BSC不在同机房或同楼层的情况,传输在两侧机房

预留应急割接端口并打通业务,并且应急割接端口使用醒目颜色标出,不可挪做它用。同时冗余应急端口的

DDF标签用醒目颜色标识。

4.无线网容灾方案及主要流程

目前无线网容灾方案主要有二种类型,二、利用容灾BSC整体割接。

第一、利用容灾ABIS端口割接;第

4.1容灾ABIS端口割接

MSC

故障BSC

冗灾ABIS端

基站

4.1.1 应急资源需求

容灾ABIS端口

方法1:利用在网BSC空闲端口;根据应急基站数量配置业务及信令处理板卡资源。

方法2:新增单独容灾BSC,并创建各类配置基站模板。A口资源需求

根据容灾BSC最大承载话务规模测算出需要的传输方面

各省市提前部署传输资源,特别是跨机房应急传输资源,满足各机房被

A口资源。

ABIS接口板卡、

容灾基站的30%同时跨机房割接的带宽需求。

选择2M跳线方式割接的方案:每个机房内配备长跳线数量满足被容灾基站同时割接的要求,跳线长度根据现场实际

DDF布局进行选取。

4.1.2 应急数据制作和定义

第一、完成本地网络结构、网元分布拓扑图,包括BSC类型、所属机房、覆盖区域、所带基站数、

BSC名称、所属MSC、

VIP基站数目。

第二、根据现网基站配置情况,提前在容灾ABIS端口上创建各种类型的通用基站及小区数据;在MSC侧添加相关应急小区数据。

第三、制定被容灾基站割接信息表,包括基站名称、所属

BSC、ABIS端

口号、传输端口号、所属传输机房、割接目标BSC、割接目标传输端口号(应急端口)、割接目标ABIS端口号。

第四、提前做好被容灾基站软件版本、基站型号、BSIC、硬件参数、QMUX地址等一致性确认,做好各项准备工作。

第五、应急小区在容量允许的情况下尽可能开启半速率功能,以提升应急割接后的话务吸收能力。

第六、提前做好计费数据上报。

4.1.3 操作流程

第一、当接到启动基站割接通知后,应急小组人员快速到位。

第二、修改数据实现传输软割接,或根据实际情况用跳线完成电路调通。第三、传输调通后进行基站软件下载,完成基站数据激活。第四、完成小区数据制作,下载并激活相关应急小区。第五、安排现场测试,并添加应急小区基本切换关系。第六、故障恢复后尽快安排倒回。

4.2 利用容灾BSC整体割接法

如果一个BSC发生故障,并且故障在短时间内无法恢复,启动该容灾保障

方案,将冗灾BSC整体替换故障BSC,仅仅需要割接BSC到MSC、BSC到BTS间的传输。

MSC

MSC

备份电脑

BSC数据

故障BSC

冗灾BSC

路由割接

基站

4.2.1 应急资源需求

第一、专用容灾BSC一套或一套以上。

第二、根据容灾BSC最大承载话务规模测算出需要的

A口资源。

第三、各省市提前部署传输资源,特别是跨机房应急传输资源,满足各机房被容灾基站的30%同时跨机房割接的带宽需求。

传输选择2M跳线方式割接方案:每个机房内配备长跳线数量满足被容灾基站同时割接的要求,跳线长度根据现场实际

DDF布局进行选取。

4.2.2 应急数据制作和定义

第一、每天对所有BSC的设备配置数据定时做上传BSC应急倒换时设备配置数据最新。

第二、完成本地网络结构、网元分布拓扑图,包括BSC类型、所属机房、覆盖区域、所带基站数、

BSC名称、所属MSC、UPLOAD和备份,保证

VIP基站数目。

第三、完成各机房、楼层所有BTS传输端口资料、传输应急端口资料准备。

第四、提前做好计费数据上报。

4.2.3 操作流程

第一、当接到启动基站割接通知后,应急小组人员快速到位。第二、操作人员根将故障

BSC配置数据装载到冗灾BSC,重启容灾BSC。

第三、修改数据实现传输软割接,或根据实际情况用2M跳线进行A口和基站侧割接。

第四、BSC重启完成,同时割接的基站开始下载数据并逐步恢复。第五、割接基站全部恢复正常,应急冗灾结束。

第六、通知应急冗灾保障小组成员应急冗灾结束,割接基站倒回。

5.无线网容灾启动及流程

5.1无线网容灾启动要求

BSC宕机后30分钟或符合集团公司下发的重大业务故障,方案。

立即启动容灾

5.2无线网容灾启动流程

省公司负责制定本省具体的启动流程,确保判断准备、启动及时、落实到人、跟踪到位。

第一、应急指挥小组并审核并启动应急实施。

第二、接到通知后应急保障小组启动无线网容灾准备工作:

1、应急小组

人员到位;2、工具及相关资料准备到位;3、进行第一个站割接准备。

第三、应急保障小组成员按照分工尽快实施,并及时反馈进展情况。

6.后续

本无线网容灾指导手册适用无线核心设备

BSC发生故障后无线业务全部

中断的情况。

因篇幅问题不能全部显示,请点此查看更多更全内容