ZXG10-SC可靠性说明系统可靠性甲方签字:第2页乙方签字:ZXG10-SC系统可靠性分析及瓶颈分析目录1.系统可靠性设计..................................................................................11.1.硬件冗余设计............................................................................11.1.1模块处理机(MP)..........................................................11.1.2T交换网.............................................................................11.1.3T交换网驱动板................................................................21.1.4FBI板................................................................................21.1.5主处理机网卡...................................................................21.1.6通讯板...............................................................................21.1.7电源...................................................................................21.1.8业务处理机和数据库服务器.........................................31.1.9核心交换网.......................................................................31.2.软件可靠性设计.........................................................................41.2.1层次化、模块化设计.......................................................41.2.2系统运行监测和日志.......................................................41.2.3资源管理...............................................................................41.2.4指针越界、堆栈溢出的预防...........................................51.2.5过负荷控制.......................................................................51.2.6容错处理...........................................................................61.2.7监控程序...........................................................................7湖南移动短消息扩容1目录系统可靠性1.2.8数据可靠性.......................................................................72短消息中心的MTBF和MTTR............................................................8甲方签字:第2页乙方签字:ZXG10-SC系统可靠性分析及瓶颈分析1.系统可靠性设计1.1.硬件冗余设计为了提高硬件的可靠性,采用的主要方法是冗余设计。ZXG10-SC系统中的关键部件均采用冗余设计。1.1.1.1模块处理机(MP)ZXG10-SC中的模块处理机(MP)采用主备用设计。其中一块MP处于主用状态,另外一块MP处于备用状态。主用MP处理所有的业务,备用MP处于热备份状态。备用MP每隔10ms扫描一次主用MP的运行状态,当发现主用MP的运行状态发生变化,即从主用状态变化为非主用状态时,立即进行倒换。倒换成功后,原来的备用MP成为主用MP,并承担所有的业务处理任务。为保证MP倒换后业务处理的正确性和延续性,备用MP的数据应和主用MP保持同步。同步过程分为两个阶段,起动阶段和运行阶段。当备用MP起动时,和主用MP做系统配置数据的同步。该同步过程由数据库应用进程负责。当备用MP进入运行状态后,备用MP中的各进程每隔一定的周期与主用MP上的相同进程做进程间的数据同步。ZXG10-SC系统中提供多种MP倒换方式,包括手动倒换、故障倒换、周期性倒换、人机命令倒换。当MP发生故障时,系统以图形界面和声光方式通知维护人员,以便及时更换发生故障的MP。2.1.1.2T交换网T交换网由两块交换网板组成,采用主备用方式。这两块交换网板的主备用状态由MP控制。当主用T交换网板发生故障时,MP能立即检测到,并把备用T交换网板转为主用。从故障发生到倒换结束的时间在五秒之内。湖南移动短消息扩容1目录第2页共14页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第2页共14页当T交换网发生故障时,系统以图形界面和声光方式通知维护人员,以便及时更换发生故障的T交换网板。3.1.1.3T交换网驱动板SP级...