附件:行业卷烟生产经营决策管理系统运维工作详述第 96 期 一、工业企业维护情况使用决策管理系统的工业企业包括:16 家中烟工业公司,中烟实业进展中心,上海烟草集团有限责任公司,总厂 31 家,分厂 80 家。本期共受理工业企业突发事件 171 个。具体见下表:表一、工业企业运行情况表事件分类事件数(个)占事件总量(%)已解决(个)打 码74。17扫 码52。95数据采集4526。345管 理 机10360。2101接 口00。00数据统计21。22基础代码52。95国家局端42.34其 他00.00总 计171100。0169引发事件的主要原因统计分析如下图所示:图.事件按故障根源统计所占比例分布图(工业)注:目前尚有 2 个事件未确定故障根源。本期主动监控发现各类事件 111 个,占所有突发事件的64。9%。监控类事件详细分类如下表所示:类型事件总计(个)故障原因数量(个)管理机端78文件系统剩余空间不足47表空间剩余不足3硬件故障9MQ 传输通道异常6应用异常2服务器时间异常10停 机 ( 断 电 或 人 为 关机)0其他1数采上报33系统环境20人为原因7接口因素2其他4本期工业方面的重要事件:1。6 月 8 日,四川烟草工业有限责任公司反映其服务器的 db2_log 文件系统使用率已达 100%。运维人员经详细排查,发现客户的数据库日志文件增长过快,高峰时 1 分钟增长可达 4%;进一步分析发现其日志增长过快非系统异常,而是企业的业务量较大引起,但受系统物理设备(db2_log仅 15G,且系统无可使用剩余空间)的影响,db2_log 不可扩充。运维人员保持实时监控,及时清理 db2_log 文件系统,确保客户系统的正常使用;已建议企业对硬件设备进行必要的扩充.2。6 月 16 日,绵阳卷烟厂反映决策管理系统页面登陆异常.运维人员经详细排查,发现 WAS 软件日志提示数据库连接已达到最大值,且无法释放,故客户的操作无响应,运维人员为客户重启了 WAS 服务,释放历史连接,目前系统已恢复正常。3.6 月 23 日,旬阳卷烟厂反映服务器断电后重启存在异常.运维人员为客户重启 HA 服务,发现 DB2 服务启动后无法连接数据库,经详细排查,发现断电造成一块光纤卡发生故障,服务器与存储之间的链路不通导致无法访问数据库运维人员将其链路调整到另一块光纤卡后,HA 服务启动成功,系统恢复正常,随后为企业更换了故障的光纤卡,目前系统运行稳定。4。 6 月 30 日,广西中烟反映为南宁卷烟厂下发 7 月份计划与码段失败。运维人员经详细排查,发现中烟为...