自动化运维平台立项报告1. 项目名称自动化运维平台2. 现状分析我部承担了XXXX 等业务系统 , 目前,我部已有的IT 基础设施包括XXX 台服务器,运行AIX, HPUX, Redhat Linux, Suse Linux, Windows等 XXX 种操作系统。随着业务系统的发展,近年来对信息化建设不断投入,大力发展信息化平台,我部所管辖的IT 资产规模不断扩大,目前 IT 系统已经支撑了大量的业务,同时各类新型的业务系统还在陆续推出。信息化系统对业务的支撑作用日益加强,如何保障信息化系统的稳定运行也变得越来越重要,随之而来IT 运营维护的压力也在不断增大。具体表现在: 1.业务系统上线,升级频繁,目前我部承担XX 个核心系统, XX 个业务子系统的运维,系统大的升级每年平均有XXX 次,而业务 /系统变更每周平均有XXX 个,涉及 XX 台服务器,目前我部虽然实施了ITIL 进行变更控制,但变更的具体实施操作完全依赖手工完成,时间紧,任务重,变更实施人员往往无法在预定的变更窗口时间内完成变更实施和验证,而高强度的手工操作容易导致操作失误和变更失败,并可能直接酿成生产事故。2.配置规范难以核实落地。我部运维的业务系统均有相应的软硬件配置规范,需要进行例行核实以确保业务的正常运行,但由于承载这些业务的设备众多,配置不断更新,目前只能是对重点系统或重点设备进行人工抽查。3.变更验证耗时长。在业务系统的上线与变更中,由于主要依靠手工进行,变更验证的耗时为全部耗时的XX% , 并且只能做到抽查,缺乏有效的工具帮助进行变更验证。4.发现非法变更。我部虽已经实施符合ITIL 的变更管理,但依然存在变更管理流程记录外的系统更改和配置更改,成为系统隐患。目前我部缺乏对用户登录系统终端进行操作的记录,查询和审计功能,如何快速探测非法更改是保证安全生产的难点之一。5.为保障安全生产和系统稳定运行,我部参照XXX等国际最佳实践,结合自身的运维经验,制定了面向服务器,网络设备,中间件,数据库和应用的巡检规则共XXX类,XXX大项, XXX条细则。但是,在巡检实施过程中,主要依靠手工和少量脚本,缺乏必要的工具支撑,巡检周期拉长到X 天,只能做到抽查而无法覆盖全部设备,而即使是抽查从检查到汇总报表也需要耗时XXX 天。同时,对于巡检中发现的违规条目,由于缺乏有效工具而无法进行修补,如我部在安全条约中定义所有服务器管理员密码必须每X 天更换一次,但考虑到我部管辖到X 台服务器,现有人力根本无法达成...