国电东北电力公司为解决运维事件难跟踪、数据链路故障解决慢、运维工作被动、故障无法快速定位等问题,引进勤智运维ITManager系统,实现集中统一的7*24小时的监控,保障关键核心业务稳定运转,提升国电东北电力有限公司运维的核心竞争力。
行业特性
电厂和电网的分离促使电力分工更加精细化、专业化,对专业信息化建设的投入迅速加强。在我国加强电力资源优化调配大背景下,信息化的数据互联互通、业务协同等方面的问题日益突出,电力企业的信息化建设开始重视统一化、集成化。
国家电网公司 “SG186”规划的推出,引领我国电网行业信息化实现快速发展,促进国家电网公司基本完成“纵向贯通、横向集成”的一体化企业级信息集成平台和适应公司管理需求的八大业务应用的建成,以及规范有效的六个信息化保障体系建立,推动信息化健康、快速、可持续发展。
随着 SG-ERP 基本建成,电网信息化从高速大规模建设转入全面优化提升,更注重集成融合,强化创新驱动,为智能电网提供关键技术支撑。国家电网将全面建成“坚强”骨干电力通信网,基本建成智能变电站通信网、配网通信网、用电通信网及分布式能源接入通信网,全面建成 SG-ERP 系统,信息化整体达到国际领先水平,支撑和引领坚强智能电网发展,持续提升绩效。
项目背景
随着国电东北电力公司信息化建设的推进,大量信息系统投入使用,各个电厂间的专线都连接到国电东北电力公司的数据机房中,造成数据机房设备繁多,种类杂。而电力各个业务系统实时性、准确性要求非常高,信息化工作逐步由建设转向运维、管理和深化应用,信息系统运维服务的安全稳定运维愈发重要。
为解决安全运维需求,响应国网公司的集约化发展策略,实现国电东北电力公司运维业务由“粗放式”向“精益化”,“分散式”向“集约化”的转变,以及运维体系化、标准化转型,国电东北电力公司需要建立统一运维体系以满足电力业务发展需求。
现状描述及需求分析
国电东北电力有限公司现有机房3个,关键网络设备40多台,关键服务器30台,核心业务10余套,下辖电厂20多个。
经勤智运维团队深入调研国电东北电力有限公司信息化建设和运维现状,梳理出国电东北电力有限公司信息化运维需求如下:
(1) 运维事件难跟踪,各个电厂业务数据链路出现问题解决慢。
(2) 设备与业务系统种类多,链路复杂。
(3) 出现状况无法快速定位问题所在位置,无法快速解决故障。
(4) 运维工作被动,出现故障需要现场大量排查,效率低。
解决方案
为此,国电东北电力有限公司量身定制出一套安全运维解决方案,并部署了ITManager系统。部署方案如下:
v 搭建统一的运维管理平台监控平台,监控各地电厂的接入网络设备和链路。
v 通过ITManager的监控功能,监控国电东北电力有限公司的数据机房内的关键网络设备、服务器、WEB应用和关键链路等。
v 确保网络设备及应用系统的7*24小时监控,避免出现运维盲点;同时对出现的故障及时通过运维流程进行派单,并通过短信、邮件等形式告知设备的运维人员。当故障没有得到及时处理的时候,流程系统将自动升级故障处理级别。
实施方案及部署成果
国电东北电力有限公司大楼:
国电东北电力办公大楼
三层网络设备拓扑图:
网络拓扑
告警界面:
告警界面
方案收益
1、对核心设备和核心业务进行7*24小时的集中统一监控,有效保障国电东北电力有限公司的网络设备、安全设备、数据库、服务器、应用系统等高效、稳定的运行,避免了监控盲点。
2、对网络中关键链路进行监控,保证国电各电厂间的数据链路的健康运行和快速传输。
3、定期对监控数据进行报表统计,为信息化建设扩容和整改提供了理论依据和指导意见。
4、故障告警通知必达以及快速故障定位,帮助运维人员迅速找到链路、服务、网络和关键业务的故障点,快速排查并解决问题。
自勤智的运维监控管理平台ITM上线后,受到了国电东北电力有限公司IT部门负责人和第三方运行维护公司的一致好评。据介绍,从以往被动的工作模式转变为现在主动的工作模式,对IT部门有很大的帮助。
以往都是其他部门电话打过来运维人员才知道网络出了问题,工程师再到现场排查,现在当其他部门使用者打电话来时,运维人员已经定位了故障点并且进行了维护,公司上下对IT部门的效率评价很高。第三方运维公司的工程师也表示,有了ITM运维监控平台,他们定位故障点的效率也大大提高,减少了大量人工排查的工作,为快速解决问题提供了有效支撑。
案例亮点
网路设备和服务器设备的监控。国电东北电力有限公司主要监控网络和业务的连通性的部分,通过网络设备的上下联设备的接口进行监控,可以快速定位链路中断的故障点以及业务中断和运行缓慢时的设备运行状态,准确的判断出现故障点的设备接口或者链路,以便快速解决。
报表功能。国电东北电力有限公司网络中心通过ITM运维监控管理平台的自定义报表的数据,对现有设备的进行扩容和调整,合理优化网络和资源。
关于“勤智运维”:作为ITSS副组长单位,“勤智运维”扎根行业、立足用户、深入场景进行产品创新和研发,规范和引导信息技术服务标准体系建设,十多年来为教育、政府、金融、电力、互联网、能源、通信、医疗、交通等20多个行业的2000多个企业用户提供了优质的IT运维方案和服务。
OneCenter一体化智能运维服务管理平台,以统一运维为基础,以Hadoop+Spark大数据分析为核心,提供基础监控、视频监控、应用监控分析、云平台管理、动环监控及可视化3D机房管理、第三方系统平台集成等运维管理方案,是勤智结合国内外ITSS/ITIL/ISO 20000等IT标准和最佳实践,自主研发的一体化智能运维管理平台。