随着移动互联网和云计算的普及和应用,推动着中国数字化产业规模呈指数级增长。麦肯锡发布的中国数字经济报告显示,国内电子商务(交易额占全球40%)和数字支付(个人消费交易额是美国的 11 倍)已经领先全球。同时,IT架构、产品交付、IT运维也发生了更大变化,APM的发展和应用伴随着云计算、互联网规模不断壮大。
APM是Application Performance Management的缩写,主要是通过对企业的关键业务应用进行实时监测,发现和定位应用缓慢、异常和错误问题,从而消除性能瓶颈;同时,分析和诊断前端真实用户访问质量,提高企业应用的可靠性和稳定性,保证用户得到良好的服务体验,降低IT总体拥有成本(TCO)。
对比传统ITOM解决方案,APM的核心价值体现在以用户体验为核心,从用户、网络、存储、服务器到移动端和Web,在复杂环境下逐层钻取网络链路、中间件、数据库、应用和后端IT支持系统的性能问题, 为企业提供全技术栈的性能监控并进行优化。
应用性能管理(APM)的业务短板
APM作为真实用户体验分析和性能诊断的产品,它只能解决某个技术栈的性能问题,在全局业务分析方面存在着种种局限。企业冀望APM成为数字化业务的有效保障,却无法构建起IT性能与业务的有效关联:
APM仍然难以打破IT数据孤岛的局限!正是因为APM与实际业务之间所存在的数据断层,导致企业无法从IT性能指标对业务趋势进行准确识别和分析,APM所关注的性能并非业务的核心指标。企业构建应用的目的是为了产生业务价值,例如提升销售额、增强用户交互、提高客户满意度等,而不是为了提高性能。Forrester调查显示,43%的企业管理者认为,对业务数据与性能数据的多维度关联分析才能产生最大的业务价值,而APM输出的分析结果往往是不全面的。
APM无法进行数字化业务的根因分析!数字化业务体系是由无数用户角色、不同应用场景所组成的,要实现数字化业务的根因分析,必须了解用户在访问应用或网站的每个步骤的需求变化。例如,用户对网站响应时间的敏感度随着应用场景、事务流程的执行是不断变化的, 12306 用户在即将到来的春运抢票过程中,对访问延时的容忍度就会远高于平常。CIO们如果根据APM分析结果“平等”处置应用缓慢问题,很可能会忽视真正的业务风险,进而影响到业务的健康发展。
在DT时代,数据的价值不断凸显,但真正的价值来自实时、有效的数据分析。利用大数据技术把APM数据、基础设施数据、应用系统数据和业务数据的核心指标进行关联,以便能实时和前瞻性的分析IT应用/性能和企业核心业务指标的相互影响,这也将成为CIO最重要的责任。
业务运维驱动数字化业务增长
时至今日,IT系统规模和复杂性并未随着云技术的应用而降低,反而与日俱增。企业对IT的关注也从日常维护转向业务健康运行影响的业务运维上。企业逐渐认识到增加太多的垂直IT监控管理系统不但昂贵,而且并不能有效监控业务健康运行状态。通过业务运维平台聚合、关联监控和业务数据,将有效的分析结果实时呈现,才是确保数字化业务持续健康的最佳途径。
#lexo_img_start http://upload.chinaz.com/2018/0104/201801041145477601.png lexo_img_end#
云智慧业务运维解决方案——面向全业务和IT的业务运维平台,把来自不同数据源的IT数据、报警、业务拓扑、业务数据进行梳理和规范,实时分析系统异常对业务造成的实际影响,从而帮助企业找到亟需解决的根源问题。云智慧业务运维关注的不是单纯的IT系统运行状态,而是以业务运行健康作为核心指标,采集、分析和管理企业数据,为业务决策提供有效的数据支持。
业务与IT性能的双向关联分析:IT出现性能降低或者故障时,详悉对业务的影响范围和程度;业务波动时,掌握IT支撑系统实时的性能状态,第一时间发现并消除故障隐患。
实时业务监测和告警:基于云智慧独有的实时海量大数据分析技术,实现从后端IT支撑系统到前端业务系统的覆盖式监控,当业务和IT系统出现异常时,提供秒级告警通知,减少业务损失。
跨应用系统的业务追踪:从业务运行视角出发,进行全流程实时监控和追踪,准确定位业务故障的问题根源,提高问题排查效率。
业务系统精细化运营:立足全局业务拓扑和业务健康KPI,对IT基础设施、业务系统的实时运行状态和日志数据进行全量采集和关键指标分析,帮助企业实现快速响应和精细化运营。
海量大数据实时处理:实时采集、处理、分析全量IT性能数据和业务运行数据,提供多维度多视角的可视化展示。
智能化的运维管理:利用机器学习和深度学习算法对关键业务指标及其影响因素进行持续分析、处理,智能定位系统异常,并进行智能化告警和处置。
如果说APM是专注于应用性能问题的诊断,那么业务运维就是以APM、NPM、ITOM等IT性能监测系统为基础,整合数字化业务指标进行统一分析。通过业务运维平台第一时间发现业务波动的真实原因,然后作出正确响应,持续优化用户体验,提升数字化业务的运营管理效率。