江苏IT运维中的精准运维的意义

- 2018-06-20 -

  江苏IT运维中的精准运维在服务过程中引入了业务需求作为控制变量,并以此为导向开展运维,充分了解了用户业务诉求,并将用户体验作为最终目标,这使得运维服务过程更注重用户体验,摆脱了仅针对信息系统做文章的小格局,有利于开发(软件工程)、技术运营和质量保障(QA)之间的沟通、协作与整合,促进DevOps真正落地。

  让江苏IT运维的价值更得以突显,并由“人天”来衡量转变为以其产生的价值来衡量

  传统运维往往签订一个固定期限的运维协议,服务的价值一般体现在多少人天、多少人年,以时间作为标尺来衡量价值。而精准运维的目标是服务给客户带来多少价值并得到客户的认可,体现在精准运维不仅追求系统运行安全稳定可靠,更追求的用户体验、业务效率、业务效益等,这种价值观的转变,使服务的立意更高,目标更高、客户的体验更好,因而含金量也更高。换句话说,精准运维让运维服务从低端走向高端,可以走向按项目制、目标制来签订合作或服务要求。

  增强了运维的主动性,使运维更加有计划性、条理性、预见性,工作不至于被动

  很多时候,IT运维服务带给人的印象似乎只是停留在“救火队员”的角色之上。运维人员往往是等到故障已经出现或瓶颈已经产生,然后才采取应急处理措施予以恢复,这种运维方法虽然能最终排除故障,但无法规避对企业业务造成的损失。而精准运维主动关注业务需要、用户体验、系统运行动态和变化趋势,并采取措施识别人机环境方面的风险并主动采取措施消除,充分体现了运维的主动性、计划性、条理性和预见性,真正实现主动预防性运维、防患于未然,实现信息系统与业务的心跳同步。

  实现资源优化配置、提升资源利用率

  IT系统于业务应用来说,有可能资源不足,也有可能资源过剩,通过精准运维的方法,不仅能解决资源不足问题,还可有效应对资源过剩的局面,将“闲置”资源充分利用起来。打个比方说,一个营销系统每日的不超过万条记录的处理量,但当时设计时却购置了配置很高的服务器,当前的服务器性能只利用了不到10%。通过精准运维的分析与评估,完全可以在当前的营销系统服务器上部署虚拟机,作为其他信息系统的运行环境,企业无需再购置新的服务器,从而实现了资源的优化配置,提升资源利用率。

  让运维更加向运营靠拢,成为运营的一部分

  所谓运营,是指以网站为产品营销平台或产品本身,为开展网络营销而做的一系列工作总称。精准运维不同于传统运维,更为关注业务需求、用户体验,通过对运营过程中的大数据从业务角度进行精准分析,发现用户的需求与业务环节的关联关系,进而从应用软件的角度进行业务模式、流程的改进与调整,让业务更好满足用户需要,从而找到新的业务增长点或改进方向。从这个角度来说,精准运维让运维比历史上任何时候更接近运营,且已成为运营的一部分,能够为开展网络营销贡献巨大的价值。

  精准运维该怎么做

  1. 精准运维的初始化—建立风控模型

  了解运维系统的业务特点,根据业务和系统运行情况与业务所有者一起着手建立风控模型。风控模型需要体现业务所有者(操作人员、维护人员、管理人员等)以及环境在信息系统运行过程中所面临的作业风险、业务风险、政策风险、管理风险和安全风险,这些数据来源于信息系统运行数据、历史运维数据、用户访谈信息及客户体验信息等。通过综合各方面信息,结合业务,从而建立风控模型,梳理出风险清单。建立风控模型的过程也就是进行信息系统与业务的匹配度分析过程,匹配度高的项必然风险小,匹配度低的项势必风险高。

  要素:风控模型的初步建立完成标志是与业务所有者达成共识。

  2. 精准运维日常运行之信息采集与反馈

  首先,以风控模型为基准,及时了解业务所有者的具体要求并将系统的情况与所有者交流,得到有价值的服务信息;其次,可以利用自动化监控技术采集到用户端的用户体验数据,如访问网站人数、登录系统效率、页面响应速度、访问流量等;也可以利用大数据及最新的ELK技术的方式采集系统日常运行的业务数据、资源使用情况数据、业务运行效率日志数据等。此外,还可以不断与业务部门进行沟通协调,采集用户的反馈与需求。

  要素:双方都了解对方的意图,并形成共识。

  3. 精准运维日常运行之预测及计划编制

  根据采集信息进行预测与计划的编制,所谓预测,就是对尚未发生或目前还不确切的失误进行预先的估计和推断,是现时对事物将要发生的结果进行探讨和研究。科学预测是建立在客观事物发展规律基础之上的科学推断。系统预测的实质就是充分分析、理解系统状况发展变化的规律。用相关性、数据趋势分析法及大数据分析技术对采集的数据进行挖掘分析,分析出业务需求与资源之间的相关性、与运维人员之间的相关性,分析出应用系统使用的历史与未来趋势,根据趋势与现有资源的匹配性来实时优化系统资源和人力资源,并编制详细的系统优化实施方案对系统进行优化。计划即是根据预测和业务所有者要求编制的行动方案。

  要素:计划要得到所有者的认可,如需要可优化风控模型。

  4. 精准运维日常运行之系统优化执行与实施

  根据编制的优化实施方案精心组织实施,且与业务方充分沟通,在不影响业务的基础上完成系统优化、应急演练、风险措施改进的实施服务工作。

  要素:注意行为规范。

  5. 精准运维日常运行之校验与评估

  根据实施结果与业务运行情况及对系统运行情况的采集,不断的校验实施效果,再进一步评估改进,通过PDCA循环往复直至达到系统与业务的精确匹配与心跳同步。

  江苏IT运维要素:结果要进入下一个环节,即反馈给所有者,如有必要可修改风控模型。