IT运维平台的发展趋势与规划要点

- 2018-11-26 -

在IT运维平台建设中常见四个阶段,IT日志管理平台与社会生产发展阶段有着极其相似的地方,大致分别对应为IT运维的“农耕时代”、“工业时代”、“信息时代”以及“智能时代”。

一、IT日志管理农耕时代——手工运维

一些IT信息化建设程度还不算高的企业,正在以他们的核心业务为中心构建IT信息化的支撑和管理系统。

当时的系统架构及基础设施架构异常简单,数十台服务器及一些基础软件如中间件、数据库等,就是企业信息化的全部家当。同时,IT运维体系以及业务对IT系统依赖程度等因素,决定了这个时候运维人员对于IT工具和平台的需求暂时相对较低。

在IT系统手工运维阶段,企业IT规模较小和技术栈的单一,使企业的运维水平往往决定于团队中核心运维人员的经验,几个技术大牛往往是运维团队的核心。

二、IT运维工业时代——自动化运维

在手工运维的时代,其实许多有远见的技术大牛深感这种运维方法的不足,开始着手建立各种运维工具去解决运维效率低下、操作不规范等问题。针对于不同场景下的各类专门的自动化运维工具和平台应运而生,例如:自动化监控类:各种提供应用性能监控、基础软件服务监控、主机存储设备、网络设备等自动化监控和告警的软件服务。管理类:各种提供IT运维支撑服务以及配置管理等方式的软件服务,例如,各种ITSM系统和CMDB软件系统。自动化运维类:各种提供自动化运维手段的工具和软件。其他专项工具:如应用性能管理APM、数据库运维管理DPM等工具。

三、IT运维信息时代——数据化运维

自动化运维工具和平台大幅度提升运维效率,让运维团队从机械、重复的劳动中解放出来。此时,运维人员得以重新审视整个运维过程,发现我们现有的运维过程中仍然出现一些问题,自动化运维体系仍然未对这些问题做出很好解答。

运维数据化的特征之一是将一切运维事件和操作数据化,将来自于各种监控系统、自动化运维、CMDB、日志文件以及各种专业运维工具等各种各样的数据进行采集、清洗、整合和结构化,并将所有的数据整合集中到运维数据平台,让原来孤立于企业IT环境中的各种运维数据产生更多连接和碰撞。

其次,构建一个更为开放且透明的IT日志管理数据体系,让更多的运维人员参与到运维数据分析中,让运维人员各展所长,从不同的角度去分析和应用数据。因为,如同业务数据一样,数据价值体现于应用的过程中,应用越多数据价值才越高。

另外,建立一套简单且有效的可视化运维数据分析手段,让运维人员通过可视化数据分析图表和报表,可以直观地洞悉运维数据中潜在的关系和趋势。

最后,基于运维数据分析的可视化运维大屏,使运维工作更为显性化。让运维工作这个原来领导看不见“黑匣子”,用可视化技术形象直观地展现出来,一方面,可视化将运维工作更加公开、透明,提升其他部门对运维的感知,提升运维工作的体验;另一方面,运维可视化实现程度的高低,在一定程度上反映出我们对运维工作的理解程度。可视化程度越高,运维就越简单,运维效率也就越高。

四、IT运维智能时代——智能化运维

最近一两年,AI人工智能成为业界的研究热点。运维人也开始着手研究如何将AI与运维相结合,让机器实现真正自我管理。目前,业界对智能化运维(AIOps)有着两种不同的解读,其实我认为无论AIOps是指基于算法的IT运维还是基于人工智能的IT运维,两者的本质并没有实质的差距,都是围绕海量的运维数据通过大数据、现代机器学习及更多高级数据分析技术,提供具备主动性、人性化及动态管理的能力,使运维工作一定程度上摆脱对人经验和知识的依赖。

五、企业IT运维平台的规划

企业运维平台建设非常重要,它直接推动企业IT运维效率的巨大提升,降低企业运维资源投入,同时也是企业运维质量提升的不二利器。运维平台建设将会对整个运维体系有明显的驱动作用,运维体系包括管理制度、流程、人员等各种因素需要与之做出适当的调度。需要针对企业现有的IT环境及未来一段时间的发展做出合理的运维平台未来蓝图和建设规划。规划很重要,有规划才能有计划、有目的地进行运维平台建设。企业运维平台需要有一定的前瞻性,但是由于落地实施需要时间和资源的配合,绝不能贪大求全。

基于IT日志管理构建企业自身特点和需求的各种运维场景,建设自身的运维平台,并不能生搬硬套,适合自己的才是最好的。运维数据可视化是体现运维价值的一个重要途径,将运维数据更为公开、透明,让企业管理层带来更明确的运维体验。企业IT运维人员是运维平台建设的主力,他们长期在企业运维中积累的思想、经验和知识,将归纳和总结到运维平台中并传承下去。