智能运维平台的监控管理功能

- 2019-03-15-

随着企事业单位IT系统规模不断扩大,构成IT基础的设施呈现出规模庞大、结构复杂、品牌众多等特点,传统的运维监控工具已经无法满足未来运维发展的需求。随着人工智能技术的逐渐渗透,智能运维平台因为其全面的功能,便捷的操作以及非凡的效率逐渐被企业接纳与重用。

在监控管理方面,智能运维平台的监控管理功能让运维工作变得智能、高效、简单、统一,帮助运维团队实时、全面掌握IT运行态势,及时响应和处理IT故障,为各企事业单位业务提供强有力的IT支撑和质量保障。

1.多维度可视化的监控面板

智能运维平台的监控管理功能提供可视化监控平台,将业务应用、IT基础资源、应用系统情况进行统一展示、告警和管理,告别不同资源的离散管理模式,全面提高监控效率。

2.丰富的监控模型库

全面灵活的监控方式(SNMP、WMI、SSH、TELNET、SHELL、IPMI、HTTP、Agent、syslog、SMI-S 、JMX、GB/T28181、SDK、TCPDUMP等),使得系统具备全范围的监控能力。智能运维平台的监控管理功能能够监控各种操作系统、服务器硬件、网络设备、各种业务应用、数据库、中间件、存储、虚拟化等IT资源,同时支持自定义刷新时间,随时随地查看系统运行情况。

3.告警事件集中展示

监控管理模块同时提供统一的告警管理功能,通过性能指标采集轮询、调用厂家网管告警接口、网元Trap/Syslog主动推送、第三方系统轮询获取等多样化的来源方式,获得整个网络系统中各种事件、设备故障、网络异常等告警信息。用户能在平台面板看到告警事件数量以及告警来源,方便用户统计、分析。

当出现故障后,平台能通过预置的报警方式,以邮件、短信、电话自动拨打等“告警必达”方式及时通知指定用户,并能生成告警分析统计报告,提供主动式的故障解决方案。

4.告警规则按需求自定义

针对用户实际需求,支持告警规则自定义功能,旨在帮助用户对单个或多个相同云服务的单个监控指标创建告警规则,便于用户对该类服务的某一指标进行统一监控。

5.采集接入自由拓展

智能运维平台提供多种类型数据接口的采集方式,以实现多平台/多业务的监控、流程等运维工具的数据整合和统一管理。同时,提供对于第三方业务平台的数据展现、数据统计、告警分析和业务分析功能,可以将多个系统在门户内进行统一登录展现,也可以与其他系统对接,从第三方系统登录至运维系统平台。

监控管理作为运维工作中最重要的功能之一,担任了整个运维工作中“眼睛”的角色,是一个优秀的智能运维平台不可或缺的功能之一。但除了监控管理,智能运维平台还有智能作业平台与智能运维等特色功能,我们也将在后面的文章中一一详解。