怎样用Python实现多站点运维监控呢

- 2018-08-28 -

在小型公司里如果产品线单一的话,比如就一个app,  一般1~2个运维就够用了。如果产品过于庞大,就需要多个运维监控人员来实现运维监控。接下来我们南京风城云码软件技术有限公司就为大家讲述一下如何用Python实现多站点运维监控。

一般情况下对于多产品线的公司来说,运维监控人员就要必须分多个人负责,因为超过200个站点让1个人维护,那工作量是巨大的,就单单给开发的沟通时间,估计就要占用运维监控人员一整天时间了。

目前我们公司站点非常多,为管理方便,之前我们这里是实行过一段叫站长制的方式,就是不同运维监控人员承担不同的项目维护,每个人就是自己所负责项目的站长,这个站长制实行完后,就有个监控问题,之前只要站点有问题,是每个人都可以收到,但为了防止报警泛滥,所以就需要把监控改成故障站点只发给负责该站点的站长。

有了这个背景,我们今天就来实现这个运维监控需求,脚本基本实现首先要有一个能够报警的函数,还需要一个检查站点是否故障的函数,最后一个函数是如果站点恢复后,要重新加入要运维监控的列表中,到这基本差不多了,但如果站点太多,用循环去检查还是效率太低了点,所以我们考虑采用线程并发执行。

上述内容就是我们南京风城云码软件技术有限公司为大家简单的说明了一下运维监控的相关内容,大家如果不是特别清楚的话,就快来关注我们,我们之后会发布更详细的关于运维监控方面的文章。