[运维笔记]内网服务器或设备宕机了怎么及时收到通知并处理
前言
此前公司内网的一台服务器运行着六七个各种各样的后台任务,还跑着几个客户端。之后有一天晚上,公司里断电了,服务器也就停了,因为不是关键业务,所以之后几天谁也没发现,直到一周后才发现服务器没在处理。
那怎么在服务器宕机时及时知道呢
目前的简单办法:
无非在服务器上跑个定时任务,发个请求到某些第三方服务上,请求到达,说明服务器正在运行;
如果很长一段时间,请求没有发送过来,说明服务器估计就宕机了,立刻发个通知到企业微信群或钉钉群里。
这样管理员就可以及时的去处理问题。
怎么做,具体步骤:
注意:操作系统 Linux,这里我们以熊猫监控(xmtui.com)提供的服务为例子
创建 cron 任务:
-
使用 SSH 连接到服务器/计算机
-
输入
crontab -e
-
选一个你常用的编辑器
-
添加如下条目(每隔5分钟发送一次请求):
*/5 * * * * wget --spider "https://jiankong.xmtui.com/push/oooooooo-xxxxxxxxxxxxxxx" >/dev/null 2>&1
将这里的 URL 替换为你自己的 心跳包监控项的 URL,并将该/5部分替换为相应的间隔值。你也可以curl的方式:
*/5 * * * * curl --insecure https://jiankong.xmtui.com/push/oooooooo-xxxxxxxxxxxxxxx >/dev/null 2>&1
-
保存并关闭文件(无需重新启动)
这样熊猫监控(xmtui.com)在没有收到请求时,就可以及时的向我们管理员发送通知。