系统版本:centos7.9
python版本:3.6
目录:一、添加钉钉机器人
二、编写脚本
三、测试
一、添加钉钉机器人
1.1点击智能群助手
1.2 添加机器人,因我已创建,所以会显示一个运维报警。
1.3 添加一个机器人
1.4 选择webhook自定义
1.5 确认添加,我选择的是IP段,把服务器公网IP填进去就行,可以去看下左侧的说明文档。
1.6 创建好后保存好webhook链接
二、编写报警脚本,随便新建个*.py即可,该项目创建的为ding.py
2.1 编写py脚本
cd /root/touch ding.pyvim ding.py#######以下为py脚本内容########!/usr/bin/python# -*- coding: utf-8 -*import urllibimport urllib2import json,reimport sys, shutil, os, string, datetime,timefilelog = sys.argv[1]serverip = sys.argv[2] #来标识是那个服务器发送的警报def http_post( errmsg ):url = "这里填写刚刚保存的机器人webhook链接"values = {'msgtype': 'text'}content = {}content['content'] = serverip + errmsgvalues['text'] = contentheaders = {'Content-Type':'application/json;charset=UTF-8'}jdata = json.dumps(values)print jdatareq = urllib2.Request(url, jdata , headers)response = urllib2.urlopen(req)data = json.loads(response.read())errcode = data['errcode']print errcodereturn errcodedef senderror( filepath ):file = open(filepath)file.seek(0, os.SEEK_END)while 1:where = file.tell()line = file.readline()if not line:time.sleep(1)file.seek(where)else:print line,http_post(line)senderror( filelog )
2.2 里面有两个变量,第一个是日志路径,第二个是自定义的服务器名称。
filelog = sys.argv[1]serverip = sys.argv[2]
2.3 现在我们写一个sh脚本来引用上面的py脚本,我把该脚本放在了/etc/rc.d/下,命名为ding.sh
cd /etc/rc.d/touch ding.shvim ding.sh#######以下为sh脚本内容########!/bin/bashnohup python /root/ding.py /日志路径/php_errors.log 生产A服务器php日志报警: &nohup python /root/ding.py /日志路径/error.log 生产A服务器前端nginx日志报警: &nohup python /root/ding.py /日志路径/api.error.log 生产A服务器后端nginx日志报警: &
2.4 可以看到上面使用了nohup来设置后台运行,并且绝对路径写了刚刚py脚本所在的位置,变量1写了日志绝对路径,变量2写了自定义发送到钉钉的后缀机器名称。
2.5 现在把该脚本设置开机自启动。
vim /etc/rc.d/rc.local
2.6 把以下内容添加到末尾
bash /etc/rc.d/ding.sh
2.7 现在把脚本添加执行权限,注意:默认rc.local不引用,需要添加执行权限才会开机引用。
chmod +x /root/ding.pychmod +x /etc/rc.d/ding.shchmod +x /etc/rc.d/rc.local
三、测试
3.1 现在我们可以进行测试,有两种方式。
3.1.1、重启机器
3.1.2、直接运行ding.sh
因该机器为线上服务器,所以选择第二种方式进行测试
3.2 运行ding.sh
cd /etc/rc.d/./ding.sh
直接回车就行
3.3 现在看下进程是否运行
ps aux |grep ding
可以看到脚本正常在运行。
3.4 现在可以手动写入一个日志查看钉钉是否正常报警。
cat >> /日志路径/error.log << EOF>测试报警>EOF