Alertmanager介绍与安装
Alertmanager概述
ALERTMANAGER官方网址
1.1.1 Alertmanager介绍
- Prometheus将数据采集和报警分成了两个模块。报警规则配置在Prometheus Servers上,然后发送报警信息到AlertManger,然后我们的AlertManager就来管理这些报警信息,包括silencing、inhibition,聚合报警信息过后通过email、PagerDuty、HipChat、Slack 等方式发送消息提示。
1.1.2 Alertmanager概念
- 分组(Grouping)
分组将类似性质的警报分类为单个通知。当许多系统同时发生故障并且可能同时触发数百到数千个警报时,这在较大的中断期间尤其有用。
- 抑制(Inhibition)
抑制是一个概念,如果某些其他警报已经触发,则抑制某些警报的通知。
- 静默(Silences)
静默提供了一个简单的机制,根据标签快速对警报进行静默处理;对传进来的警报进行匹配检查,如果接受到警报符合静默的配置,Alertmanager 则不会发送警报通知。
- 路由(Route)
用于配置Alertmanager如何处理传入的特定类型的告警通知,其基本逻辑是根据路由匹配规则的匹配结果来确定处理当前告警通知的路径和行为;
部署Alertmanager
Alertmanager官方下载地址
2.1.1 下载安装Alertmanager
下载地址
wget https://github.com/prometheus/alertmanager/releases/download/v0.23.0/alertmanager-0.23.0.linux-amd64.tar.gz
解压
tar -xf alertmanager-0.23.0.linux-amd64.tar.gz -C /usr/local/
软连接
ln -s /usr/local/alertmanager-0.23.0.linux-amd64/ /usr/local/alertmanager
准备启动文件
[root@ops prometheus]#cat /usr/lib/systemd/system/alertmanager.service
[Unit]
Description="alertmanager"
Documentation=https://alertmanager.io/
After=network.target
[Service]
Type=simple
ExecStart=/usr/local/alertmanager/alertmanager --config.file=/usr/local/alertmanager/alertmanager.yml --storage.path=/usr/local/alertmanager/data/
Restart=on-failure
RestartSecs=5s
SuccessExitStatus=0
LimitNOFILE=65536
StandardOutput=syslog
StandardError=syslog
SyslogIdentifier=alertmanager
[Install]
WantedBy=multi-user.target
启动服务
[root@ops alertmanager]# systemctl start alertmanager // 启动服务
[root@ops alertmanager]# systemctl enable alertmanager // 开机自启
[root@ops alertmanager]# systemctl status alertmanager // 查看状态
浏览器访问测试
http://localhost:9093