Open-Falcon 是小米运维部开源的一款互联网企业级监控系统解决方案。其中有着如下的特点:
①强大灵活的数据采集:自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持、opentsdb data model like(timestamp、endpoint、metric、key-value tags)
②水平扩展能力:支持每个周期上亿次的数据采集、告警判定、历史数据存储和查询
③高效率的告警策略管理:高效的portal、支持策略模板、模板继承和覆盖、多种告警方式、支持callback调用
④高效率的graph组件:单机支撑200万metric的上报、归档、存储(周期为1分钟)
⑤高效的历史数据query组件:采用rrdtool的数据归档策略,秒级返回上百个metric一年的历史数据
⑥dashboard:多维度的数据展示,用户自定义Screen
⑦高可用:整个系统无核心单点,易运维,易部署,可水平扩展
⑧开发语言: 整个系统的后端,全部golang编写,portal和dashboard使用python编写。
但是在open-Falcon中,单一的告警模式又无法满足多样化的告警需求,尤其是当告警风暴来临时,单一的告警模式不仅会致使我们焦头烂额,还会导致我们无法快速判断告警的问题所在。于是如何将告警通过用户的多样化需求达到多种化通知方式,并且有效的避免告警风暴,就成了目前的首要解决问题。
智能告警平台 Cloud Alert 是睿象云自研的一款告警管理平台,就能够完美解决这个问题!用户可以将告警通过不同的需求,指定多种化通知方式,目前支持的通知方式有电话、短信、微信、邮件、APP、钉钉等;并且当告警风暴来临时,用户可以通过勾选算法智能降噪或设置告警压缩规则,使得相同类型的告警进行压缩,有效的避免告警风暴。用户也可以将不同的监控平台接入到Cloud Alert内进行统一化管理。
接下来就说下是如何设置的吧~
主要分为三大部分,首先是将Open-Falcon集成到此平台当中;其次设置分派策略,也就是指定条件(用户自定义)下的告警发生时通知的人;最后是设置通知策略,根据用户自身需求设置多元化的通知方式。
首先肯定是进入官网www.aiops.com,登录账号。
一.Open-Falcon集成
1. 在Cloud Alert中创建open-Falcon应用,点击集成 — 监控工具 — open-Falcon
2. 填写“应用名称”,点击“保存并获取应用key”
3. 在open-Falcon中配置Cloud Alert的回调地址
(1) 登录open-Falcon,选择template模块,点击你想要绑定Cloud Alert告警平台的template name。
(2) 在回调地址中填写类似如下URL:
http://api.aiops.com/alert/api/event/falcon/--
-- 处填入您新建应用时生成的appkey
二.设置分派策略
1. 点击配置 — 分派策略 — 新建分派
2. 输入分派策略名称 — 选择应用 — 设置分派人(告警发生时通知的人),点击保存
这一步骤用户可以根据【告警级别】【告警内容】等条件,来添加指定条件分派通知。
三.设置通知策略
1. 点击【配置】—【通知策略】-【新建通知】
2. 通知策略的可选择性也是很高的,用户可选择的地方有:告警状态、告警级别、通知方式、时间设置、延迟策略、通知人等,其中的意思分别如下:
告警状态:选择告警通知的状态。分别有发生时、认领时、关闭时、全选,4种选择。
告警级别:选择告警通知的级别。分别有提醒、警告、严重、所有,4种选择。
通知方式:选择告警通知的方式。分别有电话、短信、邮件、微信、APP,5种选择。
时间设置:选择告警通知的时间。分别有任何时间、工作时间、非工作时间,3种选择。
延迟策略:选择告警通知是否延迟。
通知人:选择告警通知的人。
例如:任何时间告警发生时严重级别的告警立刻微信通知所有人。
告警状态 — 发生时;告警级别 — 严重;通知方式 — 微信;时间设置 — 任何时间;延迟策略 — 立刻;通知人 — 全选
Open-Falcon与CA告警级别映射关系
以上的设置,就完成了open-Falcon的告警多样化的通知方式,用户也可以根据自身的需求设置多个分派策略,这样可以更加详细化通知方式。
有疑问加站长微信联系(非本文作者)