运维人员的日常,是苦逼的
检查各种设备监控、软硬件部署、应用升级、数据库巡检...
琐碎工作日复一日
巡检、部署、调优、升级...
不是加班,就是在出差的路上
机器成千上百,故障常常有
半夜线上救火,苦逼远程操作
白天不懂夜的黑,一觉不能到天明
这不
在运维领域摸爬滚打的小鹿
每天24小时精神高度紧张 be on call
今晚的愿望是:
没有故障,一觉到天明
▽
但是
怕什么来什么
故障恢复时间长
故障根因分析困难
难以还原现场
不知如何下手
...
这些问题的最优解在哪里?
莫慌莫慌
“HyperInsight-超融合持续观测解决方案”
来救场了~
给你快、准、全的处理告警故障的“最优解”
HyperInsight-超融合持续观测平台
HyperInsight 是一款基于 EasyCMDB 的IT资源架构上构建可观测能力的新一代监控平台。
下面,跟着鹿小U一起来看看它超强的观测能力!
▽
数据采集与分析
HyperInsight 支持用户对指标(Metric)、事件(Event)、日志(Log)、分布式跟踪(Tracing)等数据来进行监控采集;同时,HyperInsight 最大的特点在于可有效借助 EasyCMDB 中的资源数据对资源的健康状态进行关联分析,作为新一代的IT资源元数据与监控数据的超融合式存储,优维自研的EasyTSDB为其提供了强大的数据分析能力。
应用服务地图
HyperInsight为整个业务系统提供了应用服务分析地图,在分析地图上,用户可以快速识别系统中的高危服务,可一键洞悉对服务的运行实例、吞吐量、接口时延、调用失败率等情况。
从发现、分析到治理的完整闭环
应用服务地图提供了全景式的服务健康情况,一旦从服务地图,或者监控告警中发现异常的服务,HyperInsight可以通过服务的实例信息、调用分析、接口列表、告警事件等多个维度对异常的服务进行分析。
让告警设置不再烦恼:可视化告警规则
告警设置与通知策略一直是企业监控系统配置里面最为复杂的一环,大量的告警规则随着生产服务的上线而产生,随着时间的推移,维护的工作变得越来越困难,单一指标重复告警现象居高不下,也容易造成告警风暴,导致监控系统的作用下降,观测效能大打折扣。HyperInsight 为了彻底解决这些问题,创新地推出可复用、可视化的全链路告警规则。
告警事件跟踪与闭环
在设置告警规则后,处理告警触发的监控事件是大部分企业用户日常面临的工作之一,HyperInsight为用户提供了强大的事件处理中心,帮助用户快速处理、分析告警事件,并且希望通过事件中心,进一步提供事件治理的能力。
事件跟进:监控值班的驾驶舱
HyperInsight提供事件跟进的值班控制台,值班人员和业务人员可以快速地从控制台中,根据事件的不同状态来过滤需要关注的告警事件,例如值班人员一般会比较关心「待我响应」的告警事件,快速对线上产生的告警信息进行下一步的处理。
事件流转:跟踪、分析、定位与闭环
HyperInsight认为事件的闭环才是事件中心最为重要的一步,因此告警事件详情提供非常强大的告警跟踪、分析和定位、最后闭环的能力。
有疑问加站长微信联系(非本文作者)