早前,应用可观测性入选全球最具权威的IT研究与顾问咨询公司Gartner发布的企业机构在2023年需要探索的十大战略技术趋势之一。
ONE
可观测性的概念及趋势解析
Gartner杰出研究副总裁 Frances Karamouzis 表示:“可观测性应用使企业机构能够利用他们的数据特征来获得竞争优势。它能够在正确的时间提高正确数据的战略重要性,以便根据明确的数据分析结果采取快速行动,因此可观测性是一种强大的工具。如果能够在战略中予以规划并成功执行,可观测性应用将成为数据驱动型决策的最强支撑。
根据 Gartner 的报告,所谓“可观测性”,就是在任何相关方采取任何类型的行动时,都会产生包含了数字化特征的数据,这些数据都可以称之为“可观测数据”,如日志、痕迹、API 调用、停留时间、下载和文件传输等。应用可观测性用一种高度统筹和整合的方式将所有可观测的特征数据进行反馈,创造出一个决策循环,从而提高组织决策的有效性。
简而言之,通过应用可观测性来对企业运营产生的实际数据进行分析,将所有数字化产品赋予可观测能力,在较短时间内推动主动决策,更进一步满足以用户为中心的数字化转型需求,从而增强企业竞争力。那聚焦IT系统,可观测性通过从系统内部收集各种可观测的数据来了解系统内部正在发生的事情,来帮助用户判断系统内部的状态,了解其运行情况及健康状况。
Gartner表示:到2026年,成功应用可观测性的企业中,有70%的企业将实现更短的决策延迟,从而为目标业务或IT流程带来竞争优势。
TWO
应用可观测性发展机会
随着云和云原生的普及,软件基础设施由虚拟机、云主机慢慢转变为容器、K8S以及Serverless/Faas,软件架构也从单体过渡到微服务和完全分布式架构。虽然这一改变极大地提升了系统的稳定性和横向扩缩容能力,但也暴露出传统监控的诸多问题:
▶传统监控解决方案烟囱式割裂,运维监控手段和工具繁多,数据无法关联,导致故障定位难、事件分析难、数据应用难等。
▶传统监控以基础架构为视角,并以指标型数据监控为主。缺失应用服务层视角,运维人员无法对整体业务运行的健康状态进行全局监测和有效判断。
▶故障发生时并不能精准评估故障对业务的影响级别从而启动对应SLA的解决方案,存在“误报”,“漏报”等问题,业务监控“形同虚设”;故障定位时也存在现场还原难,故障定位和恢复效率低下等问题。
随着IT技术的高速发展,各企业也均处在数字化转型的浪潮中,数字化推进越迅速,企业IT业务复杂程度越高,无论是应用还是数据的规模都发生了巨大的变化,因此传统的监控管理手段已无法满足现代化的IT监控运营需求。
可观测性与传统监控的区别
如上图,将系统中的信号数据根据其价值和对其认知划分为4个维度,及Known Knowns、Unknown Knowns、Known Unknowns、Unknown Unknowns。
传统监控一般是基于系统的事实情况(Knowns),能够感知系统的异常情况,但对那些未知的情况(Unknowns)就无能为力。而可观测性具备这样的能力,能够了解从未了解的情况(Unknowns),可知系统哪里有问题,根因是什么。
也就是说,传统监控可以发现问题,而可观测性却可以帮助了解冰山下(复杂系统)的未知世界,更好地定位问题。
可观测性从2021年开始在国内广泛提及,它的作用主要就是解决云原生、微服务等环境下企业IT系统的可观测性问题。
THREE
可观测性平台实践
优维在2021年着手可观测领域研究,是行业内领先进入可观测实践的厂商。优维深知,当下客户对于IT运维的需求已然发生改变,在云原生可观测场景下,企业运维需要具备多项能力,如全局数据采集与分析能力、数据有机关联融合能力、故障快速定位处理能力等等。从经验的角度来讲,这些不是简单的工具组合能够完成的,建设全方位超融合持续可观测平台成为必要。因此,优维在2021年率先提出“超融合架构”,正式推出新一代超融合持续观测平台-Hyperlnsight。以融合为基础,实现IT资源和业务的全方位可观测。
先来说说,一个好的可观测平台,要具备哪些特质?
一个好的可观测平台,先要具备全局的数据采集能力,二是要以运维视角重塑产品,三是要对这些被采集的数据进行有机的关联和融合,四是基于这些数据做深入挖掘。
优维Hyperlnsight超融合持续观测平台用三大特性,诠释如何提升可观测性。
第一点就是融合统一,通过一个平台满足所有运维监控需求,不需要再去重复建设或购买不同厂商的产品来自行组装。想要实现这种统一,需要监控能力覆盖多种终端。优维Hyperlnsight超融合持续观测平台通过融合来自用户端到网络、到云端、中间件、基础设施、设备、场景、业务等等多个方面的数据,满足企业在数字体验、业务、网络性能、应用性能、安全等等所有方面的监控需求。
第二点就是关联性,相互不关联的数据对于提升可观测性没什么帮助。优维Hyperlnsight超融合持续观测平台在对日志(Log)、指标(Metric)、分布式跟踪(Tracing)、事件(Event)数据做关联基础上,还有效借助EasyCMDB中的资源数据对资源的健康状态进行关联分析,同时作为新一代IT资源元数据与监控数据的超融合式存储,优维自研的EasyTSDB为Hyperlnsight超融合持续观测平台提供强大的数据分析能力,从而实现更好的可观测性。
第三点就是主动观测。优维Hyperlnsight超融合持续观测平台中的统一事件中心融合故障发现和故障处理流程,基于全栈数据融合对故障根因快速定位,以及对变更影响进行水平和垂直剖析。Hyperlnsight就像一个专业顾问一样告诉用户发生了什么问题,导致问题的原因是什么,从而缓解追查问题慢,解决问题慢的情况,帮助运维人员节省时间,让专业人员把精力放在其它业务领域。
从融合统一、关联性到主动观测,Hyperlnsight超融合持续观测平台完成了从看得更多到看得更透彻的整个过程,最终提升可观测性。
今年5月,优维Hyperlnsight超融合持续观测平台通过了信通院首批可观测平台认证,达到了先进级标准!国内可观测性发展扔处于初期阶段,但随着云原生、微服务等的持续发展,可观测性平台必将是客户三到五年内发展中所需投资的重要工具。优维作为可观测性解决方案的领先者,将持续产品及技术的创新工作,帮助用户实现IT与业务的系统可观测。
有疑问加站长微信联系(非本文作者)