近两年来,无论从国内还是到国外,市场出现一种APM批判的论调,甚至有“传统APM已经落后”的个别声音出现。

可放眼望去,国外主流APM厂商如:DataDog、 Dynatrace、New Relic等市值却在不断创着新高,甚至连Splunk这种大厂也在发力布局APM。国内赛道玩家同样深受资本市场的热捧,融资额屡屡逆市创新高,可以说当之无愧为二级市场的弄潮儿。

如此现实与舆论的一冰一火的反差,到底是意味着这个行业将面临的变革,还是仅仅只是业内人无处安放的焦虑?

细究之下,持这种看衰论调的人大多是用的一个依据——传统的APM将不再适应云原生时代。

我们不妨顺着这种思路来看一下,是不是如此。

新架构时代的确来了

之前很长一段时间里,对大多数公司而言云计算基本都停留在云资源层,而应用仍旧是传统的单体架构。那些设计成能上天入地的功能被辛勤的研发转化为成千上万行的代码,并牺牲睡眠时间和头发数量来保证进度,着实另人震撼。直到某一天,客户要求加个小功能模块时,我们有幸能够看到又一次堪比登月的工程重构。

做为公司的PM曾经是有理想有抱负的,“我曾经跨过山和大海, 也穿过人山人海”是经历过岁月沧桑留下的自信。但是面对这不知道换了多少架构和研发才完成的堆积成山的里三层外三层的代码堆,他们也不得不感慨:“谁能来救救我?”。

故事里通常都是这样,该拯救世界的英雄出马了,于是它真的来了。

微服务的出现可以说顺应了这个时代,它通过分布式的组件即容器来封装不同的功能并使用API通信,并能够在与之前面向服务的架构保持一致的前提下提供代码更新的灵活性,这怎么听着都像是拯救苍生来了。

这一项项的提升效果,谁能保证不心动?

  • 改善可扩展性
  • 提高生产力
  • 更快的定位问题
  • 提升系统的可用性
  • 最终提供最佳的用户体验

可是习惯理想主义的我们经常会这样,解决一些问题的同时又会制造另外一些问题出来。换成这个架构我该咋管理呀?

面对困难,我们其实早就习惯性焦虑

微服务很好很强大,但是这背后却带来了前所未有的复杂性。你所拆散成的微服务它们必须相互通信,而且还要保证将延迟降到最低,当管理一个由微服务组成的应用程序时,你实际上在管理的是一个相互关联的组件网络,还真是应了那句话“前门拒虎,后门进狼”

从人类历史看来,我们不擅长解决未知问题,甚至对未知有种本能的恐惧。大到国与国之间的外交,小到每个人的婚姻工作,仿佛不焦虑就对不起这个时代一样,尤其是这两年的疫情更是给了我们焦虑制造了快速发展的空间。

于是乎我们需要找个借口以避免显示自己解决问题能力上的不足,既然云原生是大趋势,那么凡是和它八字不合的东西统统可以说落后了,这样事情就变得简单了是吧?

以APM为例,反正APM发展了这些年也有一些积累的问题,应该也不算冤枉它,何况还有一批新兴的厂商也迫切的希望在这里做些文章呢。于是,几大罪状几乎板上钉钉。

APM的罪状:

  • 非全量采集带来的追踪数据遗漏,不具备基础资源的监控指标及系统日志的获取能力
  • 基于批处理的分析模式不满足快速定位要求
  • 专有探针模式难满足定制化采集需求,并且数据格式难统一
  • 定价模式限制了用户业务增长所需的必要的扩容
  • 难以和其它监控工具联动提升可观测性

确实不错,至少是有理有据,而且都说到点子上了。结果自然也是成功的把自己的难题推给了别人,于是焦虑神奇的转移了。

只有直面才能解决问题

既然罪状有了,APM圈总得有个应对办法吧,否则岂不是欺我无人么。于是一波聪明人聚到一起,思想的碰撞有了结果,灵光一现就是它:可观测性。

这个看似神秘的“可观测性”其实并不复杂,它定义使用新的方法来提高对应用程序的性能的洞察能力,目前主要提供三类的数据:指标(Metrics)、追踪(Traces)、日志(Logs)。

是不是很熟悉?没错,这不就是市面上多如牛毛的厂商一直在各自做的事情么?原来是众人独自闯江湖,现在需要变成有帮派了,不管是直觉还是幻觉都在告诉所有人,这对大家来说是件好事。

于是,APM就理所应当的需要修炼进化了,所谓“兵来将挡,水来土掩”也是屡试不爽的高招。

· 全量采集与数据整合
针对应用本身的性能监控,应提供全量Trace数据的采集能力,并能够支持标准化指标体系,提供对基础资源监控指标及日志的整合能力。

· 加强AI能力
通过机器学习/AI技术使用更高效的数据分析流程和算法模型来分析APM及其它数据的结果,以提供比人工监控更快的发现和解决问题的能力。

· 支持定制探针或兼容开源探针
客户能够对现有探针进行定制,或是客户自己遵循开源协议(如:OpenTracing)开发的探针,甚至现有的开源平台探针,如:SkyWalking、Pinpoint等。

· 针对微服务的新的定价方式
不再局限于探针数量的定制模式,提供更加灵活且高性价比的方案,如:按采集数据量计费、按采集时长计费等。

· 与企业现有IT系统的有效对接
对够对接已有监控系统如:基础资源监控、日志监控、网络流量分析,实现统一的监控平台。
与CMDB、ITSM、CMP系统对接的能力,提供从资源到应用的全维度管理视角的数据。
结合自动化工具,实现应用级的自动化运维能力。

总结起来其实就一句话:超越监控,向可观测性迈进。

知而不行是未知,善始才能善终

莎翁说过“一千个人眼中有一千个哈姆雷特”,即便是在这个行业里沉浸多年的人也未必看得通透。放眼整个APM江湖:有的人换了赛道不再说自己是这行了,有的人拉了关系来证明自己骨子里的基因已经变了,还有的人直接从之前的卖艺不卖身改成卖身不卖艺了。不可谓不是风起云涌,暗藏危机。

所以,豪言壮语的口号显得不那么重要了,重要的是能不能做到。“未有知而不行者,知而不行,只是未知”,阳明先生几百年前就给出过答案。对于一个行业来说这是一个蜕变的过程,会有人抵触改变,似乎改变总是伴随着推倒重来,这的确不够理性。

机遇和挑战并存的才是理性的市场,历史淘汰的始终都是不适应改变的人。改变本身并不可怕,可怕的是你根本不知道该怎么改变。“千招会不如一招绝,样样通等于样样松”,这在江湖里至少一直算是个至理名言,可以共勉。

谨以此文献给那些在自己行业里一直专注的人,因为他们始终相信“坚持初心,方得始终”。无论我们说什么,APM市场依旧在那里,或衰或荣并不由个人意愿决定。

  • 可视化运维是指通过图形化的展示方式,对系统的监控、运维、分析等工作进行可视化处理,方便管理员或者运维人员进行系统性能分析、故障诊断和处理等操作。可视化运维系统通常通过可视化的仪表盘、图表、日志等形式呈现数据,从而使系统运维人员可以直观、快速地了解系统的状态,发现问题并进行处理。

    2023-03-20

    继续阅读
  • 业务运维是一种精细而深度的管理过程,它旨在通过规范的操作和持续改进,提高企业的效率和竞争力,降低风险并增加客户满意度。本文将深入探讨业务运维的概念、重要性以及对企业发展的意义。

    2023-08-03

    继续阅读
  • 在现代生活中,移动应用已经和人们生活各方面都绑定在了一起,成为了不可或缺的一部分。在使用如此频繁的情况下,如何去保障用户体验就成为了企业竞争的关键。移动应用性能管理系统​可以对移动应用的综合性能进行高效管理,以及科学评估和优化,给相关企业带来了非常大的助力。

    2023-08-22

    继续阅读
  • 随着科技的不断进步,视频监控系统在各领域中发挥着越来越关键的作用。保障人员安全、提高生产效能,已经成为许多组织和企业的首要任务。本文将针对视频监控系统运维方案​展开探讨。

    2024-01-15

    继续阅读
  • 在今天的数字时代,网站和应用程序的性能对用户体验至关重要。用户希望快速加载的页面和流畅的交互,而web前端性能监控​是确保这一目标实现的关键。了解关键指标有哪些,对优化web前端性能而言至关重要。

    2023-09-22

    继续阅读