2023年7月27日-28日,第十七届iTall金融科创峰会于上海圆满召开,来自金融企业及优质金融科技供应商的百位中高层嘉宾代表共聚现场。

基调听云受邀出席活动,技术总监王雅志在会中分享了题为《业务视角下的可观测性平台建设实战经验》的专题演讲。

可观测能力是数字化转型必备工具

数字化转型已成为热门话题,大家对于数字化转型的重要性已有一定认识。根据咨询机构的分析报告,91%的企业正在计划进行数字化转型,87%的企业认为数字化转型可能颠覆行业。从另一个角度分析,数字化转型以业务为中心,目标是提升服务和用户体验。如果企业在数字化转型过程中只关注系统可用性而忽视用户体验评估,很可能导致数字化转型失败。

失败的原因可能有几点:首先,缺乏对用户体验评估的关注和数据规范;其次,新技术带来的运维挑战;第三,IT团队和业务部门之间目标不一致,导致数字化转型受阻。因此,企业内部各个团队的目标必须一致,才能成功实现转型。

在金融行业,特别是银行领域,不管是业务上云还是正在面临的新核心改造,都被统称为新一代架构。新一代架构需要同时具备传统金融和数字金融下的稳定性、安全性、业务连续性和持续创新的能力。在这个架构的背景下,我们希望通过持续提升用户体验促进业务增长,同时能统一管理庞大的应用。然而,现实情况是我们在监控工具方面的能力不足,监控对象覆盖不全,运维体系不健全等方面面临着一些挑战。

为了解决这些问题,我们认为可观测性是企业数字化转型过程中的必备工具。一个具备自动化持续数据采集能力的可观测性平台,并利用AI和技术进行数据分析和告警,能形成全栈可观测性。同时,我们需要衡量用户体验和业务目标的标准。通过建立统一的平台和数据,促进组织内部的沟通和协调。

可观测性平台的建设并非一蹴而就

总的来说,可观测性平台的建设不是一蹴而就的,需要分阶段进行。首先,夯实数据基础,完善可观测性数据。然后进行数据治理,按照分层标准实现数据互通。最后,增强可观测性,利用AI和机器学习实现落地场景。

通过这三个阶段完成可观测平台的建设。这三个阶段被称为融汇、融通和融智。接下来,我将从这三个方面简要介绍具体实现方式。

在融汇阶段,我们需要完善可观测性数据。为此,我们需要制定标准,通过分层模式确定企业业务架构中缺失的数据,并通过技术手段进行数据采集。在服务端实现方面,我们采用一体化探针进行数据采集,并通过Opentelemetry标准实现对第三方数据的采集,利用eBPF技术完善网络指标。在用户端,我们通过模拟用户体验和真实用户体验采集数据。通过这两个阶段和维度,完善了整个可观测性数据的采集能力。

采集完成后,进入融通阶段,从两个维度来实现。首先,从技术架构层面,横向打通从用户端到基础架构端,纵向打通从业务到基础架构。第二个维度是从组织架构的角度,通过数据打通实现业务部门和IT部门之间的沟通和协作,达成一致的目标。

在融智阶段,强调基于告警事件和AI能力进行数据分析。通过问题的回溯机制,我们可以追溯整个事件或问题的路径,找到问题的根因,确定故障影响的业务系统范围。通过这种方式,实现了整个可观测能力构建。

案例分享

最后,分享一个银行客户案例。他们的业务系统中80%已经上云,采用微服务架构,而剩下的20%建立在传统的稳态架构上。在转型过程中,如何在保证业务连续性和稳定性的前提下,实现业务快速迭代和创新。在新一代架构和传统架构“并存”情况下,如何保障“敏态”和“稳态”的IT运维,这是他们正在面临的业务挑战。

我们通过手机银行客户端的OneSDK能力,结合用户旅程分析,解决了客户的业务流程和用户体验的监控问题。

在服务端方面,我们面临了一些挑战,客户实际环境相对复杂,核心系统部分采用C语言开发,还有部分系统采用私有协议框架,经过多次交流和讨论,最终采用Onetrace+日志溯源方式实现C语言系统的监控,并适配了银行私有协议框架。通过稳态和敏态的打通,实现了“双态”下的全链路追踪。我们的目标是打造最好的智能可观测平台,让运维更简单,助力企业数字化转型。

基调听云智能可观测性平台

基调听云智能可观测性平台围绕企业的信息化与数字化业务提供一套全面覆盖终端用户体验、应用性能、业务性能、基础设施和多云环境的基于AI的智能可观测性平台。经过大量金融、运营商等客户的生产验证,高效保证企业数字化业务稳定运行,提高SLA,降低MTTR。该平台持续自动化的获取数据,辅以AI技术,持续的自动分析,自动告警,并能能够主动提供答案,做到全栈的可观测性,帮助客户持续优化用户体验、提高研发运维效率和加快业务创新速率,实现助力企业加速数字化转型,提升企业数字化竞争力。

  • 近日,由互联网周、eNet研究院、德本咨询联合发起的“2022智能运维企业TOP50”榜单中,基调听云再度入选,且综合排名较去年提升5位!

    2022-07-14

    继续阅读
  • 保障系统稳定性是现代软件开发中最具挑战性的问题之一,也是确保业务连续运行的重要因素。云服务、大型互联网平台、新型网络和关键业务的稳定安全运行,是我国信息通信行业高质量发展的基石,也是我国数字经济快速发展的必要条件。因此,针对系统稳定安全运行的技术研究和实践推广具有重要意义。

    2023-07-25

    继续阅读
  • 近日,基调听云荣获2023数字化创新突破技术奖项,这是对我们在智能可观测性领域持续创新和技术提升的认可。自基调听云智能可观测性平台发布上线以来,我们一直致力于为广大用户提供更加智能、稳定、高效的运维服务,并不断优化底层技术能力以加强客户体验。

    2023-08-21

    继续阅读
  • 基于云原生的轻量级框架在云上通过敏捷开发快速实现数字化转型的业务,目前是比较流行的做法。但是享受云原生技术带来的敏捷和便利的同时 ,技术团队也会面临一些新的挑战,比如上层应用复杂度的增加,出现问题时,分析需要使用不同维度的工具,这意味着服务维持、维护运营会更加的困难。

    2023-10-24

    继续阅读
  • 2021年蒲公英企服开放平台1024开发者活动日前在线举行,中国应用性能监控和智能运维领军企业基调听云CEO赵宇辰与开发者进行了深入的探讨交流。

    2022-01-18

    继续阅读