本期听云大讲堂给大家分享的内容是观云平台数据采集方案,将主要围绕方案核心理念、业界现状及第三方指标采集的统一性原则三点进行展开。

 

 

 

观云数据治理的方案:核心理念

 

 

可观测性数据主要是由:指标(Metrics)、追踪(Trace)和日志(Logs)其他信号量组成的,数据治理的痛点在于,这些数据通常来自不同的源头,不同的协议和数据格式,最终被存入隔离的各个系统中。

 

这导致了严重的“数据孤岛”问题,使得运维和开发人员在故障排查和性能分析时,需要在多个看板间反复切换、进行人工的关联分析,这样的排查方式效率低下,且难以快速定位根因。

 

数据治理的核心目标,正是要打破这些数据孤岛,通过统一的平台、统一的规范对数据进行采集、加工和关联,让数据不再是离散的点,从而释放其真正的价值。

 

 

 

 

业界现状与观云方案的差异化

 

 

目前业界的通用做法是:先接入,后治理。也就是将各类数据接入后,通过丰富的仪表盘(Dashboard)进行可视化查看。观云采用的方案是 “采集即治理”。

从采集数据产生的源头开始,通过统一探针(UniAgents)在采集数据时直接将基础设施数据、APM的数据关联在一起,从而完成关键数据的关联。

这意味着,数据在上报之初就已经建立了内在的、准确的关联关系,而非在事后再进行匹配和处理,极大地提升了后续关联分析的效率和准确性。

 

为了实现数据集成,观云平台采集方案遵循两大核心原则:

· 协议统一(Unified Protocol)
以 OpenTelemetry (OTel) 作为数据采集和传输的绝对标准协议。OTel是CNCF旗下公认的可观测性事实标准。

· 语义统一(Unified Semantics)
描述相同业务属性的字段,在不同数据源中保持一致的名称和数据类型。这为了实现高质量关联分析的基础。

例如对于“主机IP”这一属性不同数据源有不同的名称,host.ip、host.address、instance_ip。

观云采集器会在数据采集阶段即进行标准化处理,将所有来源的该属性统一映射为 host.ip。在后续进行故障排查和分析的时候,系统都能毫无歧义地进行精准关联、检索、分析。

 

 

 

 

强大的数据生态接入能力

 

 

听云系统支持广泛的默认数据源:Zabbix、Prometheus、阿里云、华为云等其他云厂商,并且可以通调用 API 和配置 SQL 查询数据库的方式获取数据。
更多内容敬请关注【听云大讲堂】技术篇,下一期我们将为大家带来基于可观测性的应用安全态势管理平台的内容分享~

推荐阅读

  • 随着科技的不断发展,企业管理也在不断地追求更高效、更智能的方式。在制造业领域,产品配置管理系统已经成为了一种非常重要的工具,它可以帮助企业在产品设计、生产、销售等各个环节中实现更加精细化的管理。本文将详细介绍产品配置管理系统的应用领域,以及它在各个行业中的具体应用实例。

    2023-12-13

  • 随着互联网的快速发展,各行各业都离不开信息技术的支持。而在信息技术的背后,运维监控告警平台​扮演着关键的角色,能维护各大企业和机构网络和系统的稳定性、安全性和高效性。那么,运维监控告警平台的具体作用是什么?

    2024-01-11

  • 在重大节假日或重大业务事件如“春晚”、双“十一”、健康码压测、银行灾备演练等期间,我们经常会面临业务系统高峰期的访问压力。为了保障系统的稳定运行和提供舒适的用户体验,应用性能管理软件成为不可或缺的工具。通过深入分析实时监控数据、及时发现问题、提出优化建议,并协调相关厂商和技术人员进行优化,应用性能管理软件可以帮助我们应对业务中断的挑战,提升业务稳定性和用户体验。

    2023-07-18

  • 随着互联网应用逐渐广泛,现代生活中,上网、电脑、手机都是人们必不可少的部分。互联网的应用承载着整个社会以及人类生活的重任。网站就是互联网中一个个交流互通的平台。每一个用户都会在网站上进行搜索以及使用。还有许多大型重点企业、教育企业、政府企业都会在网站设立官网等。那么,网站性能测试的重要性就尤为突出了。

    2023-04-18