可观测性在软件工程中的好处是什么？

点击联系发帖人 时间：2022-06-08 12:20

软件可行性分析包括哪些方面

目前我们已经由传统的IT时代迈入了数字化DT的时代。如何面对新技术趋势的挑战，构建面向云时代的智能监测平台，让云上应用获得更好的保障，是如今摆在每一个企业面前的一道难题。

云计算带来了集约化、效率、弹性与业务敏捷的同时，对云上运维提出了前所未有的挑战。如何面对新技术趋势的挑战，构建面向云时代的智能监测平台，让云上应用获得更好的保障，是如今摆在每一个企业面前的一道难题。

在日前的【T·Talk】系列活动第八期中，51CTO内容中心特别邀请到了乘云产品VP张怀鹏做客直播间，为大家分享打造云时代数字化观测利器的经验与思考。【T·Talk】也将本期精彩内容进行了整理，望诸君能够有所收获：

数字化转型浪潮下的数字化运营痛点

数字化转型与数字经济建设是当前时代的大趋势，数字化转型可以说是人类历史上的第四次工业革命。我们日常的办公方式、支付方式、购物方式，包括出行方式等，无时无刻不受到数字化的影响。简单来说，目前我们已经由传统的IT时代迈入了数字化DT的时代。

在数字化DT的时代，数字化转型几乎重新定义了当前企业的业务以及业务体验的方式。但随着各行业数字化转型的不断深入，越来越多的数字化应用事故也开始逐渐显露。例如年初某省市的健康码崩溃、核酸检测系统异常等，都对社会面造成了非常大的影响。

据调查，目前60%的CEO认为数字化转型非常重要，企业也在这部分人群的带领下大踏步地向数字化转型和人工智能演进。然而与此形成鲜明对比的是，95%的企业应用并没有得到有效的监测与关注。

当前数字化运营手段，大多都产生于传统的数据中心时代，大量的工具或技术都没有考虑到云计算的场景。随着云计算的普及，信息化的场景发生了天翻地覆的变化。应用本身的复杂性呈现爆炸式增长，分布式越来越多，依赖关系也越来越复杂，软件迭代节奏也越来越快。在这样的场景下，企业急需构建面向DT时代的，基于业务和数据流的一套解决方案。

DT时代产生了太多新的技术、新的场景，例如目前热度很高的云原生，云原生的要求加速了传统运维向应用运维的演进。传统场景存在大量基础设施，但随着业务上云，基础设施都将托管给运营商或运营者，企业不再需要为传统的机房管理、弱电管理、硬件的监控、裸金属的监控、UPS配电及温湿度烦恼。因此传统的设备运维也演变成了Site reliability以应用为重心的运维，企业对传统运维的投入将会变得越来越少。

目前来说，我们处在向智能化运维转型的阶段。现在需要做的是让数字化运维、IT运维变得更轻、效率更快、成本的支出更少。运维团队的精力需要集中在企业业务本身，业务才是运维人员所需要关注的重点问题。这些都会带来对智能运维的需求。

企业通往智能运维的典型技术路径

关于智能运维，Forrester和Gartner曾在报告中进行过定义：AIOps是一套将AI和数据科学应用于业务和运维的数据领域，以建立关联，并能够提供实时的规范性和预测性答案的软件系统。AIOps可以是一套软件系统，因此它可以是一个落地的产品。AIOps能够增强并部分取代传统的主要的IT运维的功能，包括可用性和性能监控、事件关联和分析、IT的服务管理和自动化。

AIOps ，面向的是Operations，Operations是需要覆盖观测、管理与处置三方面。但目前业界整体水平更多的是聚焦在观测层面。Forrester对此也给出了一个经典的语句：AIOps承诺了更强的可观察性和稳定性。

Forrester认为，当前AIOps的一个核心价值，就是将事前能力增强，提升和扩展你的可观测能力。

观测性最早诞生于控制理论中，指系统可以由外部输出，推断其内部状态的程度。在IT领域中，Gartner将可观测性定义为软件与系统的一种特性。具体指根据系统生成的遥测的数据来判定当前系统的状态以及系统情况，这种能力便是可观测能力或称可观察能力。

传统的监控的技术和工具很难跟踪当前的越来越多的分布式架构中的通信路径和依赖关系，在云原生的场景或者在云端的场景，依赖关系非常复杂，不再像传统很多的单体架构的应用一样。而可观察性能够更好地控制复杂系统，通过可观察性三大数据支柱能够非常直观详细地了解到复杂系统的方方面面。

可观察性不仅只服务于运维，还能够服务于开发部门、SRE部门、Support部门、市场部门与Business部门。因此如果能够将AIOps和可观察性融合为一体，打造出来一体化的平台，将会得到非常完美的产品，能够一举两得。

3、企业通往智能运维AIOps 的两条典型技术路径

企业通往IT智能运维的两条典型的技术路径可以形象的归纳为“外挂AIOps”与“内生AIOps”。外挂AIOps，通过旁路的方式将AIOps的平台植入企业IT运维的环境中。AIOps是一个独立的算法平台，通过接入企业异源异构的数据，而后通过数据工程师梳理数据之间的依赖关系，并借助大数据处理技术，实现项目制的交付。

内生AIOps强调的是一体化的技术路线，通过内生AIOps引擎，能够实现数据处理全流程的闭环，不需要数据工程师参与。类似于快递的流程，寄件人的物品相当于数据。拿到数据后，由快递员实行封装、仓储、调度、运输等操作。但最终收件人收到的就是这个物品，中间的所有的处理环节是不需要寄件人和收件人去处理的。内生AIOps强调这一能力，将AI的能力嵌入到一体化观测平台当中。

外挂AIOps一般使用传统的机器学习AI，这种技术本质上是一种统计方法，将Metric、log、事件等信息进行关联分析，旨在降低告警的噪声。通过机器学习AI，我们能够获得一组关联告警。因此其需要一定的时间周期，一般来说外挂AIOps需要人工或历史记录去提出一个推荐性或者可能性的根因。

同时，外挂AIOps需要大量外部数据的依赖，外挂AIOps厂商通常只做算法平台。数据的清洗、CMDB的实体间的依赖关系等等，都需要外部的数据。因此，想要落地外挂AIOps，需要企业的信息化运维的体系建设非常成熟，需要有调用数据的前提、有APM的产品、且可观察性得做的相对完善，才能去做外挂的AIOps。

内生AIOps则提供了一个确定性的人工智能分析，将确定性的分析结果作为目标，也就是在问题发生后，问题发生原因的根因是确定性的，且是一个接近实时的结果。内生AIOps维系了一张实时性非常高的矩阵式依赖关系地图，这项技术不需要去依赖传统静态的CMDB，而是这张依赖关系地图本身就相当于一张实时的CMDB，能够将依赖关系进行实时的变化，借助内生的关系实现了管理分析。

企业如何决策选择适合自己的技术路径？

在AIOps的落地层面，企业需要考虑的问题也比较多。从企业管理者的角度来说，除了成本、团队等基础问题外，还需要考虑不同部门之间的平衡，以及成本、稳定性和效率之间的平衡问题。AIOps的目标，是既要解决问题，还要合理地解决问题。在保证成本的同时，最大化地提高企业业务的稳定性与效率。

在Forrester的一篇报告中提到，企业落地AIOps时有以下几点关键能力需要着重思考：

AIOps平台与ITOM工具链是否能够无缝集成，是否能高度实现自动化的能力
AIOps平台非常看重原生数据，原生数据包括云原生的依赖关系、云原生机器数据的信息
全服务的依赖关系的地图的自动化和全景的构建
AIOps的未来是智能化的观测感知和自动化的落地实践
根因分析和事件补救计划的自动化程度
现代技术运营需要智能化和自动化

从数据处流程上来看两种技术路径的差异：

传统AIOps平台，也就是外挂AIOps平台在数据处理过程当中会使用到很多工具拼凑组装，打造一套摇摇晃晃的大数据系统。如果发生工作人员的更换，则很有可能给新的交接者遗留大量的技术债务。

第一步的数据收集环节，需要依赖大量开源与商业工具。第二步将数据注入大数据平台。第三步，人工梳理数据关系以及清洗数据。前三个步骤是非常耗时的。第四步，发现问题、定位问题，这一步AIOps厂商才会参与进来，厂商团队需要落地到客户现场驻点按需打造。厂商会询问需求，并提供相应服务。第五，构建仪表盘。第六，系统的扩展，随着应用系统的规模的扩大，整个系统呈线性增长。

整个流程中，数据工程师需要花费将近80%的时间用来做数据的清洗、采集和组织，整个方案需要尖端的运维领域人才，既要是运维专家，还需要懂算法、懂开发。本身AIOps是一套支撑的系统，是用来解决问题的，但外挂式AIOps很有可能会使运维变得更重，需要一支专门的团队来维护AIOps平台本身。

内生AIOps的数据处理流程则非常简单，一个工具即可解决数据采集。且由其是一个高度商业化的产品，且具有开箱即用的仪表盘能力，包括引擎等。因此后续的处理流程都是黑盒的，无需企业过多关心，也不需要业务工程师懂算法并具备SRE的技术水平。

同时，内生AIOps会随着企业业务系统的规模的扩展，呈非线性的增长。包括用户的团队以及产品的整个系统，都是呈非线性增长的。整个方案布置下来的话，企业只需要要安装一个Agent，后续很多都是自动化的能力。这使得企业的运维人员能够将精力聚焦企业自身的业务。

业界需要新一代的软件智能平台，能够全覆盖整个数据处理流程。将客户想要的结果直接交付，而不是呈现原始数据。总的来说，在外挂AIOps与内生AIOps两条技术路径当中，更推荐企业使用内生的AIOps，其属于智能运维的新的范式。

内生AIOps助力云原生运维化繁为简

内生AIOps平台的目标是构建一个集AIOps和可观察性于一体的一体化平台。其需要具备观测能力，且观测能力要以应用监控为中心，应用监控才是面向最终用户的现象层。同时，还需集成基础设施的监控，包括云平台的监控以及黑盒的监控。最后还需要具备面向前端的数字体验的能力。

新的AIOps平台需要打造出持续的自动化，从数据的接入到数据结果的输出实现自动化。需要具备事前能力，拥有预测与预警的能力。

新的AIOps平台需要提供高阶的可观察性，并不只是把原始数据、原始零件展示给企业，而是要关注现象、关注体验，给出准确结果，这样才能尽可能地减少海量噪音对企业带来的影响与干扰。

内生AIOps的数据处理模型，有很多差异化的地方，比如在数据采集上面强调一个Agent的能力。在数据处理上面，我们强调指标体系，指标体系的构建和传统的方式有所不同，我们强调内生AIOps内生于一体化平台。

内生AIOps平台主要会从以下五个方面帮助云原生运维实现化繁为简：

内生AIOps平台能够直接获取优质的观测数据
能够打造持续的自动化能力，对于运维来说，工作效率会更高
平台能够构建一个实时的矩阵式的拓扑，按图索骥
能够即时输出影响面分析

1、直接获取优质的观测数据

首先，直接获取优质的监测数据。一句比较经典的总结是“高质量的观测来源于高质量的遥测”，高质量的后端的分析一定要求高质量的前端的遥测数据的产生。可观察性关注三大支柱，如果要做高阶的可观测性、内生的AIOps分析，需要五大支柱，除了传统的追踪数据、指标、日志数据，还需要非常关键的拓扑数据与代码数据，数据的质量能够直接决定模型的上限。

直接获取优质的监测数据，这些数据一定是实现非侵入式的、自动化的采集，不用修改源代码、业务与应用，且能够实现上下文信息和自动化的结合。上下文信息能够辅助实现真正的根因分析，能够帮助根因分析提取高保真的背景的信息，能够帮助平台构建实时的服务流图和拓扑图，进行依赖关系。包括矩阵式的关系拓扑的技术，这些上下文信息也是非常关键的。

拓扑图，主要展示整个应用环境的依赖关系，包括垂直的堆栈和水平的堆栈。服务流图是从一个服务或请求的维度去提供整个交易的视图，通过服务流图和拓扑图，可以说明服务之间调用的序列。服务流图显示的是交易的整个分布的序列，是有序的，而拓扑图则是更高级的抽象，显示的是依赖关系等。

直接获取优质的监测关系需要用到商业化的Agent的技术，虽然目前市面上已经有许多开源的工具或者免费的工具，但商业化Agent技术有着以下几个开源工具所不具备的优势。

采集的代理探针的稳定性、安全性和可靠性有保障
探针对宿主机、对于核心业务的资源开销、性能影响有保障
部署和插装，包括变更，能够更少地使用手工操作
监测能自动植入到动态的方法或者容器类的这些组件当中
各种指标采样精细，原生高保真
有足够的信息和上下文可供建立一个统一的数据模型

以上优势是很多免费的工具不具备的。内生AIOps平台依赖于One Agent技术，Agent拥有边缘计算的设计，在边端端点上做了很多数据的聚合、数据的清洗的工作。

内生AIOps平台的能力，旨在构建持续的自动化。监测复杂的云原生环境，一定离不开自动化。包括自动化的部署、自动化的适配、自动化的发现、监控、注入、清洗等一系列自动化。在复杂的云原生环境当中，凭人力是难以了解这些端到端的业务的，所以需要用高度的自动化能力来作为辅助工具，去辅助自动运维。

3、构建实时矩阵式关系地图

内生AIOps平台能够构建实时矩阵式的拓扑。能够按图索骥，看到图纸当中水平方向，比如服务层的依赖关系图，还有容器层、主机层、进程级等。垂直向则是服务是跑在什么容器上，这个容器对应的是哪一个进程，这个进程是落在哪一个云主机上面。

4、即时输出影响面分析

输出影响面分析则相当于网络安全的思维，在运维当中也是一样。系统出现了故障或异常，其影响面有哪些，会影响哪些用户、会影响哪些服务、影响哪些应用，其根本原因是什么。通过自动化的手段和技术，把结果输出给用户，并不需要运维人员人工分析。

5、直指根因，见证成果

最后，自动化运维非常重要的能力，就是直指根因，见证成果。传统的技术需要基于知识库、基于CMDB、基于因果推断不同的方法，而AIOps则提供内生型根因定位。其能够打通数据依赖关系，除了对象间的依赖关系，还可以打通不同数据类型间的依赖关系，比如调用链、日志、指标间的依赖关系。其提供的是一个实时的根因定位，具有高度的适应性，在低开销的同时，准确率非常高。而且具备无监督的技术，不需要过多的人工辅助去实现这些能力的交付。

企业若想数字化转型成功，需要做到所有的应用、数字化服务以及支撑其运行的动态多重云平台都能完美地工作，而且要每时每刻做到这一点。

这些高度动态化、分布式的云原生技术，与传统的场景截然不同。这导致由微服务、容器及软件定义云基础设施所带来的复杂性在当前一发不可收拾。这些复杂性超越了团队管理能力的极限，并且还在不断扩大。要想随时了解在这些瞬息万变的环境中所发生的的一切，就必须提升可观测与智能运维能力。

我们需要借助高度的自动化与智能化技术，让云原生运维变得更轻、效率更快、成本的支出更少，让企业团队的精力需要集中在企业业务本身，真正的迈向智能化运维时代。

张怀鹏，乘云产品VP。2017年加入杭州乘云数字技术有限公司，负责【DataBuff 一体化观测与智能运维】产品线日常管理，担任IPD集成产品开发团队经理，参与市场管理、需求分析、团队协同、流程结构化、质量控制等工作。

}

用友网络科技股份有限公司(以下简称“用友网络”)是领先的企业云服务与软件提供商。用友网络的商业创新平台YonBIP以 iUAP为技术底座,为企业提供业务中台、数据中台、智能中台、技术平台、连接集成、低代码开发等服务与解决方案。作为新一代云原生数字基础设施,用友网络iUAP技术平台在生产环境中拥有600多个微服务,同时支持十几条产品线,在部署了容器化之后会产生大约3000多个微服务实例,需要通过上千个节点支撑微服务的运行。而且,云原生和微服务架构下的典型特征是技术栈比较深,技术栈采用的中间件组件也比较多,这为保障整个技术平台的稳定性带来挑战。

为此,用友网络采用IBM Observability by Instana APM (以下简称“Instana”)部署了新的微服务运维监管平台。Instana 作为一个自动化应用性能监控解决方案,基于开源技术,支持传统环境和现代化云原生环境中上百种技术栈,实现技术栈自动发现和监控,全面关联相关信息并定位故障,提供全面的可观测性。

用友网络iUAP 技术平台总经理何冠宇表示:“IBM 的Instana产品拥有出色的平台能力,它以大数据为基础,具有强大的分析能力。我们和IBM成立联合方案组,把 Instana产品在我们的生产环境里进行了完整部署,打造了新的运维监管平台,获得了更强壮的底座资源支持。Instana具有强大的代码追踪能力,从一个链路的URL请求到一个代码点、代码片断都能够追踪出来。去年我们开展了性能优化的‘秒开行动’,Instana的链路分析能力以及火焰图分析能力,快速帮助我们诊断和分析了代码上的一些问题。通过采用Instana产品,定位一个应用故障点或性能瓶颈点的时间从40分钟缩短到4分钟,效率提高了10倍以上。”

IBM中国开发中心CTO、IBM鲁班计划负责人赵军伟表示:“很高兴用友网络能够借助IBM鲁班计划,利用我们实验室的环境,直观地体验Instana技术如何解决云原生的业务问题,并最终把这个技术部署到用友的生产环境里,获得切实的业务价值。”

IBM Obervalility by Instana APM专注于为企业提供管理复杂的现代化云原生应用性能的各项能力,无论这些应用位于何处——移动设备、公有云和私有云以及包括 IBM zSystems 在内的本地部署,Instana 均能助企业一臂之力。Instana 的企业可观测性平台可自动构建对云应用的深入语境理解,提供可操作性见解,指导企业更好地预防和补救可能损害业务或降低客户满意度的 IT 问题,例如响应时间缓慢、服务无法正常运行或基础设施宕机等。

关于用友网络科技股份有限公司

用友网络创立于1988年,是全球领先的企业云服务与软件提供商,通过构建和运行全球领先的商业创新平台——用友BIP,服务企业数智化转型和商业创新,成就千万数智企业,让企业云服务随需而用,让数智价值无处不在,让商业创新如此便捷。用友网络在全球拥有230多个分支机构和8200多家生态伙伴,各行业众多领先企业都选择用友BIP作为数智化商业创新的平台。当前,用友网络位居企业云服务市场第一、企业APaaS云服务市场第一、中国企业应用SaaS市场占有率第一,中国ERP云市场份额第一,是中国企业数智化服务和软件国产化自主创新的领导厂商。

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175 个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000 家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。

}

今日份知识你摄入了么？

为了跟上数据创新的速度，数据工程师不仅需要投资于最新的建模和分析工具，还需要投资能够提高数据准确性和防止中断管道的技术。 有何解决方案呢？——数据可观察性，数据工程的下一个前沿领域和新兴数据可靠性类别的支柱。

随着公司越来越依赖于数据驱动，这些丰富见解背后的技术也变得越来越微妙和复杂。虽然我们收集、存储、聚合和可视化这些数据的能力在很大程度上满足了现代数据团队的需求（比如：面向领域的数据网格、云仓库、数据可视化工具和数据建模解决方案），但数据质量和完整性背后的机制却落后了。

无论你的分析界面有多先进，或者你在云计算上投入了多少，如果它提取、转换和推送到下游的数据不可靠，那就都是徒劳的。换句话说，“无用输入”就是“无用输出”。

在讨论数据可靠性是什么样子之前，让我们先讨论一下创建的“垃圾”数据有多不可靠。

在过去12个月里，我与数百个数据工程团队进行了交谈，我注意到，好的数据变成坏数据有三个主要原因：

单个数据生态系统中的数据源越来越多；
更大、更专业的数据团队。

如今，公司使用数十到数百个内部和外部数据源来生成分析和ML模型。这些来源中的任何一个都可能以意想不到的方式发生变化，而且不会事先通知，从而损害公司用于决策的数据。

例如，一个工程团队可能对公司的网站进行更改，修改对市场分析至关重要的数据集的输出。 因此，关键的营销指标可能是错误的，导致公司在广告活动、销售目标和其他重要的、能带来收入的项目上做出糟糕的决定。

由于处理的多个阶段以及不同数据资产之间的非琐碎依赖关系，数据管道变得越来越复杂。由于对这些依赖关系的可见性很小，因此对一个数据集所做的任何更改都可能产生影响依赖数据资产正确性的意外后果。

就像火星气候轨道飞行器的例子一样，一个系统中简单的单位改变就会严重影响到另一个系统的正确性。美国国家航空航天局（NASA）太空探测器火星气候轨道器（Mars Climate Orbiter）因数据输入错误而坠毁，产生了非国际单位制和国际单位制的输出，使它离地球太近。与航天器一样，分析管道在过程的任何阶段都极易受到最无害的变化的影响。

更大、更专业的数据团队

随着公司越来越依赖数据来推动智能决策，他们雇佣了越来越多的数据分析师、科学家和工程师来构建和维护数据管道、分析和ML模型，以支持他们的服务和产品以及业务运营。

沟通不畅或协调不足是不可避免的，这将导致这些复杂的系统随着变化而崩溃。例如，一个团队添加到数据表中的新字段可能会导致另一个团队的管道失败，从而导致数据丢失或部分丢失。在下游，这些糟糕的数据可能导致数百万美元的收入损失、客户信任的削弱，甚至可能导致法规遵从性风险。

坏数据带来的好消息是什么？数据工程正在经历复兴，我们非常感谢DevOps中的同行们，感谢他们提供的一些关键概念和原则引领我们走向下一个前沿领域。

下一个前沿领域：数据可观测性

从软件应用程序可靠性的角度来分析“垃圾数据”的影响是一个简单的方法。在过去的十年左右，软件工程师已经利用了像newrelic和DataDog这样的有针对性的解决方案，以确保高应用程序正常运行时间（换句话说，工作性能良好的软件），同时将停机时间（停机和滞后软件）保持在最低限度。

在数据中，我们称这种现象为数据停机。数据停机是指数据不完全、错误、丢失或其他不准确的时间段，当数据系统变得越来越复杂，支持无穷无尽的源和用户生态系统时，停机时间会成倍增加。

下面，我们将介绍数据可观测性的五大支柱。每个支柱都包括了一系列问题，这些问题总体上提供了数据健康状况的整体视图，也许你会觉得他们很眼熟？

新鲜度：数据是最近的吗？它最后一次生成是什么时候？包含/省略了哪些上游数据？
分布：数据是否在可接受的范围内?它的格式正确吗？它完整吗？
卷：所有的数据都到达了吗？
模式：模式是什么？它是如何改变的？谁做出了这些改变，出于什么原因？
沿袭：对于给定的数据资产，受其影响的上游源头和下游资产是什么？是谁生成了这些数据，又是谁依靠这些数据来做决策？

一个稳健和全面的数据可观察性方法需要通过一个集中的接口对这五个支柱进行一致和可靠的监控，该接口是有关数据健康状况的主要真实来源。

端到端数据可靠性平台允许团队探索和了解他们的数据沿袭，自动映射上游和下游的依赖关系，以及每个资产的健康状况。图片由巴尔·摩西提供。

一个有效的、主动的数据可观察性解决方案将快速无缝地连接到现有堆栈，提供端到端沿袭，允许你跟踪下游依赖关系。此外，它将自动监视你的静止数据，而不需要从数据存储中提取数据。这种方法确保你满足最高级别的安全性和遵从性需求，并可伸缩到要求最高的数据量。

这样的解决方案还需要最小的配置，实际上不需要设置阈值。它使用ML模型来自动学习环境和数据。它使用异常检测技术让你知道什么时候发生了故障。它不仅考虑单个指标，而且考虑数据的整体观点和来自任何特定问题的潜在影响，从而将误报最小化。

此方法提供了丰富的环境，支持快速筛选和故障排除，以及与受数据可靠性问题影响的涉众进行有效沟通。 与临时查询或简单的SQL包装器不同，这种监视不会只停留在“表Y中字段X的值低于Z”。

数据目录将有关数据资产的所有元数据都放在一个窗格中，因此你可以在一个视图中查看沿袭、模式、历史变化、新鲜度、数量、用户、查询等等。图片由巴尔·摩西提供。

最重要的是，这种解决方案首先通过在这五个支柱上公开关于数据资产的丰富信息来防止数据停机事件的发生，以便能够负责地、主动地进行更改和修改。

数据可观测性的下一步是什么？

就我个人而言，我对数据工程这一新的前沿领域感到无比兴奋。随着数据领导者越来越多地投资于利用数据可观测性的数据可靠性解决方案，我预计这一领域将继续与数据工程的其他主要趋势相交叉，包括：数据网格、机器学习、云数据架构和数据产品平台化。

}

绿色游网