微信公众号
关注公众号了解更多
服务热线:
400-898-9580
联系邮箱:
hezuo@tingyun.com
4种充分利用AIOPS的方法
2021/12/28

随着AIOps的使用,加速的企业数字化的进程以及服务客户的能力。

AIOps为开发人员及其DevOps和SRE团队提供了一个快速、自动化的解决方案,可以在他们的生产环境中提供可观察行和精准的洞察力,从而使得这些团队可以更近容易的解决万体,找出根本原因,并在问题影响最终用户体验或者阻碍业务之前解决掉。

预计在今后一年中,各企业预计生产环境服务部署将增长10倍,但随着这些服务部署激增,服务和业务流程也将变得更加复杂。但事实是,并不是所有的解决方案都可以应对这种增长。但是AIOps解决方案能够更好的可伸缩扩展到服务相应的业务流程中去,并且可提升操作效率。

随着DevOps团队继续采用渐进的交付模式例如,Canary, Blue/Green和Feature Flags来升级和替换单个服务的监控,以及生产部署和配置更改的数量将有较大规模的增长。通过AIOps的充分利用,DevOps团队将在以下几点中得到提升。

应用性能管理

1.创建测试驱动操作。

例如,SRE可以搭建一个由AIOps解决方案监控的测试环境。通过在这个测试环境中加载程序和注入一些问题,从而来验证AIOps解决方案的自动修复脚本,AIOps解决方案在问题不可避免的出现时是否能及时进行自动修复代码的能力将得到进一步验证。与SRE脚本编写和代码部署不同,AIOps可以主动的部署以便于立即解决问题,而这正是通过预先对于响应的场景进行测试学的从而形成的一种能力。

通过在测试环境中进行脚本化的测试服务来增强AIOps的学习处理能力,而不仅仅是发现问题的能力。

2.将部署/配置数据推送到AIOPS

将事件链接到被监控的实体可以使AIOps更容易分析和关联行为——这是一种超越简单的相关性的关联能力,可以提供更精确的根因分析和解决方案。从而在报表中关联上下文的部署信息(既部署、负载测试、负载均衡、配置更改、服务重启等)当配置变化对用户和服务协议(SLA)产生影响是,可以立即通知相关团队,在最终用户受到影响之前,可以更容易的提高对问题的识别和自动处理能力。

3.让AIOPS驱动你的行为

将部署信息和上下文推送到AIOps平台会使人们更加关注交付活动,从而为DevOps团队提供新的数据来源,以便更好的为未来的决策提供信息。

AIOps解决方案可以在自己的报表中生成数据,可以更好的为团队提供比较测试运行和基线结果的选择和上下文,从多个测试和部署中提取数据,以识别在测试期间或正式上线前的问题定位。将这些信息推送到AIOps平台中,这将进一步加快软件交付的能力,并未交付过程中问题的快速定位和处理提供便利。

4.产生自动化的业务复原力

应变能力和适应能力是衡量当今生产质量的关键指标。AIOps解决方案可以通过自动化的任务管理能力来保持业务系统的弹性扩展、可用性和系统稳定。

更重要的是,将AIOps与交付自动化集成在一起直接将配置和部署上下文打包在解决方案中,将进一步是AIOps能够更好的进行异常的根因定位,如果生产环境中的负载测试影响到了整个系统的稳定,将会对相关团队进行告警,如果行版本的服务迭代导致有较高的故障率,也会提醒相关的研发团队,并提供详细的根因分析数据,以便团队进行问题处理。

当今,更大的业务弹性意味着更少的问题产生、更一致和更可靠的性能,以及更强大的数字体验,所有这些都是DevOps团队和其客户的挑战。

随着当今IT环境变得越来越复杂、容器化、多云和多集群,DevOps团队将更加需要利用AIOps来辅助进行环境管理,这将有效的大规模的推动业务成果、客户体验和关键业务的稳定。确保相关团队配备的正确的AIOps服务,将是优化数字化管理的第一步,从这里开始,有效的利用AIOps的能力,将使相关团队发挥出更大的价值,将能够更加快速的推动业务的发展。