银行业AIOps应用现状研究
银行业AIOps应用现状研究
运维工程师应该深有体会——运维越来越难做,被海量高速的运维监控数据所淹没。AIOps的引入有其重要性和必要性。本文对银行业AIOps应用的真实现状进行了研究和分析,对于正在考虑或已经进行相关建设的同行具有参考价值。
1、背景
随着业务创新以及分布式架构、微服务、大数据、人工智能等技术演进,使得银行业IT运维面临软硬件数量激增、应用和架构复杂化、变更频繁、调用链显著增长、运维数据井喷等困难和挑战。
运维技术在各行各业的重要性越来越高,特别在商业银行使用更广、更深,由于商业银行数字化程度越来越高、系统规模越来越大、组件监控粒度越来越细、监控数据量越来越大以及新技术和新组件的不断引入,这些导致运维越来越难做,运维工程师也被海量高速的运维监控数据所淹没。
2、为什么需要AIOps?
AIOps是基于海量数据的采集与治理(数据化)、AI算法的深度应用(智能化)和端到端的自动化打造平台化的智能运维目标,实现全景监控与自动化、智能分析与决策、故障自愈与无人值守。AIOps的优势是有利于知识和经验的积累。在智能运维体系中,运维人员在角色转变的同时也实现了技能提升,从最初的人工运维,到部分自动化+数据分析,实现数据驱动的IT运维,最终走向高度数据化、高度AI下的完全自动化+运维专家模式。
随着新质生产力的发展、数字化转型的持续推进,现代数字业务需要监控和管理的系统变得更加复杂、更加分散,需要AIOps工具来实现跨IT堆栈的持续洞察,同时这种洞察力变得越来越重要。随着商业银行数字化转型的加速,IT系统产生的运维数据量呈现爆炸式增长,传统的运维方式难以应对海量数据的处理和分析,需要AIOps利用人工智能技术对数据进行自动化分析和处理,提高运维效率;现代IT环境由云化、容器化、微服务等多种技术构成,系统复杂性大幅增加,AIOps通过智能算法和机器学习技术,能够更好地识别和管理这种复杂性;AIOps可以自动关联和分析来自不同来源的事件,快速定位故障原因,同时,通过对历史数据的学习,AIOps能够预测系统潜在的问题。
本文原文来自CSDN