出品 | CSDN云原生

AIOps由Gartner于2016年提出,旨在使用大数据、机器学习等方法来提升运维能力,其目的是进一步降低自动化运维中人为干扰,最终实现运维无人化、自动化。


(资料图片)

CSDN云原生系列在线峰会第16期“AIOps峰会”由用友畅捷通助理总裁熊昌伟担任出品人,携手阿里云资深技术专家周琦、复旦大学计算机科学技术学院教授及擎创科技首席数据科学家王鹏、安信证券智能运维负责人权宁升以及用友畅捷通SRE负责人文吉,共同分享AIOps应用实践。

下面先简单回顾本期峰会的内容。关于本场峰会的演讲视频、完整文章将在CSDN云原生公众号陆续发布,敬请关注。

AIOps场景下的异常检测与根因分析

阿里云资深技术专家周琦从云平台的角度,分析了以算法+数据为组合的AIOps对稳定性的重要性,并表示多种粒度的异常检测、基于统计、深度学习的根因分析能够有效降低“不确定性”带来的复杂性。

智能运维场景的拆解(系统角度)

随后,周琦分别从机器学习工程、时间周期以及业务场景角度对AIOps应用场景进行了拆解,展示了算法实践的思路。

关于智能运维中算法落地的一些思考

复旦大学计算机科学技术学院教授、擎创科技首席数据科学家王鹏指出,当前指标异常检测、日志智能分析及告警智能处理在实际应用中的效果不尽如人意。同时,王鹏也对问题背后的原因进行了深度剖析。

问题分析

王鹏表示,算法正在智能运维领域发挥越来越大的作用,但是算法落地仍有大量问题亟需解决。算法作为一种运维的辅助手段,不能一蹴而就,需要有持续优化的能力。

智能运维在安信证券的应用实践

对稳定性、安全性要求都极为严苛的证券行业是如何有效使用AIOps的呢?

安信证券智能运维负责人权宁升结合自身经验对智能运维在安信证券的应用实践进行了详细分享。

数据平台架构

此外,权宁升还对证券IT运行保障系统的构成以及AIOps在混沌工程等场景中的运行进行讲解并分享了实际应用案例。

用友畅捷通如何通过智能运维来提升稳定性保障

用友畅捷通SRE负责人文吉为大家展示了用友畅捷通是如何使用智能运维为企业提供稳定性保障的。文吉表示,“在线”成为时代的新本能,数智化是小微企业转型的必由之路。

中小企业面临转型困境

对于如何基于智能运维提升稳定性,文吉从实际案例入手,为大家提供了建设新思路:通过监控中心的升级,将AIOps赋能于2-5-10标准量化,再通过模型与算法的结合对产品运行状态和客户使用情况进行精细化分析,最终形成了独有的态势感知系统。

彩蛋来啦

关注【CSDN云原生】公众号获取诸多资源~

回复【AIOps峰会】获取本场峰会讲师PPT;回复【学习】,加入“云原生官方交流群”,与1万+云原生爱好者讨论技术趋势,实战经验;回复【志愿者】,参与专家技术分享的一手整理过程,并获得相应权益,期待你的加入~

推荐内容