经过两年多的努力,在 2020 年微众银行智能化运维建设终于取得了明显成效,在智能监控领域的异常识别及根因定位方面发挥了巨大作用,甚至可以做到了秒级异常发现与定位 。CMDB 系统(配置管理平台 Configuration Management Datebase)作为智能化运维体系的基石与保障,除了承担存储和元数据支撑以外,也为智能化运维体系的正常运作、敏捷扩展提供了有力保障 。本文将结合具体实践,介绍微众银行面向智能化运维的 CMDB 系统构建历程以及实施效果 。图 1 微众银行配置模型框架
前文回顾专题 | 智能时代下的运维
图 2 CMDB 系统 API 接口在线调试功能
3.微服务架构下的 CMDB 3.0
随着外围系统对 CMDB2.0 的依赖越来越大,系统间调用关系越来越复杂,CMDB2.0 各模块耦合高,一个服务节点同时支持规则、审计,报表、接口等功能,如果一个功能点异常可能会影响整个平台服务 。于是,CMDB3.0 进行了微服务架构升级,把系统接口调用、web 用户访问,规则处理、数据处理等按功能模块抽离成单个微服务应用,使用 Dubbo 框架进行微服务治理,另外 3.0WEB 前端是基于 VUE 自研的框架,改善了用户体验,提高了团队开发协作能力,降低了开发风险 。

图 3 CMDB 演进过程
图 4 服务器生命周期状态变更流程
2.与多个运维工具对接,促进数据消费,提高数据流动性
结合实际运维场景,与其他运维平台联动,数据被积极消费,在其他工具中体现 CMDB 信息的最大价值 。数据被广泛应用才能保持鲜活的生命力 。如同池塘里的水,只有水不断流动和交替,水质才能清澈 。基于灵活 API 服务,微众银行 CMDB2.0 已实现与 ITSM、监控平台、容量平台、应用发布平台、基础科技工具平台以及智能化运维平台等系统对接 。用一个子系统从设计态到运形态的整个生命周期为例,展示数据联动的消费及流动过程如下 。

图 5 CMDB 和各运维系统交互实现数据消费及流动
3.通过规则校验以及人工审计确保及时发现和修复异常数据
为了保证数据准确性,通过规则校验、系统之间的信息同步比对以及人工抽样审核的方式的定期审计 。持续检视和优化生命周期管理,不断改善数据质量 。微众银行关键配置项准确率达到 99% 以上 。
表 1:CMDB 自动审计规则示例
配置项 自动审计规则 服务器
- 主机下关联应用实例,主机状态不是“已分配”,服务器状态不是“已投产”
- 主机类别是容器母机,对应服务器类别不是容器;
- 已分配状态主机没有部署应用;
- 业务应用状态“已上线”所属子系统状态不是“已上线”;
- 子系统状态为“已下线”,仍部署业务应用;
CMDB 的构建仍是一个持续迭代优化过程,2020 年我们基于微服务构建 CMDB3.0,期望 CMDB 能够通过开源平台的方式提供服务,同时实现配置项自动发现,图像化元数据关系展示以及数据异常自动化修复等方面进一步提升 。未来 CMDB 的运行效果我们会继续分享给大家,希望大家持续我们的演进脚步 。如果希望了解我们在智能运维中使用的机器学习算法以及支持根因分析的具体方法,请参阅该系列其他文章 。
作者简介
本文作者为微众银行智能运维系统高级产品经理 杨芳
延伸阅读:
推荐阅读
- 电子机械是什么专业
- 光棍节是什么意思
- 迷途羔羊是什么时候出的歌
- ai转曲是什么意思
- 抖音账号异常是什么情况
- 网络认证已过期是什么意思
- 微信超级好友是什么
- 京东二手准新机是什么意思
- 契税的新政策 契税新政策内容是什么
- nem-tl00h是什么型号
