蝉鸣报告-硬核报告每天更新;
覆盖产业报告、全球化、经济、趋势等全领域...

【中国移动】大型国企如何实施IT运维SRE转型——暨北京移动IT运维转型实践分享


近日,中国移动通信集团北京有限公司信息系统部中台能力运营室经理、IT系统架构委员会负责人王霖在GOPS全球运维大会2023·上海站上发布了一份名为“大型国企如何实施IT运维SRE转型——暨北京移动IT运维转型实践分享”的行业研究报告。这份报告深入探讨了在数字化转型的大背景下,大型国企如何通过SRE(Site Reliability Engineering,网站可靠性工程)理念和实践来实现IT运维的转型升级。报告中不仅分享了北京移动在IT运维转型过程中的实践经验,还详细阐述了转型的顶层设计、技术保障与容灾应急、数智化运维平台构建等多个维度,为同行业企业提供了宝贵的参考和启示。报告内容丰富,涵盖了从理论到实践的全方位视角,对于寻求IT运维转型的企业来说,无疑是一份极具价值的指导性文件。

在数字化时代,IT运维的重要性日益凸显,尤其是对于大型国企而言。北京移动的IT运维转型实践,为我们提供了一个深刻的案例分析。运维保障已成为企业IT治理的核心,而北京移动通过实施SRE(Site Reliability Engineering,网站可靠性工程)转型,有效提升了IT系统的可靠性和运维效率。

北京移动的IT系统经过二十多年的升级迭代,已经完成了云化、微服务化、容器化等技术架构升级。这一过程中,系统规模和复杂度呈指数级增长,软件交付和IT运维面临巨大挑战。为了应对这些挑战,北京移动引入了SRE方法体系,以实现IT运维的现代化转型。

SRE转型的核心在于“四位一体”的工作思路,即业务运营保障、数智化运维平台、技术支撑保障和容灾应急保障体系。这一思路强调了从传统的IT运维向“产品+开发+运维”的综合能力转型,以实现更高效的业务运营保障。

在技术支撑保障方面,北京移动制定了IT生产系统架构技术标准,涉及应用架构、数据、开发规范、技术架构等多个方面,共计126条标准。这些标准为IT系统的可靠性演进提供了度量衡,是实施SRE转型的基础。同时,北京移动还持续评估SRE可靠性风险,并迭代演进,以发现和解决IT生产中的架构性问题。

在容灾和应急方面,北京移动优先实施了灾备和应急系统,推行“先恢复再修复”的响应策略。这一策略不仅提升了系统的高可用水平,也为SRE工程的实施提供了信心。应急系统的关键词包括物理解耦、版本稳定和常态演练,这些都是确保系统在故障发生时能够快速恢复的关键因素。

数智化运维平台是北京移动SRE转型的另一个重要组成部分。该平台从打造运维基础、防患故障未然、故障快速响应和保障流程效率四个方面构建,涵盖了CMDB配置管理库、运维数据中心、AIOPS算法平台等多个方面。这一平台的建设,使得北京移动的IT运维能力得到了质的飞跃。

在具体实践中,北京移动的SRE团队深度参与IT工程的“全生命周期”,而不仅仅是在上线前的测试验收和系统交维。这种全方位的参与,使得SRE团队能够更好地理解和管理IT系统的复杂性,从而提高系统的可靠性。

北京移动的SRE转型实践,不仅提升了自身的IT运维能力,也为其他大型国企提供了宝贵的经验。通过制定详细的技术标准、持续的风险评估、优先建设灾备和应急系统以及构建数智化运维平台,北京移动成功地应对了云原生技术背景下的挑战,实现了IT系统的现代化转型。

展望未来,北京移动计划推出“京萤”系列产品,助力大型政企客户IT运维。这一系列将包括智能运维开放平台、统一运维链路平台、企业级智能报障中台和AIOPS平台。这些产品的推出,将进一步巩固北京移动在IT运维领域的领先地位,并为客户提供更高质量的服务。

这篇文章的灵感来自于《大型国企如何实施IT运维SRE转型 ——暨北京移动IT运维转型实践分享》这份报告。除了这份报告,还有一些同类型的报告,也非常有价值,推荐阅读,这些报告我们都收录在同名星球,可以自行获取。

以上为节选样张,关注公众号【蝉鸣报告】回复领取PDF完整电子版(无广告)。

蝉鸣报告】每日更新最新硬核报告,覆盖产业报告全球化经济报告、趋势等全领域。

 

未经允许不得转载:蝉鸣报告(原爱报告知识星球) » 【中国移动】大型国企如何实施IT运维SRE转型——暨北京移动IT运维转型实践分享

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

如何快速寻找资料?

关于我们赞助会员