×

「笔记」某电信公司转型 SRE 运维体系交流

hqy hqy 发表于2025-03-29 01:45:50 浏览26 评论0

抢沙发发表评论

痛点

•传统竖井式IT架构(封闭、隔离、非标、难运维)

•X86 服务器硬件稳定性不足

•开源软件可靠性不足,且不可控

•出了故障,被动救火救不完

转型

由此催生了转型升级的需求:

1.运维智能(SRE)的转型

SRE运维模式

核心职责

保证:

1.业务连续性

2.应用连续性

3.平台连续性

职责分工

1.综合运维岗1.7*24 在线或远程值班

2.业务监控

3.业务运维操作

4.故障处理

5.应急处理

2.运维专业组(由基础架构的:主机、存储、网络、中间件数据库岗位演化而来)

1.系统架构梳理和优化

2.新建系统评审

3.故障演练

4.新技术引入

5.专业职责和经验赋能给综合运维岗,如提供数据库自动化脚本、数据库切换演练流程标准化等

3.运维开发

1.为综合运维岗开发运维工具、运维系统

2.收集分析运维专业组自动化、监控等需求

3.DevOps、自动化运维、智能监控系统、容器平台等系统开发和持续迭代演进

综合运维岗 - 全栈运维入口

要点

•全面运维•工具应用•统一入口•人才培育

?‍? 人员要求: 理工科背景; 应届生; 实习生

典型流程

事件跟踪和故障处理;

需要人工处理的交给专业组;

故障升级给"值班经理"

运维专业组

•技术选型 - 标准化, 新技术选择

,•行业生态

•功能特性

•发展规划

•商业特性

•架构管控 - 实现业务连续性, 高可用, 高可靠

•场景提炼 - 升级、高可用切换、迁移、发布

•疑难处理


打赏

本文链接:https://www.kinber.cn/post/5013.html 转载需授权!

分享到:


推荐本站淘宝优惠价购买喜欢的宝贝:

image.png

 您阅读本篇文章共花了: 

群贤毕至

访客