设为首页
收藏本站
注册账号
登录
|
搜索
搜索
本版
文章
帖子
用户
门户
Portal
论坛
BBS
网赚问答
科教问答
平面设计
网站制作
软件开发
网络运维
网教网
»
论坛
›
网教网
›
网络运维
›
SRE(运维)如何做到年薪百万
返回列表
发新帖
查看:
96
|
回复:
1
SRE(运维)如何做到年薪百万
[复制链接]
崔旭潮
崔旭潮
当前离线
积分
8
2
主题
3
帖子
8
积分
新手上路
新手上路, 积分 8, 距离下一级还需 42 积分
新手上路, 积分 8, 距离下一级还需 42 积分
积分
8
发消息
发表于 2023-1-7 18:48:10
|
显示全部楼层
|
阅读模式
1 目录
13年硕士研究生毕业,目前已经工作将近9年时间,第一段工作是在百度工作6年时间,目前是再另外一家大厂工作。今天跟大家分享一下我工作的心得,说一下我对sre的成长之路。希望跟大家一起进步
2 我对运维的理解
2.1 第一个运维工程师
一天,玛丽的儿子劳伦在摆弄 MIT 。当她在键盘上乱按的时候,一条错误信息突然出现。劳伦不知怎地启动了一个叫做 P01 的预运行程序,原本正在飞行状态的模拟器一下子崩溃了。
虽然一般来说宇航员不会犯这样的错,但玛格丽特还是想加一段代码防止这种状况的发生。这一提议被 NASA 否决,「他们一遍又一遍地跟我说宇航员不会犯任何错误,他们被训练得近乎完美,」玛格丽特说。她转而加了一句程序说明,所有 NASA 工程师和宇航员都能看到:「不要在飞行过程中按下 P01」。她回忆说,「所有人都说,『那样的事情永远都不会发生』。」
但事情的的确确发生了。时间大约在 1968 年的圣诞节,进入阿波罗 8 号飞船的第五天飞行,宇航员吉姆·洛威尔 (Jim Lovell) 不小心在飞行中启动了 P01 程序。当电话从休斯顿打来的时候,玛格丽特正在仪器实验室的 2 层会议室。启动 P01 程序导致此的导航数据全部清空,阿波罗计算机无法计算出如何返回地球。
多亏了玛格丽特,还有调皮的劳伦,阿波罗号上的宇航员才得以重返地球
第一个运维可以看到就是在做稳定性
2.2 我对运维的理解
首先运维所处的位置:运维是介于业务和基础设施之间,对上可以接触要核心业务;对下可以接触到各个基础设施知识(比如网络、IDC、DNS、其他等等)
其次运维到底需要哪些技术:技术是无明显的边界的。需要业务理解、操作系统、开发能力、算法能力、数据分析等等
最后运维和SRE什么关系,其实运维是一个非常大的方向,有数据库、安全运维、运维开发、系统运维、IT运维、业务运维。目前在国内大厂的定义SRE就是指业务运维
SRE是最根本的目标是时刻保证线上的稳定和安全。那么如何保证就是这个SRE的工作组成。 如果说线上服务是上帝,那么SRE就是网址的专职医生。SRE到底是做什么呢?网址可靠性工程师。类似于日常生活的专职医生,包括定期的体检、快速诊断、快速治疗、疾病预防、专项提升对于SRE来说就是包括监控体系、问题定位、快速恢复、预案、活动体系SRE来说还有成本、效率;基本盘是稳定性
3 成长路线
相信大家都见过脉脉上的这种图。按照大厂的路线以百度为例子,以百度为例子 入职T3依次、T4(初级)、T5(中级)、T6(高级)、T7+T8(资深)、T9+架构师
大概需要多久能到资深呢,正常来看5-7年左右的时间 成长没有捷径,也没有速成,只有一步一个脚印去做
4 如何能达到目标
4.1 能力分析
突然有一天流量突然暴涨导致一个故障,各个阶段工程师思考的问题。
T3工程师能够快速定位和扩容
T4在容量领域做深入分析,如何系统化进行,比是不是可以有相关预案,限流、报警
T5 是不是可以考虑上云,如何能够弹性扩容,上云之后的问题和收益
T6 针对容量领域是不是可以深入的分析和系统性建设,比如成本、压测、定期的容量退化分析等等,能不能形成一套完整解决方案
T7 能不能在其他产品线使用,是否可以面对一个重大型的活动保障,比如火车抢票,春晚抢红包
4.1 入门级能力要求
最重要的就是扎实的基础
1.1-开篇
1.2 SRE的日常
1.3 SRE之基本能力
2.1 面试总结
2.2 工作总的一些感悟
2.3 操作系统十大面试问题-CPU篇
2.4 操作系统10大面试题-内存篇
2.5 操作系统常见10大面试题网络篇
2.6 操作系统常见10大面试磁盘-IO-文件系统
2.7 基础概念-软中断与硬中断
2.8 十大常用shell命令
2.9 白话网络分层
4.2 初级
这一篇主要介绍在进入公司之前作为SRE应该如何快速融于公司,了解哪些基础的组件,可能马上要面对的是三个问题,业务的学习、基础能力的学习、小的系统快速搭建。
3.1 监控体系介绍
3.2从SRE角度去加监控
3.3 监控指标的选择和说明
3.4 监控系统实践
3.5 广告交易系统—介绍
3.6 风控系统
8.1 SRE 要懂点前端-vue
8.2 SRE要懂点前端2-vuex的介绍和使用
8.3 SRE也要懂点前端-elementui+echart
8.4 SRE要懂点前端-http与跨域
4.3 中级篇:
这一部分重点介绍的需要一个或者几个方向深入的去研究。作为SRE三板斧来说稳定性、成本、效率,需要要深入的理解。要形成自己的方法论
4.1 稳定性-概述
4.2 稳定性-单机房故障
4.3 稳定性-分级发布
4.4 稳定性-容量平台
4.5 雪崩问题应该如何解决和避免
4.6 稳定性之反模式
4.7 节假日稳定性保障
4.8 从稳定性角度去看待压测
4.9 从稳定性角度去做预案
4.10 稳定性复盘
5.1 数据安全与数据可靠是什么关系?终极武器是什么?
5.2 数据可靠性-数据备份
5.3 数据可靠性保障核心之数据校验
5.4 数据可靠性-磁盘故障预测
5.5 数据可靠性-人为因素避免
5.6 数据可靠性-数据流动
4.4 高级篇:
这一部分重点介绍的需要在多个方向有深入的理解,SRE不仅仅是运维的几个方向,而是要对多个方向去广泛涉猎,去了解如何使使用。
6.1 AIOps思考
6.2 AIOps 运维中一些常见异常检查算法
6.3 异常检测-建设思路
6.4 常用异常检测算法的实践
6.5 异常检测-决策树实践
6.6 AIOps实践之异常检查与报警
6.7 关于AIOps最常见的六种场景
7.1 初识大数据技术体系
7.2白话大数据之谷歌三篇论文
7.3 白话大数据之HDFS
7.4 白话大数据之Hbase
7.5 白话大数据之数据仓库
7.6 白话大数据之OLAP
7.7 白话大数据之Mapreduce、Storm、Spark、Flink选择
8.1 容器的三大核心技术
8.2 浅谈容器
8.3 k8s存储服务管理
8.4 容器调度
8.5 服务网格
8.6 从小区管理看k8s的系统架构
8.7 浅谈Kubernetes的pod
9.1 白话系列之EM算法
9.2 白话 lstm与rnn
9.3 马尔可夫
9.4 白话系列之常见概率分布
9.5 白话系列之前馈神经网络、反向误差传播、受限玻尔兹曼
9.6 白话系列之 蒙特卡洛方法
10.1 ABC之白话总结
4.5 资深篇
这一部分重点介绍如何去独立承担一些大的项目。比如组织一次大的活动保障,比如去做一个大的架构优化,需要多个部门,多个团队去合作。
活动稳定性保障之春节红包
春晚活动保障之流量预估
节假日稳定性保障
全球部署系列文章
全球部署之业务、网络、IDC之间的关系
全球部署之异地多活
全球部署之快速部署
全球部署之用户调度
5 架构师的跃迁
我看了很多人的title是运维架构师,从我个人理解其实都远远达不到架构师的水平。我见过架构师水平的在运维领域的应该不超过5个同事。
应该最近一直在思考个人的下一步的发展路线在哪里,如何能从资深向架构师实现一个跃迁。 架构师远不止你画几个图,参加一些培训课这么简单,也不是给自己脉脉头衔上加个标签。
能力层面
综合实力,除了自己的领悟之外,其他的领域的深度也是非常深入的。
思考的深度,一定是清晰可达的。目标清晰,技术深入
首先说一下架构师我见过的硬性条件,部门级别的绝对核心。负责整个运维部的整体的规划。
公司级别的权威,在某一个领域是绝对的权威。比如成本、性能优化、监控、稳定性等等。你提出来的框架是通用的。
战略思考
首先说一下什么战略,对于伟人来说指点江山称之为战略思考。比如毛主席在围剿白崇禧的时候就提出了著名的“大迂回、大包围”的钳形攻势,画了一张螃蟹画。由陈赓兵团和邓华兵团两团向南昌到广州前进即右边路线从湖北到广西则由程子华兵团前进也就是左边路线而中路则是肖劲光兵团三管齐下重重包围。战略需要清晰直接,简单明了。而不是退了一大推的理论。
图片
对于个人来说战略是什么,就是人生的重要节点的思考和落地。比如工作方向、家庭、身体等等一些关键的事情,需要想到前面,多一些深入的重要的思考。
对于SRE来说比如业务的发展、跟机房布局、性能优化、稳定性保障如何取得一个平衡点 如何选择上云还是自建,选择哪家云等等
带着团队成事
我见过的架构师,都是可以独立去带着团队完成项目,其管理能力,项目管理能力,架构思考能力都是非常好的。架构师永远不是一个人在战斗,需要很多人在帮助和协同。我之前在百度结果过2-3个T9的SRE,无一不是带着一个团队在战斗,有着非常深入的思考和落地能力。
学习的能力
一个好的架构师,学习的能力必然是非常强的。能够保持一个好奇心,而不是以权压人,以职位压人,如果有人有不同的意见,都是以理服人。以专业的业务和严谨的逻辑来讲清楚背后的事情。
传道授业
好的架构师,必然也是一个好的导师,所谓好的导师就是可以给不同阶段的同学指明目前的问题,以及下一步的方向。我之前在百度遇到过几个架构师沟通完之后都是能一眼看到你们目前工作的问题所在,给出下一步的方向,对下面的同学都是非常谦虚友善。
6 最后
更多内容可以关注微信公众号“SRE说”
回复
使用道具
举报
波嗷宝
波嗷宝
当前离线
积分
5
1
主题
5
帖子
5
积分
新手上路
新手上路, 积分 5, 距离下一级还需 45 积分
新手上路, 积分 5, 距离下一级还需 45 积分
积分
5
发消息
发表于 2023-1-7 18:49:05
|
显示全部楼层
测试如何年薪百万
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
平面设计
网站制作
科教问答
软件开发
快速回复
返回顶部
返回列表