简介...
https://xiaoyuzhoufm.com

本期请到在硅谷科技公司工作的云淡风轻,聊聊 SRE(Site Reliability Engineer)以及构建稳定的服务。话题很大,本期主要是科普性质,给像我这样的外行介绍一下 SRE 是什么,大概有哪些通用的方法来确保服务稳定。



参考链接:



  • ggtalk 听众交流群,请添加我的 wx:lj925184928,注明 ggtalk

  • 一些术语:site reliability engineering(SRE), reliability, availability, scalability, efficiency, infrastructure

  • 推荐的书:SRE Books





新听众?推荐阅读新听众指南


时间线:



  • 00:40 个人介绍 + 主题介绍 + 免责声明

  • 05:52 SRE 和运维有什么区别 + SRE 职位相关的讨论

  • 13:26 稳定性为什么重要 + 稳定性取决于什么 + 宕机

  • 23:47 如何提高稳定性——程序 bug 的处理

  • 38:49 如何提高稳定性——灾备

  • 58:52 如何提高稳定性——基础设施故障

  • 01:04:56 如何提高稳定性——功能优先级

主播...
评价...

空空如也

小宇宙热门评论...
HD562233w
4年前
5
感觉像是国内基础架构部做的事情,负责底层的一些基础服务,高可用,中间件相关的
杨文
4年前
0
45:04 昨天多个站点出现故障,GitHub status 页面也不可访问,真的很难保证绝对的稳定
杨文
4年前
0
46:43 昨天全球站点用到 fastly cdn 的站点都会出现不可用的情况,包括GitHub status,Reddit,cncf,stackoverflow 等
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧