作者: | Betsy Beyer, Niall Richard Murphy, David K. Rensin, Kent Kawahara, and Stephen Thorne |
语言: | 英文 |
出版年份: | 2018 |
下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
《The Site Reliability Workbook》是由Betsy Beyer、Niall Richard Murphy、David K. Rensin、Kent Kawahara和Stephen Thorne共同编辑的一本关于站点可靠性工程(SRE)的实践指南。本书由O’Reilly Media于2018年出版,旨在帮助读者将SRE的理论和抽象概念应用于实际工作中,尤其是那些在Google之外的组织中。
SRE的概念最初由Google提出,用于解决大规模分布式系统中的可靠性问题。Google的第一本SRE书籍《Site Reliability Engineering》在全球范围内引起了广泛关注,但许多读者认为其内容过于理论化,难以直接应用于自己的组织。为了回应这些需求,《The Site Reliability Workbook》应运而生,提供了更具体的实施细节和案例研究,帮助读者将SRE原则落地。
本书分为两部分。第一部分介绍了SRE的基础知识,包括服务级别目标(SLO)、监控、告警、减少重复劳动(toil)和简化系统等核心概念。第二部分则深入探讨了SRE的具体实践,如数据处理管道、负载管理、变更管理、on-call实践以及如何处理故障等。
本书适合希望在组织中实施SRE原则的工程师、团队负责人以及对系统可靠性感兴趣的IT专业人士。无论是大型企业还是初创公司,都可以从本书中找到适合自己的SRE实践方法。
总之,《The Site Reliability Workbook》是一本实用性强、内容丰富的SRE指导书籍,对于希望提升系统可靠性和效率的读者来说,是一本不可多得的参考书。