Resilience and Reliability on AWS

作者：	Jurg van Vliet, Flavia Paganelli, and Jasper Geurtsen
语言：	英文
出版年份：	2013
下载链接：	PDF 城通网盘书籍均收集自互联网，仅供学习和研究使用，请莫用于商业用途。谢谢合作。

书籍摘要

核心定位

本书聚焦 AWS 上生产系统的弹性与可靠性建设，面向需要自己设计、部署、运维云端基础设施的工程师。作者以真实运维经验说明：云平台并不会消除故障，真正重要的是把故障视为常态，用自动化、解耦、冗余和可重建能力，让系统在出错后仍能稳定恢复。

内容主线

全书先用理念建立判断框架，再落到典型组件实战。前半部分解释弹性、可靠性、可用区隔离、服务发现、权限控制、伸缩与监控等基础概念，并提出“Rip、Mix、Burn”的构建思路；后半部分依次讨论搜索、关系库、文档库、缓存、日志与全球分发，展示如何把开源组件与 AWS 资源组合成可恢复、可迁移、可持续演进的生产系统。

章节内容

章节	核心内容
第一章	界定弹性与可靠性的差异，说明云上架构必须预设失败。
第二章	用“Rip、Mix、Burn”概括选型、组装、销毁重建的方法。
第三章	速览区域、可用区、Route 53、IAM、EC2、RDS、S3、ELB、Auto Scaling、SQS 等关键服务。
第四章	总结十条生存法则，如拥抱变化、预设组件失效、按现实问题设计。
第五章	以 Elasticsearch 说明节点发现、备份与高可用入口配置。
第六章	讲解 Postgres 的表空间、userdata 自动化、IAM 策略与备份恢复。
第七章	介绍 MongoDB 副本集、跨可用区部署、快照备份与监控扩缩。
第八章	展示 Redis 主从复制、角色参数下发与故障切换。
第九章	以 Logstash、Redis、Elasticsearch、Kibana 组成集中式日志链路。
第十章	讨论 CloudFront、CloudFormation、Route 53 与跨区域交付。
第十一章	回到全书主题，强调持续演练和自动恢复比“绝不出错”更现实。

适用读者

适合具备开发或运维基础、准备在 AWS 上自建核心服务的工程师、架构师与平台团队阅读。若读者已接触脚本自动化、数据库、缓存或监控体系，会更容易把书中案例迁移到自己的环境中。

总评

这本书的时间背景较早，但方法论依然有效。它的价值不在罗列某个版本的 AWS 功能，而在于反复强调：把基础设施当作可编排、可替换、可验证的软件系统来管理。对想理解云上可靠性设计原则，而不满足于只会“点控制台”的读者，它仍有明显参考意义。