Getting Started with Storm

作者：	Jonathan Leibiusky, Gabriel Eisbruch, and Dario Simonassi
语言：	英文
出版年份：	2012
下载链接：	PDF 城通网盘书籍均收集自互联网，仅供学习和研究使用，请莫用于商业用途。谢谢合作。

书籍摘要

核心定位

《Getting Started with Storm》是一本面向开发者的 Apache Storm 入门指南，核心任务不是全面展开分布式流处理理论，而是帮助读者尽快弄明白 Storm 的角色分工、拓扑编程模型和基础部署路径。它更像一册“把实时计算框架先跑起来”的启动读物，适合想快速建立整体认知的人，而不是寻找大规模生产调优细节的资深使用者。

内容主线

全书按“认识平台→写出拓扑→补上关键机制→看完整案例”的顺序推进。前半段解释 Nimbus、Supervisor、ZooKeeper、Spout、Bolt 与分组策略；中段把可靠消息、多语言支持和事务型拓扑逐项展开；后段用接近真实业务的推荐系统示例，把实时采集、处理、统计和通知串成一条完整链路。阅读重点始终围绕一个问题：Storm 程序究竟怎样从概念落到可运行工程。

章节内容

章节	主题
第一章	Storm 定位、Nimbus/Supervisor/ZooKeeper 分工，以及实时计算、持续查询、分布式 RPC 等典型场景。
第二章	Java 环境、项目创建、本地与远程运行模式、第一个 Hello World 拓扑，以及 Spout、Bolt、主类装配方式。
第三章	Shuffle、Fields、All、Direct、Global 等分组策略，数据在处理单元之间的流动方式，以及 LocalCluster 与 StormSubmitter 的区别。
第四章	数据入口 Spout：可靠与不可靠消息、外部数据接入、失败重放、确认机制与 DRPC 来源。
第五章	Bolt 生命周期、节点结构、多流输出、多重锚定、自动确认接口，以及业务处理链怎样组合。
第六章	实时推荐案例：导航采集、品类提取、历史统计、计数与通知组件如何协同工作。
第七章	Storm 多语言协议，让 Python、Ruby、JavaScript 等非 JVM 语言也能编写 Spout 或 Bolt。
第八章	事务型拓扑的设计思路，Spout、Bolt、Committer 分工，以及分区事务与 Opaque 模式。
附录	客户端安装、集群部署与示例环境准备，帮助把示例迁移到实际环境。

适用读者

适合具备 Java 基础、准备进入实时数据处理领域的后端开发者、数据工程师和中间件学习者。若你已经懂消息队列、分布式节点和基础命令行，但还没真正写过流处理任务，这本书的门槛和节奏都比较合适；如果你更关心生产级监控、调优和容错细节，它只能作为前置热身。

总评

这本书的价值在于用很短篇幅把 Storm 最重要的心智模型先建立起来，让读者知道一个实时拓扑由哪些角色组成、怎样处理消息、怎样逐步搭出可运行程序。它的局限同样明显：出版较早，部分接口与生态背景带有时代性。但如果你的目标是理解 Storm 的原始设计、流式框架的程序组织方式，以及实时计算系统最基础的工程套路，它仍值得投入时间快速读完。