《Hacks, Leaks, and Revelations》是由 Micah Lee 编写的实用指南,旨在帮助记者、研究人员、黑客活动家以及任何对调查泄露数据感兴趣的人掌握处理和分析大规模数据集的技能。本书由 No Starch Press 出版,内容丰富且结构清晰,适合从初学者到专业人士的广泛读者群体。
作者简介
Micah Lee 是一位资深的调查记者、计算机安全工程师和开源软件开发者。他曾在《The Intercept》工作,专注于分析泄露数据集,并为保护隐私和信息安全做出了重要贡献。他还开发了多个开源安全工具,如 OnionShare 和 Dangerzone,这些工具在保护数据安全方面发挥了关键作用。
书籍结构
本书分为五个部分,每部分都建立在前一部分的基础上,逐步深入地介绍了数据调查的各个方面。
第一部分:数据来源与数据集
- 第 1 章:介绍了保护数据来源和自身安全的重要性,包括如何安全地存储和传输数据,以及如何验证数据集的真实性。
- 第 2 章:讲解了如何获取数据集,包括使用 BitTorrent 下载数据、使用安全工具(如 Signal、Tor Browser、OnionShare 和 SecureDrop)与数据源安全通信,以及如何处理高敏感度数据集。
第二部分:工具的使用
- 第 3 章:介绍了如何使用命令行界面(CLI)来快速评估和处理泄露数据集,包括基本的命令行操作和脚本编写。
- 第 4 章:进一步扩展了命令行技能,包括在云服务器上远程分析数据集,以及使用 Docker 运行复杂软件。
- 第 5 章:介绍了 Docker 的使用,以及如何使用 Aleph 软件来分析和搜索大型数据集。
第三部分:Python 编程
- 第 7 章:为读者提供了 Python 编程的基础知识,包括变量、循环、函数等基本概念。
- 第 8 章:深入探讨了如何使用 Python 处理文件系统、编写命令行程序,以及如何使用字典和列表来处理复杂数据。
第四部分:结构化数据
- 第 9 章:介绍了 CSV 文件格式,以及如何使用 Python 脚本处理 CSV 文件。
- 第 10 章:介绍了 BlueLeaks Explorer 应用程序的开发过程,以及如何使用它来分析 BlueLeaks 数据集。
- 第 11 章:聚焦于 JSON 文件格式和 Parler 数据集,讲解了如何过滤视频并绘制 GPS 坐标。
- 第 12 章:探讨了如何从 SQL 数据库中提取信息,以 Epik 数据集为例,揭示了极右翼网站的域名注册信息。
第五部分:案例研究
- 第 13 章:分享了作者对美国前线医生(AFLDS)的调查经历,展示了如何通过分析泄露的 CSV 和 JSON 文件揭露反疫苗组织的欺诈行为。
- 第 14 章:描述了作者如何分析和报告新纳粹聊天记录的泄露,以及开发 DiscordLeaks 工具的过程。
书籍特色
- 实用性强:提供了丰富的实际操作指南和案例,帮助读者快速掌握数据调查的技能。
- 技术全面:涵盖了从数据获取、安全通信到数据分析和编程的各个方面。
- 案例丰富:通过真实案例展示了如何应用所学技能,激发读者的实践兴趣。
- 适合广泛读者:无论是初学者还是专业人士,都能从中获得有价值的指导。
适用人群
- 记者:学习如何安全地获取和分析泄露数据,以揭露新闻线索。
- 研究人员:掌握数据处理和分析的技能,用于学术研究或调查工作。
- 黑客活动家:了解如何安全地获取和传播数据,推动社会变革。
- 技术爱好者:对数据安全、隐私保护和编程感兴趣的读者。
《Hacks, Leaks, and Revelations》是一本全面且实用的指南,适合所有希望在数字时代掌握数据调查技能的读者。通过阅读本书,读者将能够更好地理解和应对当前复杂的数据环境,发现隐藏在数据中的真相。