《Fundamentals of Data Visualization》是由Claus O. Wilke撰写的一本专注于数据可视化的专业书籍,于2019年由O’Reilly Media出版。这本书旨在帮助读者掌握如何制作有说服力的数据可视化图表,强调图表的清晰性、吸引力和准确性,指出好的图表与坏的图表之间的差异可能会影响论文的影响力、项目中标与否以及工作面试的结果。
作者简介
Claus O. Wilke是德克萨斯大学奥斯汀分校的整合生物学教授,拥有德国波鸿鲁尔大学的理论物理学博士学位。他在计算生物学、数学建模、生物信息学、进化生物学等领域发表了170多篇科学论文,并开发了多个流行的R语言数据可视化包,如cowplot和ggridges。
书籍内容概述
第一部分:从数据到可视化
- 第2章:介绍了如何将数据映射到视觉元素上,包括不同类型的数据(如定量、分类数据)以及如何通过位置、大小、颜色等视觉属性来表示数据。
- 第3章:探讨了坐标系统和轴的使用,包括笛卡尔坐标系、非线性轴(如对数轴)以及极坐标系等,解释了如何根据数据特点选择合适的坐标系统。
- 第4章:详细讨论了颜色的使用,包括如何用颜色区分数据组、表示数据值以及突出重点,强调了颜色选择对视觉感知的重要性。
- 第5章:提供了一个可视化目录,展示了各种常见的图表类型,如条形图、散点图、饼图等,用于展示不同数据类型的可视化方法。
第二部分:图表设计原则
- 第17章:介绍了“比例墨水”原则,强调在可视化中保持数据值与图形面积或长度成比例的重要性,以避免误导读者。
- 第18章:讨论了如何处理重叠点的问题,包括使用部分透明度和抖动技术来改善数据点的可视化。
- 第19章:探讨了颜色使用的常见陷阱,如编码过多信息、使用非单调颜色尺度以及未考虑色觉障碍等。
- 第20章:强调了冗余编码的重要性,即通过多种视觉元素(如颜色、形状、线条类型)来传达相同的信息,以增强图表的可读性和理解性。
第三部分:其他主题
- 第21章:介绍了多面板图表的制作,包括小倍数图表和复合图表,讨论了如何通过多个图表面板展示复杂数据集。
- 第22章:讨论了图表标题、注释和表格的制作,强调了如何通过适当的标题和注释来增强图表的表达能力。
- 第23章:探讨了如何平衡图表中的数据和上下文信息,以确保图表既不过于复杂也不过于简单。
- 第24章:强调了使用较大字体来提高轴标签和注释的可读性,指出许多绘图软件的默认字体设置过小,需要调整以提高图表的整体效果。
书籍特色
- 实用性强:书中不仅提供了丰富的图表示例,还详细讨论了如何选择合适的图表类型来展示特定的数据集。
- 注重实践:作者强调了数据可视化中的实践技能,如如何避免常见的错误和陷阱,以及如何通过调整视觉元素来增强图表的表达力。
- 跨学科适用:这本书适用于科学家、分析师、咨询师等需要准备技术文档或报告的专业人士,也适合对数据可视化感兴趣的普通读者。
《Fundamentals of Data Visualization》是一本全面、实用且易于理解的数据可视化指南,适合任何希望提升数据可视化技能的读者。