The Shape of Data
作者: Colleen M. Farrelly and Yaé Ulrich Gaba
语言: 英文
出版年份: 2023
编程语言: R
下载链接:
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。

书籍摘要

《The Shape of Data》是由 Colleen M. Farrelly 和 Yaé Ulrich Gaba 共同撰写的一本专注于网络科学、几何机器学习以及拓扑数据分析的书籍。该书以 R 语言为工具,深入探讨了这些前沿领域在数据科学中的应用,适合对复杂数据结构分析和高级机器学习算法感兴趣的读者。

作者简介

  • Colleen M. Farrelly:一位资深数据科学家,专注于拓扑数据分析、量子机器学习和几何机器学习等领域。她在多个行业有过丰富的研究和应用经验。
  • Yaé Ulrich Gaba:一位专注于拓扑学和几何学的研究员,目前在 Quantum Leap Africa 从事相关研究工作。

内容概述

第一部分:几何与数据

  • 第1章:数据的几何结构:介绍了机器学习算法的几何视角,探讨了如何将几何结构应用于医疗和图像数据。详细讨论了分类、回归、过拟合以及维度问题的几何意义。
  • 第2章:网络的几何结构:深入分析了网络数据的几何特性,包括网络的度量、结构和类型。通过社交网络的实例,展示了如何利用几何工具衡量网络中个体的影响力和网络的整体特性。

第二部分:网络分析与几何方法

  • 第3章:网络分析:结合网络数据的几何特性,介绍了如何使用机器学习算法进行预测、聚类和传播分析。特别关注了 SIR 模型在传播分析中的应用。
  • 第4章:网络过滤:通过加权网络的过滤技术,分析网络几何属性在不同阈值下的变化,并引入了从网络到更高维度单纯复形的转换。

第三部分:几何在数据分析中的应用

  • 第5章:数据科学中的几何:探讨了距离度量在网络分析、流形学习和股票市场分析中的应用,介绍了如何通过选择合适的几何工具提升机器学习算法的性能。
  • 第6章:几何在机器学习中的新应用:介绍了基于切空间的模型估计、离散外微积分以及秩模型等新工具,展示了它们在小样本数据、灾难规划和偏好排序中的应用。

第四部分:拓扑数据分析

  • 第7章:拓扑数据分析工具:深入介绍了基于拓扑的无监督学习算法,如持续同调和 Mapper 算法,并探讨了它们在教育数据中的应用。
  • 第8章:同伦算法:介绍了同伦算法及其在路径规划和回归参数估计中的应用,展示了其在解决局部最优问题方面的优势。

第五部分:实践与拓展

  • 第9章:文本数据的分析:结合自然语言处理和几何方法,分析了诗歌数据集,展示了如何通过特征空间的降维和模型构建来区分不同类型的文本。
  • 第10章:多核和量子计算:探讨了分布式计算和量子计算在拓扑数据分析中的应用前景,介绍了多核方法和量子算法的最新进展。

读者对象

本书适合以下人群:

  • 对网络科学、几何机器学习和拓扑数据分析感兴趣的读者。
  • 希望通过 R 语言实现复杂数据结构分析的数据科学家。
  • 希望提升数据科学技能的行业从业者,包括医疗保健、生物技术、核工程、市场分析和教育领域的专业人士。

《The Shape of Data》是一本结合理论与实践的教材,不仅提供了丰富的算法和案例,还通过 R 语言的实际代码示例帮助读者快速掌握相关技能。

期待您的支持
捐助本站