作者: | Holden Karau and Mika Kimmins |
语言: | 英文 |
出版年份: | 2023 |
编程语言: | Python |
下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
《Scaling Python with Dask》是一本由Holden Karau和Mika Kimmins共同撰写的实用指南,旨在帮助数据科学家和Python程序员利用Dask开源库实现Python代码的并行化扩展,从而应对大规模数据分析和机器学习任务。本书由O’Reilly Media于2023年出版,是一本专注于数据科学和机器学习领域中Python并行计算的权威著作。
Holden Karau是一位在分布式计算领域有着丰富经验的专家,曾就职于Apple、Google等知名公司,同时也是Apache Spark的Committer和Apache软件基金会成员。Mika Kimmins是一位数据工程师、分布式系统研究员以及机器学习顾问,曾在Apple担任Siri数据工程师,并在学术界和非营利组织中参与过多个大规模机器学习项目。
本书内容丰富,涵盖了从Dask的基本概念到高级应用的各个方面,适合不同层次的读者学习和参考。
conda
环境安装Dask以及使用Dask的“Hello World”示例,如任务并行化和分布式集合的使用。本书适合以下人群:
总之,《Scaling Python with Dask》是一本全面、实用且易于理解的指南,能够帮助读者充分利用Dask的强大功能,提升其数据处理和机器学习任务的效率和可扩展性。