Implementing MLOps in the Enterprise
作者: Yaron Haviv and Noah Gift
语言: 英文
出版年份: 2023
下载链接:
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。

书籍摘要

《Implementing MLOps in the Enterprise》是由 Yaron Haviv 和 Noah Gift 合著的一本专注于企业级 MLOps 实践的指南,于 2024 年由 O’Reilly Media 出版。本书旨在帮助企业解决在将机器学习(ML)模型从实验室推向生产环境时面临的诸多挑战,提供了一套系统性的方法论和实践指南,以实现高效、可扩展且可靠的 MLOps 流程。

一、背景与挑战

在传统的企业数据科学实践中,模型通常在实验室环境中由小团队开发,使用手动提取的小数据集进行训练。然而,当模型完成开发并需要在生产环境中产生实际业务价值时,企业往往面临数据摄取、大规模训练、实时服务以及模型监控与管理等一系列挑战。这些挑战不仅耗费大量时间和资源,还可能导致项目失败。此外,AI 管道的孤立性、团队之间的协作障碍以及不同工具和框架之间的兼容性问题,进一步加剧了资源浪费和业务价值实现的难度。根据 Gartner 的数据,多达 85% 的数据科学项目未能达到预期效果。

二、核心理念与方法论

本书提出了一种以生产为中心的思维方式,强调从一开始就设计一个持续的运营管道,并确保各个组件和实践能够与之无缝对接。通过尽可能多地自动化组件,使管道具有快速、可重复的特性,从而能够随着组织需求的增长而扩展,并快速提供业务价值,同时满足动态和企业级的 MLOps 需求。

三、内容结构与重点

全书内容围绕 MLOps 流程的各个阶段展开,分为以下几个部分:

第一部分:MLOps 的理念与实践

  • 第 1 章:介绍 MLOps 的概念、重要性以及企业面临的挑战。
  • 第 2 章:探讨企业如何开始 MLOps 之旅,包括数据科学团队的准备和第一个 MLOps 项目的规划。

第二部分:构建 MLOps 流程

  • 第 3 - 7 章:详细讲解了构建一个健壮且可扩展的 MLOps 流程所需的各个组件,包括数据收集与准备、模型开发与训练、机器学习服务部署以及持续反馈与监控。这些章节涵盖了从数据工程到模型优化的全过程,强调了自动化和版本控制的重要性。

第三部分:深度学习与特定领域应用

  • 第 8 章:深入探讨了深度学习管道,特别是生成式人工智能(GenAI)和大型语言模型(LLMs)的应用。
  • 第 9 章:讨论了如何针对特定行业和用例(如混合部署、实时预测和复合 AI)调整 MLOps 流程。

第四部分:实践案例与工具

  • 第 10 章:通过实际代码示例,展示了如何将理论应用于构建 MLOps 流程,包括使用流行的工具和框架。
  • 第 11 章:提供了在企业环境中实施 MLOps 的策略,包括选择合适的云平台、培训和人才管理、供应商选择以及对投资回报率(ROI)的关注。

四、适用人群

本书的目标读者是负责构建、管理、维护和运营数据科学流程的从业者,包括数据科学团队负责人、机器学习工程师、MLOps 工程师以及技术领导者(如首席信息官、首席技术官和首席数据官)。这些读者通常具备 Python、pandas、sklearn 等技术背景,并希望在企业中高效地扩展 AI 应用。

五、价值与意义

《Implementing MLOps in the Enterprise》不仅为读者提供了一个全面的 MLOps 实践指南,还通过丰富的案例和代码示例,帮助读者快速掌握如何在企业环境中实施 MLOps。书中强调的以生产为中心的思维方式和系统化的流程设计,能够帮助企业克服传统数据科学实践中的局限性,实现从实验室到生产环境的无缝过渡,从而充分发挥 AI 技术在推动业务增长和创新方面的潜力。

期待您的支持
捐助本站