作者: | Chris Fregly and Antje Barth |
语言: | 英文 |
出版年份: | 2021 |
下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
《Data Science on AWS》是一本由Chris Fregly和Antje Barth合著的实用指南,旨在帮助读者在亚马逊网络服务(AWS)平台上成功构建和部署数据科学项目。本书详细介绍了如何利用AWS的机器学习(ML)和人工智能(AI)工具,实现从数据摄取到模型部署的端到端流程。书中不仅涵盖了数据科学的基础知识,还深入探讨了如何在云环境中高效地运行数据科学项目,强调了成本控制、性能优化和安全性的重要性。
书中首先介绍了AWS提供的广泛数据科学工具和服务,包括Amazon SageMaker、Amazon Redshift、Amazon Athena等。这些工具能够帮助数据科学家快速构建模型、进行数据分析和优化性能。例如,Amazon SageMaker是一个完全托管的机器学习平台,支持从数据预处理到模型部署的全流程操作。
本书通过多个实际案例,展示了如何在AWS上实施数据科学项目。这些案例涵盖了自然语言处理(NLP)、计算机视觉、欺诈检测、预测性维护等多个领域。例如,使用Amazon Comprehend进行文本分类,以及利用Amazon Rekognition检测不适当视频内容等。
书中详细介绍了如何利用AWS的自动化机器学习服务,如SageMaker Autopilot,快速构建和优化模型。这些服务能够自动选择最佳算法、调整超参数,并生成模型训练代码,大大减少了数据科学家的工作量。
本书深入探讨了如何将数据摄取到AWS云中,并进行有效的数据处理。介绍了Amazon S3作为数据湖的使用方法,以及如何通过AWS Lake Formation创建和管理数据湖。同时,还讨论了如何使用Amazon Athena和AWS Glue等工具进行数据查询和转换。
书中详细介绍了如何在AWS上训练和部署机器学习模型。包括如何使用SageMaker进行分布式训练、如何优化模型性能,以及如何将模型部署为实时预测服务或批量预测任务。
本书强调了数据科学项目在云环境中的安全性和合规性。介绍了AWS的身份与访问管理(IAM)服务、数据加密、网络隔离等安全措施,以及如何确保数据的合规性。
本书适合任何使用数据进行决策的专业人士,包括数据分析师、数据科学家、机器学习工程师、应用开发人员和DevOps工程师。无论读者是否具备云计算或机器学习的背景,本书都能帮助他们快速提升在AWS平台上进行数据科学项目的能力。
总之,《Data Science on AWS》是一本全面、实用且易于上手的数据科学指南,适合希望在AWS平台上开展数据科学项目的读者学习和参考。