作者: | Christopher Brousseau and Matthew Sharp |
语言: | 英文 |
出版年份: | 2025 |
其他分类: | 人工智能 |
下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
《LLMs in Production: From Language Models to Successful Products》是由Christopher Brousseau和Matthew Sharp合著,Joe Reis作序的一本专注于如何将大型语言模型(LLMs)从实验室推向实际生产应用的书籍。本书由Manning Publications在2025年出版,旨在为那些希望在实际业务中部署LLMs的技术人员、数据科学家、机器学习工程师以及产品经理提供全面的指导。
随着LLMs技术的飞速发展,其在自然语言处理(NLP)领域的应用已经从简单的文本生成扩展到复杂的多模态交互、代码生成、智能助手等多个领域。然而,将这些强大的模型从研究阶段成功转化为实际产品并非易事。本书的作者凭借在机器学习和语言学领域的深厚背景,结合他们在JPMorgan Chase等公司的工作经验,编写了这本实用性强的指南,旨在帮助读者跨越从模型构建到产品部署的鸿沟。
本书共分为12章,内容涵盖了从LLMs的基础知识到实际部署的全过程。每一章都围绕一个核心主题展开,提供了丰富的技术细节、实用建议以及实际案例。
介绍了LLMs的兴起及其在加速沟通方面的潜力,探讨了在构建LLMs时需要考虑的“购买与自建”的决策因素,并对一些常见的误解进行了澄清。
深入讲解了语言模型的理论基础,包括语言学的基本概念、语言建模技术的发展历程,以及注意力机制和Transformer架构的原理。
探讨了在生产环境中部署LLMs时面临的各种挑战,如模型的下载、部署时间长、延迟问题、GPU资源管理等,并介绍了LLMOps(LLMs运维)的基本概念和最佳实践。
讨论了为LLMs准备数据的重要性,包括如何选择基础模型、评估LLMs的性能、准备训练数据以及创建自定义的分词器和嵌入向量。
讲解了从头开始训练LLMs的方法,以及如何通过微调(finetuning)、知识蒸馏、强化学习等技术来优化模型。
介绍了如何将LLMs封装为服务,包括模型编译、存储策略、自适应请求批处理、流量控制等,并讨论了在生产环境中部署LLMs时需要考虑的基础设施问题。
探讨了如何通过精心设计的提示(prompt)来提升LLMs的性能,介绍了提示工程的基本概念、工具以及高级技巧。
讨论了围绕LLMs构建交互式应用的方法,包括前端流式传输、对话历史记录、聊天机器人交互功能等。
通过一个具体的项目案例,展示了如何重新实现LLama模型,并将其部署到Hugging Face Hub Space。
介绍了如何利用LLMs构建编程辅助工具,如VSCode插件,并分享了开发过程中的经验和教训。
探讨了如何在资源受限的树莓派设备上部署LLMs,并提出了一些优化建议。
对LLMs的未来发展进行了展望,包括政府监管、模型规模、多模态应用、数据集发展、幻觉问题解决、新硬件以及智能代理的实用性等。
本书适合那些希望在实际项目中应用LLMs的专业人士,包括但不限于机器学习工程师、数据科学家、软件工程师、产品经理以及对LLMs感兴趣的技术爱好者。无论是初学者还是有一定经验的从业者,都能从本书中获得宝贵的指导和启发。
《LLMs in Production》不仅涵盖了LLMs的理论基础,还提供了丰富的实践案例和代码示例,帮助读者更好地理解和应用这些技术。书中还讨论了LLMs在生产环境中可能遇到的各种问题,如性能优化、成本控制、安全性和伦理问题,并提供了相应的解决方案。此外,本书还提供了在线资源和社区支持,方便读者在学习过程中交流和解决问题。
总之,《LLMs in Production》是一本全面、实用且具有前瞻性的书籍,对于那些希望在实际业务中利用LLMs技术的读者来说,是一本不可多得的指南。