作者: | Hobson Lane and Maria Dyshel |
语言: | 英文 |
出版年份: | 2025 |
其他分类: | 人工智能 |
下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
《Natural Language Processing in Action, Second Edition》是由Hobson Lane和Maria Dyshel合著的第二版自然语言处理(NLP)领域的实践指南。本书由Manning Publications Co.于2025年出版,旨在帮助读者从理论到实践全面掌握NLP技术,并将其应用于构建智能对话系统和信息处理工具。
本书第一部分介绍了自然语言处理的基础知识,包括如何将自然语言文本转换为机器可以处理的向量模型。作者首先探讨了自然语言与编程语言的区别,强调了自然语言的模糊性和复杂性,并介绍了自然语言处理的基本概念,如自然语言理解(NLU)和自然语言生成(NLG)。接着,书中详细讲解了如何通过分词(Tokenization)、词干提取(Stemming)、词形还原(Lemmatization)等技术将文本分解为有意义的单元,并将其转换为数值向量。此外,还介绍了如何使用词频-逆文档频率(TF-IDF)向量来衡量单词在文档中的重要性,并通过余弦相似度等方法计算文本之间的相似性。
第二部分深入探讨了深度学习在自然语言处理中的应用。作者介绍了神经网络的基本原理,包括感知机(Perceptron)和多层感知机(MLP),并展示了如何使用深度学习框架(如PyTorch)构建和训练这些模型。书中还讨论了词嵌入(Word Embeddings)技术,如Word2Vec和GloVe,这些技术能够将单词映射到高维向量空间中,从而捕捉单词之间的语义关系。此外,作者还介绍了卷积神经网络(CNN)和循环神经网络(RNN)及其变体(如LSTM和GRU),这些模型能够处理序列数据,适用于文本分类、情感分析和机器翻译等任务。
第三部分聚焦于NLP的实际应用,展示了如何将前面介绍的技术应用于构建智能对话系统、信息提取和知识图谱等复杂任务。作者详细介绍了Transformer架构及其在语言模型中的应用,如BERT和GPT系列,并探讨了如何利用这些模型进行大规模文本生成和对话管理。此外,书中还讨论了如何将NLP技术应用于信息检索、情感分析、问答系统等领域,并提供了丰富的代码示例和实践指导。
本书适合有一定Python编程基础和机器学习知识的中级到高级开发者。无论是希望深入了解NLP技术的工程师,还是希望将NLP应用于实际业务的数据科学家,都能从本书中获得宝贵的指导和启发。
通过阅读《Natural Language Processing in Action, Second Edition》,读者将能够掌握从基础文本处理到复杂对话系统构建的全过程,为在自然语言处理领域的发展打下坚实的基础。