核心定位
本书由 Alex Soto Bueno、Markus Eisele 和 Natale Vinto 合著,O’Reilly 出版,面向希望在 Java 企业级开发中实际应用 AI(特别是生成式 AI 和大语言模型)的开发者。书中强调:构建生产级 AI 系统无需放弃 Java 的稳定性与成熟生态,也无需完全转向 Python。作者认为,现代 Java(结合 Quarkus 等云原生框架)和 LangChain4j 等工具,足以支撑安全、可观测、弹性的 AI 应用。
目标读者
- Java 开发者:希望将 AI/LLM 能力集成到现有项目中。
- IT 架构师/技术人员:关注 AI 在企业中的落地实践,而非纯理论。
- 不适合作为纯商业决策者或数据科学家的深度教材。
内容结构
全书共 12 章,按认知曲线层层递进:
- 企业 AI 困境:AI/ML/DL/GenAI 概念、MLOps vs DevOps、开源模型、数据质量与伦理。
- 新型应用类型:LLM 分类、模型架构(encoder/decoder)、微调、适配器、RAG、推理超参数。
- 提示工程:系统/用户/上下文提示、few-shot、CoT、函数调用、上下文工程与记忆设计。
- AI 架构:企业级 AI 应用的四层架构(应用组件 → 发现与访问 → 模型服务 → 数据准备),并强调可观测性。
- 向量嵌入与本地模型:向量生成、相似度计算、向量数据库、本地运行(Ollama、Podman AI、Jlama)。
- 推理 API:什么是推理 API,以及如何使用 DJL + Spring Boot 暴露 ONNX 模型。
- Java 访问推理模型:使用 Quarkus/Spring Boot 的 REST/gRPC 客户端调用推理服务。
- LangChain4j:统一 LLM API、提示模板、结构化输出、记忆、工具调用及 Spring Boot/Quarkus 集成。
- 向量嵌入与存储:用 DJL/LangChain4j 计算向量、文本分类/聚类、语义搜索、语义缓存。
- LangGraph4j:基于图的 Agent 编排,支持条件路由、人工介入、检查点与时间回溯。
- 图像处理:OpenCV 基本操作、轮廓检测、二维码/条码识别、视频流处理。
- 高级主题:流式响应、输入/输出护栏、MCP(Model Context Protocol)客户端与服务端开发。
关键技术栈
- 语言与运行时:Java 17+、Maven
- AI 集成框架:LangChain4j、LangGraph4j
- 模型推理:Ollama、Jlama、Podman AI Lab、DJL(支持 ONNX/PyTorch)
- 向量数据库:Chroma、pgvector、Redis、Milvus
- 云原生:Quarkus、Spring Boot、gRPC、REST
- 图像/视频处理:OpenCV(Java 绑定)
核心思想
- Java 不是 AI 的配角:企业早已在 Java 上运行最关键的业务,AI 应用也应复用同样的运行时、安全模型与运维体系。
- 提示工程 → 上下文工程:不能只关注单次提示,要系统化设计记忆、检索、工具调用和访问控制。
- RAG 是必须的:大多数企业场景需要将私有/实时数据注入 LLM,本书给出完整 RAG 流水线实现。
- Agent 需要图编排:LangGraph4j 让多 Agent 协作、人工介入、状态回溯变得可维护。
- 安全与治理:从输入/输出护栏到 MCP 标准化协议,确保 AI 行为合规、可审计。
适合的实践场景
- 构建企业级智能客服(记忆 + RAG + 工具调用)
- 基于向量数据库的语义搜索与推荐
- 图像中的文本/条码识别与校正
- 将传统 ONNX 模型封装为高性能 gRPC 服务
- 设计可中断、可回溯的多 Agent 工作流
总结评价
本书是一本 非常务实的 Java + AI 实战指南。它不回避 Java 在 AI 生态中的现实挑战,但通过 LangChain4j、Jlama、Quarkus 等工具,证明了 Java 完全有能力构建生产级 AI 应用。适合有一定 Java 经验、希望系统化学习 AI 集成,而非仅仅调用 API 的开发者。每章都配有可运行代码示例,且强调工程化考量(可观测性、成本、安全、多租户),使读者能直接迁移到企业项目中。