作者: | Vaibhav Verdhan |
语言: | 英文 |
出版年份: | 2025 |
下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
《Data Without Labels》面向两类读者:
全书以“少数学、重代码、重业务”为写作哲学,用 11 章 + 附录构建“从理论到生产”的完整闭环。
| 部分 | 章节 | 关键词 | 目标 | |---|---|---|---| | Part 1 基础 | 1–3 章 | 聚类、降维、数据质量 | 夯实无监督学习底座 | | Part 2 进阶 | 4–7 章 | 关联规则、高级聚类、高级降维、文本 | 解决中高维复杂场景 | | Part 3 深度 & GenAI | 8–11 章 | 自编码器、GAN、ChatGPT、端到端部署 | 打通深度学习与生成式 AI 全流程 |
| 行业 | 业务痛点 | 书中解法 | |---|---|---| | 零售 | 客户细分、商品摆放 | K-Means + 关联规则 → 提升客单价 12% | | 银行 | 信用卡欺诈 | 自编码器异常检测 → 漏报率下降 35% | | 医疗 | 高光谱图像病灶识别 | PCA + UMAP → 计算时间从小时级压缩到分钟级 | | 电信 | 用户流失预测 | GMM 软聚类 → 精准定位“摇摆用户”群体 |
vverdhan/DataWithoutLabels
,Jupyter Notebook 逐章对应“无标签不是无方向,而是让数据自己说话。”——Vaibhav Verdhan