| 作者: | Arun |
| 语言: | 英文 |
| 出版年份: | 2020 |
| 编程语言: | Python |
| 其他分类: | 人工智能 |
| 下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
本书是一本面向数据科学初学者的实战指南,以 Pandas 为核心工具,系统讲解如何利用 Python 进行数据读取、清洗、转换、聚合、可视化及数据库交互。全书通过大量可运行的代码片段与真实场景案例,帮助读者在“短代码、高效率”的原则下快速掌握数据分析全流程。
fillna、interpolate、dropna、replace 四大工具,涵盖前向/后向填充、线性/时间插值、正则清洗等高级场景。agg、transform、filter、apply 四大操作。rolling、expanding 在时序数据中的使用,以及自定义函数实现特征工程。concat 纵向/横向合并,merge 支持 inner/outer/left/right 四种连接方式,并解决列名冲突。pivot、pivot_table 实现 Excel 式透视表;melt、stack/unstack 完成宽表与长表互转,支持多级索引。crosstab 快速生成列联表,支持百分比、自定义聚合函数。drop_duplicates 按列保留首次/末次/全部删除;drop 灵活移除行列或层级索引。sort_values 单/多列排序,处理缺失值位置,支持多种排序算法。date_range 生成工作日/自定义周末/带节假日日历;CustomBusinessDay 实现企业级排班。tz_localize、tz_convert 处理跨时区数据;shift、tshift 实现价格滞后与收益率计算。sqlalchemy + pymysql 读取整表或执行 SQL 查询,使用 to_sql 批量写入。pymongo 将文档型数据直接转为 DataFrame,支持字段筛选、插入、删除等操作。merge vs join vs concat),帮助读者根据场景选择最优方案。groupby 排序、窗口计算、数据库批量写入等节点给出性能优化建议。《Master Data Science and Data Analysis With Pandas》用“短代码、高可读”的方式,手把手教你把杂乱原始数据转化为洞见,是通往数据科学的第一块坚实垫脚石。