Pandas官方重要知识点速查表
在做数据分析时都会用到 Pandas。虽然 Pandas 的功能十分强大。但是实际用的时候,并不能快速地找到对应的解决方案,那么其实 Pandas 官方早就提供了一份知识框架,放在了 Github 上。
地址:https://github.com/pandas-dev/pandas/tree/master/doc/cheatsheet


这两张图片一共归纳了 13 类常用的 Pandas 操作:
1、数据创建
介绍了几种常用的 DataFrame 创建语法

2、数据重塑
这部分主要是一些在数据清洗中常用的方法,比如数据连接、数据排序、数据删除等,并且还对四个常用的操作给出了图示

3、数据筛选
这一块区域主要是分别用行/列来讲解一些常用的数据查看、抽样、切片等操作,包含了tail、head、loc、iloc等非常重要的方法,并且同样给出了部分动画便于理解

4、数据探索
这一块主要给出了一些在进行探索性分析时常用的方法,比如max、min、count等,不过官方将 apply 放在这里,并没有展开讲解

5、数据修改
这两个区域为缺失值处理和创建新的列,重点用动画示例了assign和qcut方法,缺失值处理部分给出了两个方法

6、数据分组
主要就是groupby和相关方法

7、数据连接
这里介绍的还是非常详细!用图片例子来展示pd.merge中的各种参数变化的不同

8、绘制图表
绘制可视化图表是 Pandas 的一个重要功能

具体操作,还是以官方文档为主。