在做数据分析时都会用到 Pandas。虽然 Pandas 的功能十分强大。但是实际用的时候,并不能快速地找到对应的解决方案,那么其实 Pandas 官方早就提供了一份知识框架,放在了 Github 上。
地址:https://github.com/pandas-dev/pandas/tree/master/doc/cheatsheet

Pandas_Cheat_Sheet_页面_1 Pandas_Cheat_Sheet_页面_2

这两张图片一共归纳了 13 类常用的 Pandas 操作:

1、数据创建

介绍了几种常用的 DataFrame 创建语法

image-20230808151429579

2、数据重塑

这部分主要是一些在数据清洗中常用的方法,比如数据连接、数据排序、数据删除等,并且还对四个常用的操作给出了图示

image-20230808151700175

3、数据筛选

这一块区域主要是分别用行/列来讲解一些常用的数据查看、抽样、切片等操作,包含了tail、head、loc、iloc等非常重要的方法,并且同样给出了部分动画便于理解

image-20230808151935231

4、数据探索

这一块主要给出了一些在进行探索性分析时常用的方法,比如max、min、count等,不过官方将 apply 放在这里,并没有展开讲解

image-20230808152110313

5、数据修改

这两个区域为缺失值处理和创建新的列,重点用动画示例了assign和qcut方法,缺失值处理部分给出了两个方法

image-20230808152310734

6、数据分组

主要就是groupby和相关方法

image-20230808152421571

7、数据连接

这里介绍的还是非常详细!用图片例子来展示pd.merge中的各种参数变化的不同

image-20230808152543685

8、绘制图表

绘制可视化图表是 Pandas 的一个重要功能

image-20230808152709627

具体操作,还是以官方文档为主。