主要观点总结
本文主要介绍了Pandas模块中的数据统计与排序功能,包括value_counts方法和sort_values方法的详细使用。文章先介绍了value_counts方法中的参数及其常用解释,然后介绍了sort_values方法中的参数及其使用场景。除此之外,还涉及了数据的分组统计、连续型数据分箱、数据的自定义排序等高级用法。
关键观点总结
关键观点1: value_counts方法用于计算各类别的出现次数,可以统计连续型数据或分类数据。
value_counts方法中的参数包括subset、normalize、ascending、dropna等,可以根据需求进行自定义。
关键观点2: sort_values方法用于对数值进行排序,可以根据单个或多个字段进行排序,也可以自定义排序方式。
sort_values方法中的参数包括by、axis、ascending、inplace、kind、ignore_index等,可以根据具体场景选择合适的参数。
关键观点3: 除了基本的统计和排序功能,Pandas还提供了分组统计、连续型数据分箱等高级用法。
这些功能可以更加灵活地处理数据,提取有用的信息。
文章预览
今天来给大家讲一下 Pandas 模块当中的数据统计与排序,说到具体的就是 value_counts() 方法以及 sort_values() 方法。 value_counts() 方法,顾名思义,主要是用于计算各个类别出现的次数的,而 sort_values() 方法则是对数值来进行排序,当然除了这些,还有很多大家不知道的衍生的功能等待被挖掘,下面小编就带大家一个一个的说过去。 导入模块并且读取数据库 我们这次用到的数据集是“非常有名”的泰坦尼克号的数据集,该数据源能够在很多平台上都能够找得到 import pandas as pd df = pd.read_csv( "titanic_train.csv" ) df.head() output 常规的用法 首先我们来看一下常规的用法,代码如下 df[ 'Embarked' ].value_counts() output S 644 C 168 Q 77 Name: Embarked, dtype: int64 下面我们简单来介绍一下 value_counts() 方法当中的参数, DataFrame.value_counts(subset=None,
………………………………