专栏名称: Crossin的编程教室
编程世界的新手村。 这里有可能是最简单的 Python 入门教程。 每天5分钟,轻松学编程。
目录
相关文章推荐
今天看啥  ›  专栏  ›  Crossin的编程教室

20个案例详解Pandas的数据统计与排序

Crossin的编程教室  · 公众号  · Python  · 2024-09-04 13:31

主要观点总结

本文主要介绍了Pandas模块中的数据统计与排序功能,包括value_counts方法和sort_values方法的详细使用。文章先介绍了value_counts方法中的参数及其常用解释,然后介绍了sort_values方法中的参数及其使用场景。除此之外,还涉及了数据的分组统计、连续型数据分箱、数据的自定义排序等高级用法。

关键观点总结

关键观点1: value_counts方法用于计算各类别的出现次数,可以统计连续型数据或分类数据。

value_counts方法中的参数包括subset、normalize、ascending、dropna等,可以根据需求进行自定义。

关键观点2: sort_values方法用于对数值进行排序,可以根据单个或多个字段进行排序,也可以自定义排序方式。

sort_values方法中的参数包括by、axis、ascending、inplace、kind、ignore_index等,可以根据具体场景选择合适的参数。

关键观点3: 除了基本的统计和排序功能,Pandas还提供了分组统计、连续型数据分箱等高级用法。

这些功能可以更加灵活地处理数据,提取有用的信息。


文章预览

今天来给大家讲一下 Pandas 模块当中的数据统计与排序,说到具体的就是 value_counts() 方法以及 sort_values() 方法。 value_counts() 方法,顾名思义,主要是用于计算各个类别出现的次数的,而 sort_values() 方法则是对数值来进行排序,当然除了这些,还有很多大家不知道的衍生的功能等待被挖掘,下面小编就带大家一个一个的说过去。 导入模块并且读取数据库 我们这次用到的数据集是“非常有名”的泰坦尼克号的数据集,该数据源能够在很多平台上都能够找得到 import pandas as pd df = pd.read_csv( "titanic_train.csv" ) df.head() output 常规的用法 首先我们来看一下常规的用法,代码如下 df[ 'Embarked' ].value_counts() output S    644 C    168 Q     77 Name: Embarked, dtype: int64 下面我们简单来介绍一下 value_counts() 方法当中的参数, DataFrame.value_counts(subset=None,           ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览