今天看啥  ›  专栏  ›  蚂蚁学Python

实用,pandas的分组统计的三个常见问题

蚂蚁学Python  · 公众号  ·  · 2024-07-10 17:39
    

文章预览

1、怎样给每行数据,添加该分组的平均值 例如,对于员工的数据,包括员工ID、部门名称、薪资,怎么给每行数据,添加所属部门的平均薪资 import pandas as pd # 创建示例数据 data = { 'EmployeeID' : [ 1 , 2 , 3 , 4 , 5 ], 'Department' : [ 'HR' , 'IT' , 'HR' , 'IT' , 'Finance' ], 'Salary' : [ 50000 , 60000 , 52000 , 62000 , 70000 ] } df = pd . DataFrame ( data ) # 自定义函数,添加部门平均薪资列 def add_department_avg_salary ( group ): group [ 'DepartmentAvgSalary' ] = group [ 'Salary' ]. mean () return group # 使用groupby和apply添加部门平均薪资 df = df . groupby ( 'Department' ). apply ( add_department_avg_salary ) print ( df ) 定义一个自定义函数 add_department_avg_salary,该函数接受一个分组的数据框,并计算该分组的平均薪资,将其添加为新列。 使用groupby和apply: 使用 groupby 按部门对数 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览