专栏名称: 数据STUDIO
点击领取《Python学习手册》,后台回复「福利」获取。『数据STUDIO』专注于数据科学原创文章分享,内容以 Python 为核心语言,涵盖机器学习、数据分析、可视化、MySQL等领域干货知识总结及实战项目。
今天看啥  ›  专栏  ›  数据STUDIO

Pandas中高效的“For循环”

数据STUDIO  · 公众号  ·  · 2024-08-09 11:30

文章预览

循环是我们编程技能中的一项固有技能。当我们熟悉任何编程语言时,循环就会成为一个基本的、易于解释的概念。 在这篇博文中,我们将探索遍历pandas dataframe的各种方法,检查每个循环方法的相关运行时。为了验证循环的有效性,我们将生成百万级别的数据,这也是我们在日常处理中经常遇到的数量级。 实验数据集 我们将生成一个包含600万行和4列的DataFrame。每一列将被分配一个0到50之间的随机整数。  import numpy as np  import pandas as pd  df = pd.DataFrame(np.random.randint(0, 50, size=(6000000, 4)), columns=( 'a' , 'b' , 'c' , 'd' ))  df.shape   # (6000000, 5)  df.head() Iterrows 我们通过基于以下标准引入一个新的列' e '来扩展数据框架' df ': 如果' a '等于0,那么' e '取' d '的值。如果' a '在0(不包括)到25(包括)的范围内,' e '计算为' b '减去' c '。如果以上条件都不成立 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览