今天看啥  ›  专栏  ›  Python极客专栏

最强 Pandas 平替 -- Polars

Python极客专栏  · 公众号  ·  · 2024-06-21 11:44
    

文章预览

Polars是一个用于操作结构化数据的高性能DataFrame库,可以说是平替pandas最有潜质的包。Polars其核心部分是用Rust编写的,但该库也提供了Python接口。它的主要特点包括: 快速: Polars是从零开始编写的,紧密与机器结合,没有外部依赖。 I/O: 对所有常见数据存储层提供一流支持:本地、云存储和数据库。 易于使用: 以原始意图编写查询。Polars 在内部会使用其查询优化器确定执行最有效的方式。 离线处理: Polars支持通过其流式API进行离线数据转换。这使您能够处理结果,而无需同时将所有数据存储在内存中。 并行处理: Polars通过在可用的CPU核心之间分配工作负载,充分利用计算机性能,而无需额外配置。 矢量化查询引擎: Polars使用 Apache Arrow,一种列式数据格式,以矢量化方式处理查询。它使用 SIMD 来优化CPU使用。 User guide: https://pola-rs.github.io/polars/user-g ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览