专栏名称: Coggle数据科学
Coggle全称Communication For Kaggle,专注数据科学领域竞赛相关资讯分享。
今天看啥  ›  专栏  ›  Coggle数据科学

Kaggle知识点:sklearn增量训练与吞吐量

Coggle数据科学  · 公众号  ·  · 2024-05-25 12:37
    

文章预览

对于某些应用程序来说,实例的数量、特征的数量(或两者兼有)以及处理它们的速度对传统方法来说都是一个挑战。在这些情况下,scikit-learn 提供了一些选项,可以帮助系统实现规模化。 unset unset 流式与增量训练 unset unset 外部记忆(或“外存”)学习是一种从不能完全装入计算机主存(RAM)中的数据进行学习的技术。下面是一个设计来实现这一目标的系统概要: 一个流式传输实例的方法 一个从实例中提取特征的方法 一个增量算法 增量学习在 scikit-learn 中有许多选择。虽然并非所有算法都能增量学习(即在不一次性看到所有实例的情况下学习),但所有实现了 partial_fit API 的估计器都是候选项。 从小批量实例中增量学习(有时称为“在线学习”)的能力是外部记忆学习的关键,因为它保证了任何时候主存中只会有少量实例。 分类 sklearn.naive_b ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览