专栏名称: 新语数据故事汇
《新语数据故事汇,数说新语》科普数据科学、讲述数据故事,深层次挖掘数据价值。
今天看啥  ›  专栏  ›  新语数据故事汇

一文带您了解数据缩放(Data Scaling):标准化和最小最大缩放

新语数据故事汇  · 公众号  ·  · 2024-08-16 17:00

文章预览

数据缩放是数据预处理中的一个关键步骤,它将特征转换为相似的量纲或范围,通常在训练机器学习模型之前进行。数据缩放的主要目的是确保所有特征对模型的贡献是均等的,并提升模型的性能,因为一些算法在特征被缩放后能更快收敛。 常见的数据缩放方法包括标准化(Standardization)和 Min-Max 缩放(Min-Max Scaling): 标准化(Standardization) :将数据转换为均值为 0 和标准差为 1 的分布。这种方法适用于许多机器学习算法(尤其是深度学习算法),它们通常假设数据符合标准正态分布。然而,标准化对异常值较为敏感,更适合于已经呈正态分布的数据。 Min-Max 缩放(Min-Max Scaling) :将数据缩放到介于 0 和 1 之间的范围。这种方法对异常值也敏感,但在处理稀疏数据时能够保留值为 0 的数据,并且能够保持数据的原始分布形状。 此外,如果数据 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览