专栏名称: 数据STUDIO
点击领取《Python学习手册》,后台回复「福利」获取。『数据STUDIO』专注于数据科学原创文章分享,内容以 Python 为核心语言,涵盖机器学习、数据分析、可视化、MySQL等领域干货知识总结及实战项目。
今天看啥  ›  专栏  ›  数据STUDIO

启发式方法给K-Means选择较好的初始质心

数据STUDIO  · 公众号  ·  · 2024-08-30 11:30

文章预览

今天云朵君和大家一起学习最简单的聚类算法K-Means算法中启发式选择初始聚类中心的方法,深入探究K-Means++算法中的细节! 一、K-Means 1. 概念 k-means algorithm算法: K-均值(K-Means)属于聚类算法,之所以称为K-均值是因为它把n个样本根据它们的属性分为k个簇(k < n),且每个簇的中心采用簇中所含值的均值计算而成。 聚类: 一种无监督的学习,事先不知道类别,自动将相似的对象归到同一簇中。 聚类作为一种典型的数据挖掘方法,一直以来都是人工智能领域的一个研究热点,被广泛地应用于人脸图像识别、股票分析预测、搜索引擎、生物信息学等领域中。 2. K-Means算法思想 随机选择K个中心值 根据样本数据各点与中心点的距离来进行归簇 通过各个簇的均值,更新为每个簇的中心值 重复2、3,直至聚类中心的位置不再变化 3. K-Means特点 适用数据类 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览