主要观点总结
本文主要介绍了支持向量机(SVM)解决分类问题的原理,通过图解方式解释SVM中数据分类的过程,包括寻找最优分割线的过程。文章还详细解释了如何通过数学方法绘制分割线,并阐述了最佳分割线的寻找方法。
关键观点总结
关键观点1: 支持向量机(SVM)是用于解决分类问题的工具,通过将数据分为正类和负类来帮助解决各种问题。
SVM基于约束优化,旨在找到一条能够最大化间距的分割线(或分割面),以最好地分割数据。
关键观点2: 图解展示了SVM中数据分类的过程。通过可视化数据点和分割线,可以直观地理解SVM的工作原理。
通过寻找穿过原点的线并参数化,可以捕捉到所有此类线。这些线上的每个点都与某个向量垂直,这个向量被称为w。
关键观点3: 文章详细解释了如何通过数学方法绘制分割线,包括通过公式找到代表分割线的w和b。
通过最大化所有点到分割线的间距,可以找到最优分割线。这个间距被称为“间距”。
关键观点4: 文章阐述了如何通过解决优化问题来找到最优分割线。这个问题涉及到二次规划求解器。
通过简化优化问题,可以得到一个包含w和b的公式,用于求解最优分割线。
文章预览
选自 | towardsdatascience 作者 | Rohit Pandey 转自 | 机器之心编译 参与 | 魔王、张倩 作者说:我以前一直没有真正理解支持向量机,直到我画了一张图。 一、 问题 支持向量机(SVM)旨在解决「分类」问题。数据通常包含一定数量的条目/行/点。现在,我们想对每个数据点进行分类。为简单起见,我们假设两个类别:「正类」和「负类」。这或许可以帮助解答以下问题: 基于图像的像素数据,判断这张图像中是否有猫(有猫则标签为正类); 基于邮件的主题、发送者、文本等,判断该邮件是否为垃圾邮件; 判断某个病人是否患有某种疾病。 其精髓在于,当我们知道正确答案时,我们会想到一些将数据分为两类的规则(对于支持向量机而言,「规则」是画一个平面,一侧的所有点均为「正」,另一侧的所有点均为「负」)。当我们遇到不知道类
………………………………