4赞

python机器学习理论与实战（五）支持向量机

作者：LEEstarmmmmm | 2022-01-26 11:05

这篇文章主要为大家详细介绍了python机器学习理论与实战第五篇，支持向量机的相关资料，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

做机器学习的一定对支持向量机（support vector machine-SVM）颇为熟悉，因为在深度学习出现之前，SVM一直霸占着机器学习老大哥的位子。他的理论很优美，各种变种改进版本也很多，比如latent-SVM, structural-SVM等。这节先来看看SVM的理论吧，在（图一）中A图表示有两类的数据集，图B,C,D都提供了一个线性分类器来对数据进行分类？但是哪个效果好一些？

（图一）

可能对这个数据集来说，三个的分类器都一样足够好了吧，但是其实不然，这个只是训练集，现实测试的样本分布可能会比较散一些，各种可能都有，为了应对这种情况，我们要做的就是尽可能的使得线性分类器离两个数据集都尽可能的远，因为这样就会减少现实测试样本越过分类器的风险，提高检测精度。这种使得数据集到分类器之间的间距（margin）最大化的思想就是支持向量机的核心思想，而离分类器距离最近的样本成为支持向量。既然知道了我们的目标就是为了寻找最大边距，怎么寻找支持向量？如何实现？下面以（图二）来说明如何完成这些工作。

（图二）

假设（图二）中的直线表示一个超面，为了方面观看显示成一维直线，特征都是超面维度加一维度的，图中也可以看出，特征是二维，而分类器是一维的。如果特征是三维的，分类器就是一个平面。假设超面的解析式为，那么点A到超面的距离为,下面给出这个距离证明：

（图三）

在（图三）中，青色菱形表示超面，Xn为数据集中一点，W是超面权重，而且W是垂直于超面的。证明垂直很简单，假设X'和X''都是超面上的一点，

因此W垂直于超面。知道了W垂直于超面，那么Xn到超面的距离其实就是Xn和超面上任意一点x的连线在W上的投影，如（图四）所示：

套进拉格朗日乘子法公式得到如（公式五）所示的样子：

（公式五）

在（公式五）中通过拉格朗日乘子法函数分别对W和b求导，为了得到极值点，令导数为0，得到

,然后把他们代入拉格朗日乘子法公式里得到（公式六）的形式：

（公式六）

（公式六）后两行是目前我们要求解的优化函数，现在只需要做个二次规划即可求出alpha,二次规划优化求解如（公式七）所示：

（公式七）

通过（公式七）求出alpha后，就可以用（公式六）中的第一行求出W。到此为止，SVM的公式推导基本完成了，可以看出数学理论很严密，很优美，尽管有些同行们认为看起枯燥，但是最好沉下心来从头看完，也不难，难的是优化。二次规划求解计算量很大，在实际应用中常用SMO（Sequential minimal optimization）算法，SMO算法打算放在下节结合代码来说。

参考文献：

[1]machine learning in action. Peter Harrington

[2] Learning From Data. Yaser S.Abu-Mostafa

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

程序员
依赖注入类型选择

如何解决《依赖注入类型选择》经验，为你挑选了1个好方法。 ... [详细]
程序员
从泛型类型的trait调用静态方法

如何解决《从泛型类型的trait调用静态方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
Could not autowire field:private org.springframework.security.crypto.password.PasswordEncoder;

如何解决《Couldnotautowirefield:privateorg.springframework.security.crypto.password.PasswordEncoder;》经验，为你挑选了1个好方法。 ... [详细]
程序员
Node.js - Express.js JWT,如何检查令牌是否过期？

如何解决《Node.js-Express.jsJWT,如何检查令牌是否过期？》经验，为你挑选了3个好方法。 ... [详细]
程序员
通用方法调用混淆

如何解决《通用方法调用混淆》经验，为你挑选了1个好方法。 ... [详细]
程序员
搜索多种文件类型的单词

如何解决《搜索多种文件类型的单词》经验，为你挑选了1个好方法。 ... [详细]
程序员
将数据帧转换为字典

如何解决《将数据帧转换为字典》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在没有UTF-8特定代码的情况下解析多语言文档

如何解决《如何在没有UTF-8特定代码的情况下解析多语言文档》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误"java.lang.NoSuchFieldError:WRITE_DURATIONS_AS_TIMESTAMPS"

如何解决《错误"java.lang.NoSuchFieldError:WRITE_DURATIONS_AS_TIMESTAMPS"》经验，为你挑选了1个好方法。 ... [详细]
程序员
Golang结构数组值不附加In循环

如何解决《Golang结构数组值不附加In循环》经验，为你挑选了1个好方法。 ... [详细]
程序员
功能等同于带有变量比较的if表达式

如何解决《功能等同于带有变量比较的if表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有一个函数来检查安装了devtools :: install_github的软件包是否已更新？

如何解决《是否有一个函数来检查安装了devtools::install_github的软件包是否已更新？》经验，为你挑选了0个好方法。 ... [详细]
程序员
仅在需要AngularJS时才注入模块依赖项(如插件)

如何解决《仅在需要AngularJS时才注入模块依赖项(如插件)》经验，为你挑选了1个好方法。 ... [详细]
程序员
Ruby:定义自己的转换方法/协议

如何解决《Ruby:定义自己的转换方法/协议》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在oracle中将日期转换为时间戳(DD-MON-YYYY HH24:MI:SS.FF格式)？

如何解决《如何在oracle中将日期转换为时间戳(DD-MON-YYYYHH24:MI:SS.FF格式)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在角度中使用npm模块？

如何解决《如何在角度中使用npm模块？》经验，为你挑选了0个好方法。 ... [详细]
程序员
laravel / dingo API上的变压器用法

如何解决《laravel/dingoAPI上的变压器用法》经验，为你挑选了1个好方法。 ... [详细]
程序员
Qt Android蓝牙套接字在Android 5.1.1和6.0上编写问题

如何解决《QtAndroid蓝牙套接字在Android5.1.1和6.0上编写问题》经验，为你挑选了0个好方法。 ... [详细]
程序员
将currentCalendar()Date转换为NSCalendarIdentifierChinese

如何解决《将currentCalendar()Date转换为NSCalendarIdentifierChinese》经验，为你挑选了0个好方法。 ... [详细]
程序员
子字符串:在字符串中获取"或"出现的索引

如何解决《子字符串:在字符串中获取"或"出现的索引》经验，为你挑选了1个好方法。 ... [详细]

LEEstarmmmmm

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章