python 深度学习中的4种激活函数

作者：coco2冰冰 | 2022-02-22 08:37

这篇文章主要介绍了python深度学习中的4种激活函数,帮助大家更好的进行深度学习，感兴趣的朋友可以了解下

这篇文章用来整理一下入门深度学习过程中接触到的四种激活函数，下面会从公式、代码以及图像三个方面介绍这几种激活函数，首先来明确一下是哪四种：

Sigmoid函数
Tahn函数
ReLu函数
SoftMax函数

激活函数的作用

下面图像A是一个线性可分问题，也就是说对于两类点(蓝点和绿点)，你通过一条直线就可以实现完全分类。

当然图像A是最理想、也是最简单的一种二分类问题，但是现实中往往存在一些非常复杂的线性不可分问题，比如图像B，你是找不到任何一条直线可以将图像B中蓝点和绿点完全分开的，你必须圈出一个封闭曲线。

而激活函数就是帮助"绘制"这个封闭曲线的非线性函数，有了激活函数的帮助，很多算法的处理能力会得到加强，也可以处理线性不可分问题。

Sigmoid函数

Sigmoid函数曾在介绍逻辑回归时提起过，它的数学表达式为：

其中 e 为纳皮尔常数，其值为2.7182... 它的图像如下：

可以观察出图像的一些特点：

曲线的值域为(0,1)
当x = 0时，Sigmoid函数值为0.5
随着 x 不断增大，Sigmoid函数值无限趋近于1
随着 x 不断减小，Sigmoid函数值无限趋近于0

对于梯度下降法而言，信息的更新很大程度上都取决于梯度，而Sigmoid函数一个很明显的缺点就是当函数值特别靠近0或1这两端时，因为它的曲线已经近乎平缓，所以此时的梯度几乎为0，这样非常不利于权重的更新，从而就会导致模型不收敛。

Sigmoid函数的代码如下：

import numpy as np
def tanh(x):
 return (exp(x)-exp(-x))/(exp(x)+exp(-x))

Tanh函数

Tanh函数是双曲正切函数，它的的数学表达式为：

Tanh函数和Sigmoid函数非常相近，这点从图像上可以很好的体现：

这两个函数相同的是，当输入的 x 值很大或者很小时，对应函数输出的 y 值近乎相等，同样的缺点也是梯度特别小，非常不利于权重的更新；不同的是Tanh函数的值域为(-1,1)，并且当 x = 0 时，输出的函数值为0。

Tanh函数的代码如下：

import numpy as np
def tanh(x):
 return (exp(x)-exp(-x))/(exp(x)+exp(-x))

ReLu函数

ReLu是线性整流函数，又称为修正性线性单元，它的函数的数学表达式为

Tanh是一个分段函数，它的图像如下：

图像很容易理解，若输入的 x 值小于0，则输出为也为0；若输入的 x 值大于0，则直接输出 x 值，需要注意的是ReLu函数在x = 0 处不连续(不可导)，但同样也可以作为激活函数。

与Sigmoid函数和Tanh函数相比，ReLu函数一个很明显的优点就是在应用梯度下降法是收敛较快，当输入值为整数时，不会出现梯度饱和的问题，因为大于0的部分是一个线性关系，这个优点让ReLu成为目前应用较广的激活函数。

ReLu函数的代码如下：

import numpy as np
def relu(x):
 return np.maximum(0,x)

SoftMax函数

分类问题可以分为二分类问题和多分类问题，Sigmoid函数比较适合二分类问题，而SoftMax函数更加适合多分类问题。
SoftMax函数的数学表达式为：

其中Vi表示分类器的输出，i表示类别索引，总的类别个数为C，Si表示当前元素的指数与所有元素指数和的比值。概括来说，SoftMax函数将多分类的输出值按比例转化为相对概率，使输出更容易理解和比较。

为了防止SoftMax函数计算时出现上溢出或者下溢出的问题，通常会提前对 V 做一些数值处理，即每个 V 减去 V 中的最大值，假设D=max(V)，SoftMax函数数学表达式更改为：

因为SoftMax函数计算的是概率，所以无法用图像进行展示，SoftMax函数的代码如下：

import numpy as np
def softmax(x):
 D = np.max(x)
 exp_x = np.exp(x-D)
 return exp_x / np.sum(exp_x)

以上就是python 深度学习中的4种激活函数的详细内容，更多关于python 激活函数的资料请关注其它相关文章！

推荐阅读

程序员
如何避免在Swift2中嵌套do/catch语句

如何解决《如何避免在Swift2中嵌套do/catch语句》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何正确地将MIDI刻度转换为毫秒？

如何解决《如何正确地将MIDI刻度转换为毫秒？》经验，为你挑选了1个好方法。 ... [详细]
程序员
生成器不是迭代器？

如何解决《生成器不是迭代器？》经验，为你挑选了2个好方法。 ... [详细]
程序员
通过EWS发送邮件时如何获取保存发送副本的ItemId

如何解决《通过EWS发送邮件时如何获取保存发送副本的ItemId》经验，为你挑选了1个好方法。 ... [详细]
程序员
关于`namedtuple`的一些内容在3.5.1中有所改变吗？

如何解决《关于`namedtuple`的一些内容在3.5.1中有所改变吗？》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何为PyPy安装lxml？

如何解决《如何为PyPy安装lxml？》经验，为你挑选了1个好方法。 ... [详细]
程序员
带有函数的参数和指针在C中的函数内部

如何解决《带有函数的参数和指针在C中的函数内部》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jackson JSON如何设置http连接和读取超时

如何解决《JacksonJSON如何设置http连接和读取超时》经验，为你挑选了0个好方法。 ... [详细]
程序员
面向iOS 9.0及更高版本的iPad应用需要83.5x83.5@2x app图标

如何解决《面向iOS9.0及更高版本的iPad应用需要83.5x83.5@2xapp图标》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Raspberry Pi debian中启动脚本上的Python编码问题

如何解决《在RaspberryPidebian中启动脚本上的Python编码问题》经验，为你挑选了0个好方法。 ... [详细]
程序员
设计时错误查找资源字典 - 项目之间不一致

如何解决《设计时错误查找资源字典-项目之间不一致》经验，为你挑选了0个好方法。 ... [详细]
程序员
最后一行打印两次(C++)

如何解决《最后一行打印两次(C++)》经验，为你挑选了1个好方法。 ... [详细]
程序员
将元组的字符串转换为元组

如何解决《将元组的字符串转换为元组》经验，为你挑选了1个好方法。 ... [详细]
程序员
Sitecore发布和滞后时间长达30秒

如何解决《Sitecore发布和滞后时间长达30秒》经验，为你挑选了0个好方法。 ... [详细]
程序员
选择新标签后,选择2:更新选项

如何解决《选择新标签后,选择2:更新选项》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有办法打印jupyter/ipython笔记本幻灯片演示文稿？

如何解决《有没有办法打印jupyter/ipython笔记本幻灯片演示文稿？》经验，为你挑选了1个好方法。 ... [详细]
程序员
同时使用ServiceStack和SimpleInjector来修复API服务

如何解决《同时使用ServiceStack和SimpleInjector来修复API服务》经验，为你挑选了1个好方法。 ... [详细]
程序员
Safari History.db history_visits.visit_time的格式是什么？

如何解决《SafariHistory.dbhistory_visits.visit_time的格式是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Windows上没有Python 3.5的cx_Oracle吗？

如何解决《在Windows上没有Python3.5的cx_Oracle吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在PHP中显示SUM列

如何解决《如何在PHP中显示SUM列》经验，为你挑选了1个好方法。 ... [详细]

coco2冰冰

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章