9赞

CS231n:如何计算Softmax损失函数的梯度？

作者：手机用户2502852037 | 2023-09-07 11:39

如何解决《CS231n:如何计算Softmax损失函数的梯度？》经验，为你挑选了1个好方法。

我正在观看Stanford CS231的一些视频:用于视觉识别的卷积神经网络,但不太了解如何使用软件丢失函数计算分析梯度numpy.

从这个stackexchange答案,softmax梯度计算如下:

在此输入图像描述

上面的Python实现是:

num_classes = W.shape[0]
num_train = X.shape[1]
for i in range(num_train):
  for j in range(num_classes):
    p = np.exp(f_i[j])/sum_i
    dW[j, :] += (p-(j == y[i])) * X[:, i]

任何人都可以解释上面的代码片段是如何工作的？softmax的详细实现也包括在下面.

def softmax_loss_naive(W, X, y, reg):
  """
  Softmax loss function, naive implementation (with loops)
  Inputs:
  - W: C x D array of weights
  - X: D x N array of data. Data are D-dimensional columns
  - y: 1-dimensional array of length N with labels 0...K-1, for K classes
  - reg: (float) regularization strength
  Returns:
  a tuple of:
  - loss as single float
  - gradient with respect to weights W, an array of same size as W
  """
  # Initialize the loss and gradient to zero.
  loss = 0.0
  dW = np.zeros_like(W)

  #############################################################################
  # Compute the softmax loss and its gradient using explicit loops.           #
  # Store the loss in loss and the gradient in dW. If you are not careful     #
  # here, it is easy to run into numeric instability. Don't forget the        #
  # regularization!                                                           #
  #############################################################################

  # Get shapes
  num_classes = W.shape[0]
  num_train = X.shape[1]

  for i in range(num_train):
    # Compute vector of scores
    f_i = W.dot(X[:, i]) # in R^{num_classes}

    # Normalization trick to avoid numerical instability, per http://cs231n.github.io/linear-classify/#softmax
    log_c = np.max(f_i)
    f_i -= log_c

    # Compute loss (and add to it, divided later)
    # L_i = - f(x_i)_{y_i} + log \sum_j e^{f(x_i)_j}
    sum_i = 0.0
    for f_i_j in f_i:
      sum_i += np.exp(f_i_j)
    loss += -f_i[y[i]] + np.log(sum_i)

    # Compute gradient
    # dw_j = 1/num_train * \sum_i[x_i * (p(y_i = j)-Ind{y_i = j} )]
    # Here we are computing the contribution to the inner sum for a given i.
    for j in range(num_classes):
      p = np.exp(f_i[j])/sum_i
      dW[j, :] += (p-(j == y[i])) * X[:, i]

  # Compute average
  loss /= num_train
  dW /= num_train

  # Regularization
  loss += 0.5 * reg * np.sum(W * W)
  dW += reg*W

  return loss, dW

小智.. 14

不确定这是否有帮助,但是:

$y_i$ 真的是指标功能 $Ind\{y_i=j\}$ ,如这里所述.这(j == y[i])在代码中形成表达式.

此外,相对于权重的损失梯度是:

$\frac{dL}{dW} = \frac{dL}{df} \frac{df}{dW$

哪里

$\frac{df}{dW} = X_i$

这是X[:,i]代码的起源.

1> 小智..：

不确定这是否有帮助,但是:

$y_i$ 真的是指标功能 $Ind\{y_i=j\}$ ,如这里所述.这(j == y[i])在代码中形成表达式.

此外,相对于权重的损失梯度是:

$\frac{dL}{dW} = \frac{dL}{df} \frac{df}{dW$

哪里

$\frac{df}{dW} = X_i$

这是X[:,i]代码的起源.

推荐阅读

程序员
蓝鸟警告"承诺是在处理程序中创建的,但未从中返回"

如何解决《蓝鸟警告"承诺是在处理程序中创建的,但未从中返回"》经验，为你挑选了2个好方法。 ... [详细]
程序员
没有名为_cffi_backend的模块

如何解决《没有名为_cffi_backend的模块》经验，为你挑选了2个好方法。 ... [详细]
程序员
std :: future.get()有时会卡在os x中

如何解决《std::future.get()有时会卡在osx中》经验，为你挑选了0个好方法。 ... [详细]
程序员
两个相同的字符串可以是C#中的两个独立实例吗？

如何解决《两个相同的字符串可以是C#中的两个独立实例吗？》经验，为你挑选了2个好方法。 ... [详细]
程序员
需要多个系列的堆积柱形图

如何解决《需要多个系列的堆积柱形图》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法用gulp启动webpack-dev-server

如何解决《无法用gulp启动webpack-dev-server》经验，为你挑选了1个好方法。 ... [详细]
程序员
类应用程序(框架)如何工作？

如何解决《类应用程序(框架)如何工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Visual Studio代码中调试单元测试

如何解决《如何在VisualStudio代码中调试单元测试》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何正确使用python socket.settimeout（）

如何解决《如何正确使用pythonsocket.settimeout（）》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用JPA获取整个实体图

如何解决《如何使用JPA获取整个实体图》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Swift中,如何确定设备屏幕的物理尺寸？

如何解决《在Swift中,如何确定设备屏幕的物理尺寸？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在不将空值输出到输出数组的情况下拆分字符串

如何解决《如何在不将空值输出到输出数组的情况下拆分字符串》经验，为你挑选了2个好方法。 ... [详细]
程序员
Virtualbox无法从GPT物理分区启动guest虚拟机

如何解决《Virtualbox无法从GPT物理分区启动guest虚拟机》经验，为你挑选了1个好方法。 ... [详细]
程序员
下载视频和播放

如何解决《下载视频和播放》经验，为你挑选了2个好方法。 ... [详细]
程序员
Django 1.9安装语法错误:语法无效

如何解决《Django1.9安装语法错误:语法无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
在UserControl中捕获Esc键

如何解决《在UserControl中捕获Esc键》经验，为你挑选了1个好方法。 ... [详细]
程序员
Instagram API无法找到有关私人资料的信息

如何解决《InstagramAPI无法找到有关私人资料的信息》经验，为你挑选了0个好方法。 ... [详细]
程序员
通过Python连接到Interactive Brokers API

如何解决《通过Python连接到InteractiveBrokersAPI》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何写单元测试接收nsnotification异步？

如何解决《如何写单元测试接收nsnotification异步？》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么是linux irq域名,为什么需要它们？

如何解决《什么是linuxirq域名,为什么需要它们？》经验，为你挑选了1个好方法。 ... [详细]

手机用户2502852037

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章