13赞

TensorFlow中的KL分歧

作者：wurtjq | 2023-09-06 14:14

如何解决《TensorFlow中的KL分歧》经验，为你挑选了3个好方法。

我有两个张量,prob_a并prob_b与形状[None, 1000],我想从计算KL散prob_a到prob_b.TensorFlow中是否有内置功能？我尝试过使用tf.contrib.distributions.kl(prob_a, prob_b)但它给出了:

prob_a

如果没有内置功能,那么什么是好的解决方法？

1> meferne..：

假设您的输入张量prob_a并且prob_b是沿第一轴总和为1的概率张量,您可以这样做:

def kl(x, y):
    X = tf.distributions.Categorical(probs=x)
    Y = tf.distributions.Categorical(probs=y)
    return tf.distributions.kl_divergence(X, Y)

result = kl(prob_a, prob_b)

一个简单的例子:

import numpy as np
import tensorflow as tf
a = np.array([[0.25, 0.1, 0.65], [0.8, 0.15, 0.05]])
b = np.array([[0.7, 0.2, 0.1], [0.15, 0.8, 0.05]])
sess = tf.Session()
print(kl(a, b).eval(session=sess))  # [0.88995184 1.08808468]

你会得到相同的结果

np.sum(a * np.log(a / b), axis=1)

但是,这个实现有点儿错误(在Tensorflow 1.8.0中检查).

如果您的概率为零a,例如,如果您尝试[0.8, 0.2, 0.0]而不是[0.8, 0.15, 0.05],则nan即使Kullback-Leibler定义0 * log(0 / b)应该归零,您也会得到.

为了缓解这个问题,我们应该添加一些小的数值常数.tf.distributions.kl_divergence(X, Y, allow_nan_stats=False)在这种情况下使用导致运行时错误也是谨慎的.

此外,如果有一些零b,您将获得inf该allow_nan_stats=False选项不会捕获的值,因此必须处理这些值.

2> 小智..：

因为有softmax_cross_entropy_with_logits,所以不需要在KL上进行优化.

KL(prob_a, prob_b)  
  = Sum(prob_a * log(prob_a/prob_b))  
  = Sum(prob_a * log(prob_a) - prob_a * log(prob_b))  
  = - Sum(prob_a * log(prob_b)) + Sum(prob_a * log(prob_a)) 
  = - Sum(prob_a * log(prob_b)) + const 
  = H(prob_a, prob_b) + const

3> 小智..：

我不确定为什么它没有实现,但也许有一个解决方法.KL分歧定义为:

KL(prob_a, prob_b) = Sum(prob_a * log(prob_a/prob_b))

另一方面,交叉熵H定义为:

H(prob_a, prob_b) = -Sum(prob_a * log(prob_b))

因此,如果您创建一个变量y = prob_a/prob_b,您可以通过调用负数来获得KL分歧H(proba_a, y).在Tensorflow表示法中,类似于:

KL = tf.reduce_mean(-tf.nn.softmax_cross_entropy_with_logits(prob_a, y))

推荐阅读

程序员
有效地检查数字是否在第二个数字+ -10%的范围内？

如何解决《有效地检查数字是否在第二个数字+-10%的范围内？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何通过ruby导出json文件？

如何解决《如何通过ruby导出json文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Magento 2 - 如何在另一个phtml文件,xml布局,静态块和cms页面中调用自定义phtml文件？

如何解决《Magento2-如何在另一个phtml文件,xml布局,静态块和cms页面中调用自定义phtml文件？》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么使用MyISAM引擎而不是InnoDB创建默认的'mysql'数据库？

如何解决《为什么使用MyISAM引擎而不是InnoDB创建默认的'mysql'数据库？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何根据另一个列表保留列表的元素

如何解决《如何根据另一个列表保留列表的元素》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android 6.0的bug？有权限,但getScanResults()仍然在Android 6.0中返回空列表

如何解决《Android6.0的bug？有权限,但getScanResults()仍然在Android6.0中返回空列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将backButton文本设置为空？

如何解决《如何将backButton文本设置为空？》经验，为你挑选了2个好方法。 ... [详细]
程序员
假对象与模拟对象

如何解决《假对象与模拟对象》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Parse Cloud Code中保存批量数据？

如何解决《如何在ParseCloudCode中保存批量数据？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Spark Streaming + Kafka:SparkException:无法找到Set的前导偏移

如何解决《SparkStreaming+Kafka:SparkException:无法找到Set的前导偏移》经验，为你挑选了1个好方法。 ... [详细]
程序员
ITMS-90037提交应用商店时，Info.plist文件丢失或无法解析

如何解决《ITMS-90037提交应用商店时，Info.plist文件丢失或无法解析》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Clion中自动为.h文件生成函数头？

如何解决《如何在Clion中自动为.h文件生成函数头？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在try-catch块之外访问变量

如何解决《在try-catch块之外访问变量》经验，为你挑选了2个好方法。 ... [详细]
程序员
读取输入的值返回undefined

如何解决《读取输入的值返回undefined》经验，为你挑选了1个好方法。 ... [详细]
程序员
在XCode中的UI测试期间无法访问自定义视图

如何解决《在XCode中的UI测试期间无法访问自定义视图》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过CodePush或AppHub部署应用程序

如何解决《通过CodePush或AppHub部署应用程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法解码下载的字体,OTS解析错误:无效的版本标记+ rails 4

如何解决《无法解码下载的字体,OTS解析错误:无效的版本标记+rails4》经验，为你挑选了3个好方法。 ... [详细]
程序员
ES6作为angularjs或angular2的打字稿目标编译器选项

如何解决《ES6作为angularjs或angular2的打字稿目标编译器选项》经验，为你挑选了1个好方法。 ... [详细]
程序员
函数评估要求所有线程都运行-MVC

如何解决《函数评估要求所有线程都运行-MVC》经验，为你挑选了1个好方法。 ... [详细]
程序员
加速移动页面(AMP)中的SVG部分是否支持IMG标记？

如何解决《加速移动页面(AMP)中的SVG部分是否支持IMG标记？》经验，为你挑选了1个好方法。 ... [详细]

wurtjq

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章