在我学会了如何使用之后einsum
,我现在正试图了解它是如何np.tensordot
工作的.
但是,我有点迷失,特别是关于参数的各种可能性axes
.
要理解它,因为我从未练习过张量微积分,我使用以下示例:
A = np.random.randint(2, size=(2, 3, 5)) B = np.random.randint(2, size=(3, 2, 4))
在这种情况下,有什么不同可能np.tensordot
,你会如何手动计算?
这个想法tensordot
很简单 - 我们输入数组和相应的轴,沿着这些轴减少总和.参与和减少的轴在输出中被移除,并且来自输入数组的所有剩余轴在输出中展开为不同的轴,保持输入阵列的馈送顺序.
让我们看几个带有一个和两个减少轴的样本案例,并交换输入位置,看看如何在输出中保留顺序.
输入:
In [7]: A = np.random.randint(2, size=(2, 6, 5)) ...: B = np.random.randint(2, size=(3, 2, 4)) ...:
情况1:
In [9]: np.tensordot(A, B, axes=((0),(1))).shape Out[9]: (6, 5, 3, 4) A : (2, 6, 5) -> reduction of axis=0 B : (3, 2, 4) -> reduction of axis=1 Output : `(2, 6, 5)`, `(3, 2, 4)` ===(2 gone)==> `(6,5)` + `(3,4)` => `(6,5,3,4)`
案例#2(与案例#1相同,但输入被交换):
In [8]: np.tensordot(B, A, axes=((1),(0))).shape Out[8]: (3, 4, 6, 5) B : (3, 2, 4) -> reduction of axis=1 A : (2, 6, 5) -> reduction of axis=0 Output : `(3, 2, 4)`, `(2, 6, 5)` ===(2 gone)==> `(3,4)` + `(6,5)` => `(3,4,6,5)`.
输入:
In [11]: A = np.random.randint(2, size=(2, 3, 5)) ...: B = np.random.randint(2, size=(3, 2, 4)) ...:
情况1:
In [12]: np.tensordot(A, B, axes=((0,1),(1,0))).shape Out[12]: (5, 4) A : (2, 3, 5) -> reduction of axis=(0,1) B : (3, 2, 4) -> reduction of axis=(1,0) Output : `(2, 3, 5)`, `(3, 2, 4)` ===(2,3 gone)==> `(5)` + `(4)` => `(5,4)`
案例#2:
In [14]: np.tensordot(B, A, axes=((1,0),(0,1))).shape Out[14]: (4, 5) B : (3, 2, 4) -> reduction of axis=(1,0) A : (2, 3, 5) -> reduction of axis=(0,1) Output : `(3, 2, 4)`, `(2, 3, 5)` ===(2,3 gone)==> `(4)` + `(5)` => `(4,5)`
我们可以将它扩展到尽可能多的轴.