3赞

稀疏矩阵中非零值的平均值？

作者：刘美娥94662 | 2023-09-10 12:22

如何解决《稀疏矩阵中非零值的平均值？》经验，为你挑选了2个好方法。

我正在尝试计算稀疏行矩阵的每一行中的非零值的平均值.使用矩阵的均值方法不会这样做:

>>> from scipy.sparse import csr_matrix
>>> a = csr_matrix([[0, 0, 2], [1, 3, 8]])
>>> a.mean(axis=1)
matrix([[ 0.66666667],
        [ 4.        ]])

以下工作但对于大型矩阵来说速度很慢:

>>> import numpy as np
>>> b = np.zeros(a.shape[0])
>>> for i in range(a.shape[0]):
...    b[i] = a.getrow(i).data.mean()
... 
>>> b
array([ 2.,  4.])

有没有人可以告诉我,如果有更快的方法？

1> perimosocord..：

使用CSR格式矩阵,您可以更轻松地执行此操作:

sums = a.sum(axis=1).A1
counts = np.diff(a.indptr)
averages = sums / counts

直接支持行和,并且CSR格式的结构意味着indptr数组中连续值之间的差异与每行中非零元素的数量完全对应.

2> Antonio Raga..：

这似乎是你可以使用的典型问题numpy.bincount..为此我使用了三个函数:

(x,y,z)=scipy.sparse.find(a)

返回稀疏矩阵的rows(x),columns(y)和values(z).对于实例,x是array([0, 1, 1, 1].

numpy.bincount(x) 为每个行号返回你有多少非零元素.

numpy.bincount(x,wights=z) 为每一行返回非零元素的总和.

最终的工作代码:

from scipy.sparse import csr_matrix
a = csr_matrix([[0, 0, 2], [1, 3, 8]])

import numpy
import scipy.sparse
(x,y,z)=scipy.sparse.find(a)
countings=numpy.bincount(x)
sums=numpy.bincount(x,weights=z)
averages=sums/countings

print(averages)

收益:

[ 2.  4.]

推荐阅读

程序员
从Avro GenericRecord获取输入值

如何解决《从AvroGenericRecord获取输入值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查是否使用Protractor,CucumberJS和Chai检查复选框？

如何解决《如何检查是否使用Protractor,CucumberJS和Chai检查复选框？》经验，为你挑选了1个好方法。 ... [详细]
程序员
定义自定义负载平衡算法

如何解决《定义自定义负载平衡算法》经验，为你挑选了0个好方法。 ... [详细]
程序员
PHP7与Symfony3的兼容性？

如何解决《PHP7与Symfony3的兼容性？》经验，为你挑选了1个好方法。 ... [详细]
程序员
添加Reporting.WinForms参考VS2015

如何解决《添加Reporting.WinForms参考VS2015》经验，为你挑选了1个好方法。 ... [详细]
程序员
moment.js在现有日期设置时间并未正确设置时间

如何解决《moment.js在现有日期设置时间并未正确设置时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
从ASP.net项目调用静态异步方法

如何解决《从ASP.net项目调用静态异步方法》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何创建永远不会读取$ scope的$ scope函数？

如何解决《如何创建永远不会读取$scope的$scope函数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将IISExpress绑定到IP地址失败

如何解决《将IISExpress绑定到IP地址失败》经验，为你挑选了1个好方法。 ... [详细]
程序员
切换git分支时如何处理vim缓冲区？

如何解决《切换git分支时如何处理vim缓冲区？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用CSV和PowerSHell输出格式

如何解决《使用CSV和PowerSHell输出格式》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何通过刷出元素删除ListItem？

如何解决《如何通过刷出元素删除ListItem？》经验，为你挑选了0个好方法。 ... [详细]
程序员
"UserControl"类型不支持直接内容

如何解决《"UserControl"类型不支持直接内容》经验，为你挑选了3个好方法。 ... [详细]
程序员
从Go中的切片中删除字符串

如何解决《从Go中的切片中删除字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
当您无法提供色彩美感时,手动创建图例

如何解决《当您无法提供色彩美感时,手动创建图例》经验，为你挑选了0个好方法。 ... [详细]
程序员
Django持续时间字段具有负值

如何解决《Django持续时间字段具有负值》经验，为你挑选了0个好方法。 ... [详细]
程序员
Newtonsoft JsonSerializer - 小写属性和字典

如何解决《NewtonsoftJsonSerializer-小写属性和字典》经验，为你挑选了2个好方法。 ... [详细]
程序员
中心页脚UILabel分组UITableView - Swift

如何解决《中心页脚UILabel分组UITableView-Swift》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL Server sys.databases vs sysdatabases？

如何解决《SQLServersys.databasesvssysdatabases？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我们需要dnx或跨平台的网络

如何解决《为什么我们需要dnx或跨平台的网络》经验，为你挑选了0个好方法。 ... [详细]

刘美娥94662

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章