15赞

使用张量流矩阵乘法测试GPU

作者：殉情放开那只小兔子 | 2023-09-06 17:09

如何解决《使用张量流矩阵乘法测试GPU》经验，为你挑选了1个好方法。

由于许多机器学习算法依赖于矩阵乘法(或者至少可以使用矩阵乘法)来测试我的GPU,我计划创建矩阵a,b,将它们相乘并记录计算完成所需的时间.

这里的代码将生成两个维度为300000,20000的矩阵并将它们相乘:

import tensorflow as tf
import numpy as np

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)


#a = np.array([[1, 2, 3], [4, 5, 6]])
#b = np.array([1, 2, 3])

a = np.random.rand(300000,20000)
b = np.random.rand(300000,20000)

println("Init complete");

result = tf.mul(a , b)
v = sess.run(result) 

print(v)

这是比较GPU性能的充分测试吗？我还应该考虑哪些其他因素？

1> Yaroslav Bul..：

这是一个matmul基准测试的例子,它避免了常见的陷阱,并与Titan X Pascal上的官方11 TFLOP标记相匹配.

import os
import sys
os.environ["CUDA_VISIBLE_DEVICES"]="1"
import tensorflow as tf
import time

n = 8192
dtype = tf.float32
with tf.device("/gpu:0"):
    matrix1 = tf.Variable(tf.ones((n, n), dtype=dtype))
    matrix2 = tf.Variable(tf.ones((n, n), dtype=dtype))
    product = tf.matmul(matrix1, matrix2)


# avoid optimizing away redundant nodes
config = tf.ConfigProto(graph_options=tf.GraphOptions(optimizer_options=tf.OptimizerOptions(opt_level=tf.OptimizerOptions.L0)))
sess = tf.Session(config=config)

sess.run(tf.global_variables_initializer())
iters = 10

# pre-warming
sess.run(product.op)

start = time.time()
for i in range(iters):
  sess.run(product.op)
end = time.time()
ops = n**3 + (n-1)*n**2 # n^2*(n-1) additions, n^3 multiplications
elapsed = (end - start)
rate = iters*ops/elapsed/10**9
print('\n %d x %d matmul took: %.2f sec, %.2f G ops/sec' % (n, n,
                                                            elapsed/iters,
                                                            rate,))

推荐阅读

程序员
用于打开上次关闭选项卡的Sublime文本快捷方式

如何解决《用于打开上次关闭选项卡的Sublime文本快捷方式》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误后重试相同的项目

如何解决《错误后重试相同的项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
Cassandra create table不会保持列顺序

如何解决《Cassandracreatetable不会保持列顺序》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android OkHttp库:GET请求 - 异常EOFException:\n未找到:size = 0 content =

如何解决《AndroidOkHttp库:GET请求-异常EOFException:\n未找到:size=0content=》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么"错误:使用unique_ptr将'sizeof'无效应用于不完整类型"通过添加空析构函数来修复？

如何解决《为什么"错误:使用unique_ptr将'sizeof'无效应用于不完整类型"通过添加空析构函数来修复？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java HashMap没有从key获得价值

如何解决《JavaHashMap没有从key获得价值》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么时候我们应该使用RTLD_DEEPBIND？

如何解决《什么时候我们应该使用RTLD_DEEPBIND？》经验，为你挑选了1个好方法。 ... [详细]
程序员
以编程方式向Python函数添加“装饰器”

如何解决《以编程方式向Python函数添加“装饰器”》经验，为你挑选了1个好方法。 ... [详细]
程序员
Google搜索API.过滤许可证

如何解决《Google搜索API.过滤许可证》经验，为你挑选了1个好方法。 ... [详细]
程序员
.NET HttpClient - 取消了CancellationToken而不取消请求

如何解决《.NETHttpClient-取消了CancellationToken而不取消请求》经验，为你挑选了0个好方法。 ... [详细]
程序员
拉出具有依赖关系的无形多态函数

如何解决《拉出具有依赖关系的无形多态函数》经验，为你挑选了0个好方法。 ... [详细]
程序员
排除控制器中的实体结果

如何解决《排除控制器中的实体结果》经验，为你挑选了0个好方法。 ... [详细]
程序员
在*提交之前更改一个特定提交的名称,电子邮件和/或日期

如何解决《在*提交之前更改一个特定提交的名称,电子邮件和/或日期》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#语言规范是否明确声明比较必须是相同的类型？

如何解决《C#语言规范是否明确声明比较必须是相同的类型？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Embeddable Common-Lisp asdf:defsystem返回无效的相对路径名

如何解决《EmbeddableCommon-Lispasdf:defsystem返回无效的相对路径名》经验，为你挑选了1个好方法。 ... [详细]
程序员
不允许使用依赖于Julia中类型定义中的整数类型参数的表达式

如何解决《不允许使用依赖于Julia中类型定义中的整数类型参数的表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
在共享索引上加入Pandas Dataframes

如何解决《在共享索引上加入PandasDataframes》经验，为你挑选了0个好方法。 ... [详细]
程序员
我的代码输出异常

如何解决《我的代码输出异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
在AOSP上设置默认应用程序

如何解决《在AOSP上设置默认应用程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
从python生成器接收'return'值的最佳方法

如何解决《从python生成器接收'return'值的最佳方法》经验，为你挑选了2个好方法。 ... [详细]

殉情放开那只小兔子

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章