如果使用Quadro GPU与GeForce GPU,TensorFlow性能是否有明显差异?
例如,它是否使用双精度操作或其他会导致GeForce卡掉落的东西?
我即将为TensorFlow购买GPU,并想知道GeForce是否可以.谢谢,感谢您的帮助
我认为GeForce TITAN很棒,并且广泛用于机器学习(ML).在ML中,在大多数情况下单精度就足够了.
关于GTX系列(目前是GeForce 10)性能的更多细节可以在维基百科中找到.
网络上的其他来源支持这一说法.以下是2013年doc-ok的报价(永久链接).
相比之下,"入门级"700美元的Quadro 4000显着低于530美元的高端GeForce GTX 680,至少根据我使用多个Vrui应用程序的测量值而言,最接近的性能 - 相当于GeForce GTX 680我能找到是Quadro 6000,价格高达3660美元.
具体到ML,包括深度学习,有一个专门讨论这个主题的Kaggle论坛讨论(2014年12月,永久链接),它讨论了Quadro,GeForce和Tesla系列之间的比较:
Quadro GPU不适用于科学计算,特斯拉GPU也是如此.Quadro卡设计用于加速CAD,因此它们无法帮助您训练神经网络.它们可能很适合用于此目的,但这是浪费金钱.
特斯拉卡用于科学计算,但它们往往相当昂贵.好消息是,Tesla卡在GeForce卡上提供的许多功能对于训练神经网络不是必需的.
例如,特斯拉卡通常具有ECC内存,这很好但不是必需的.它们对双精度计算也有更好的支持,但是单精度对于神经网络训练来说是足够的,并且它们的表现与GeForce卡相同.
特斯拉卡的一个有用功能是它们比同类GeForce卡更容易拥有RAM.如果您计划训练更大的模型(或使用基于FFT的卷积等RAM密集型计算),则总是欢迎使用更多RAM.
如果您在Quadro和GeForce之间进行选择,请务必选择GeForce.如果您在特斯拉和GeForce之间选择,请选择GeForce,除非您有很多钱并且可以真正使用额外的RAM.
注意:请注意您正在使用的平台以及默认精度.例如,在CUDA论坛(2016年8月)中,一个开发者拥有两个Titan X(GeForce系列),并且在任何R或Python脚本中都没有看到性能提升.这被诊断为R被默认为双精度,并且在新GPU上的性能比其CPU(Xeon处理器)更差.特斯拉GPU被认为是双精度的最佳性能.在这种情况下,将所有数字转换为float32可将性能从12.437增加到nvBLAS 0.324s,并在一个TITAN X上使用gmatrix + float32s(参见第一个基准).引用此论坛讨论:
Titan X的双精度性能相当低.