NvidiaGPU性能对比
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Nvidia GPU性能对比
目前Nvidia推出支持CUDA架构用GPU运算的图形处理器分别:GeForce系列、Quadro 系列、及专业GPU Tesle系列。从价格上来排序为GeForce最便宜为Tesla的1/2不到。Quadro 价格比Tesla更高暂不评测。从Nvidia推出GPU运算以来,很多专业人士就不断尝试用GeForce显卡来做GPU运算,核心数量一样,价格有很大优势,从表面上看就是内存好像比Tesla少了些。究竟性能如何来看一下,下面测试GeForce GTX470性能测试。
GeForce GTX470参数:
下面用GPU基准测试软件对GTX470各个方面进行了测试,Nvidia GTX470单精度浮点运算性能为1049Gflops,而Tesla C2050的单精度浮点运算为1.03Tflops,说明在单精度浮点运算方面GTX470与C2050性能相当。
下面再在对比一下双精度浮点运算。由下图可能看出GTX470的双精度浮点运算为134Gflops,是单精度浮点运算的1/8,我们再来看一下C2050的双精度浮点运算为515Gflops.由此可见Nvidia采用Fermi架构后双精度浮点运算能力C2050要远远大于GTX470。
下面再来看一下GTX470其它方面的性能
Tesla C2O50参数
由上图对比可以看出GTX470与C2050 除内存不同、与内存带宽不同其它几乎相同。而Nvidia为什么推出专业的GPU运算处理器Tesla系列,而不采用GeForce显卡来做并行运算呢?而Tesla C2050系列处理器将近GeForce GTX470价格的三倍,到底不何不同呢?
根据测试及Nvidia官方资料做出了以下总结:
首先,Tesla系列比GeForce系列内存要高出一倍,而通过CUDA开发的程序要做一个并行运算,首先要把数据调入显存,显存与GPU的每个核心交换数据,这样显卡的内存越大对大规模的并行运算程序越好。运行小程序中表现不出来。
通过以上测试GeForce显卡双精度浮点运算约为单精度浮点运算的1/8,而Tesla Fermi 系列双精度约为单精度的1/2.这是因为Nvidia设计不同,GeForce采用了openGL图形加速度技术。而降低的双精度浮点运算的性能。Tesla不支持openGL加速度技术,而增强的双精度浮点运算性能。Geforce显卡还支持3D立体幻影、NVIDIA PureVideo等。Tesla支持异步传输、并行datacache技术等,由此可见GeForce专为图形处理而设计,Tesla专为并行运算而设计。.
建议用户在选择购买GPU时根据需求来选择是用Tesla还是GeForce。
如果你是企业用户主要工作处理大规模地震资料,石油及天燃汽应用最好选择Tesla系统,因为这些程序所处理的数据一般为TB甚至PB的海量数据,需要大容量内存支持。如果你所应用程序为分子动力学等软件,可选择采用GeForce 系列。选择Geforce时为能达到高的稳定性最好选择降频使用。