英伟达Tesla P100计算卡性能真的能震撼全球吗?

如题所述

英伟达Tesla P100的性能首测:震撼全球的计算力量


尽管GTX 1080/1070表现出色,但真正聚焦高性能计算的是顶级GP100大核心,它拥有3840个FP32单精度和1920个FP64双精度CUDA核心。作为首发的Tesla P100(也称Tesla P1),仅启用3584个单精度和1792个双精度核心,却已展现出强大的性能,单精度达到10.6TFlops,双精度达到5.3TFlops,配备了4096-bit 16GB HBM2高带宽显存和NVLink互连总线。


圣地亚哥超级计算中心和亚马逊网络服务合作,使用了特别设计的通用计算测试工具AMBER对P100进行了测试,考察的是其纯粹的计算能力。测试结果显示,GP100核心不适用于消费级市场,顶级游戏卡如GTX 1080 Ti和GTX Titan X 2将采用GP102架构。


对比产品中,Tesla M40凭借GM200架构的3072个流处理器,单精度性能达7TFlops,而Tesla K80和K40分别基于GK210和GK110,性能差距显著。在测试中,P100相对于M40的提升幅度惊人,单路性能已超越双路M40,与消费级游戏卡如GTX Titan X的四路性能相当,GTX 1080则多数情况下接近M40。


然而,NV-Link总线的潜力尚未完全发挥,双路和四路P100的性能提升不如预期,这或许是目前的一个遗憾。总的来说,Tesla P100以其卓越的计算性能,无疑在全球高性能计算领域树立了新标杆。

温馨提示:答案为网友推荐,仅供参考

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网