出行政策

当前位置/ 首页/ 要闻频道/出行政策/ 正文

AMD今天宣布推出了7nm Instinct MI100 GPU

导读 AMD今天宣布了其7nm Instinct MI100 GPU,以及来自Dell,HPE和Supermicro等公司的一系列设计大奖。本能MI100标志着AMD以计算为中心的CDN...

AMD今天宣布了其7nm Instinct MI100 GPU,以及来自Dell,HPE和Supermicro等公司的一系列设计大奖。本能MI100标志着AMD以计算为中心的CDNA GPU架构的第一次迭代。新的架构可提供高达11.5 TFLOPS的FP64峰值吞吐量,使Instinct MI100成为第一个在FP64中突破10 TFLOPS的GPU,与上一代MI50相比,性能提高了3倍。它还在FP32工作负载中拥有23.1 TFLOPS的峰值吞吐量,在这两个类别中都击败了Nvidia出色的A100 GPU,尽管它落后于其他数字格式。

正如数据中心GPU所期望的那样,PCIe 4.0卡是为AI和HPC工作负载而设计的,并且还支持AMD第二代Infinity Fabric,这使卡之间的对等(P2P)I / O带宽增加了一倍。这种结构允许卡与CPU共享统一的内存地址空间,这是AMD的主要优势,因为它利用了自己目前唯一提供数据中心级GPU的CPU供应商的地位。这些卡在三个Infinity Fabric链路上的总吞吐率高达340 GB / s,可部署到四核配置单元中(每个服务器最多两个),每个配置单元最多支持552 GB / s的P2P I / O带宽。

Instinct MI100还支持AMD的新矩阵核心技术,该技术可提高单精度和混合精度矩阵运算(例如FP32,FP16,bFloat 16,INT8和INT4)的性能。该技术可将FP32性能提高到46.1 TFLOPS。

这些卡具有32GB的HBM2内存,分布在四个堆栈中,提供总计高达1.23 TB / s的带宽。AMD称,与Nvidia的A100 GPU相比,这些显卡每美元的峰值性能高出1.8倍至2.1倍。

AMD还宣布,其开源ROCm 4.0开发人员软件现在具有开源编译器,并统一支持OpenMP 5.0,HIP,PyTorch和Tensorflow。

免责声明:本文由用户上传,如有侵权请联系删除!