Hot Chips 34大会史昂,Intel又公布了Ponte Vecchio GPU高性能计算卡的更多细节,包括性能数据。
Ponte Vecchio GPU基于全新的Xe HPC高性能计算架构,使用5种不同制造工艺(Intel 7和台积电N7/N5等)、多种封装技术,整合了多达47个不同计算模块,晶体管数量超1000亿个。
它一个模块有128个Xe核心、128个光追单元、64MB一级缓存、408MB二级缓存、128GB HBM2e高带宽内存,支持PCIe 5.0,可以四路甚至八路并联。
Intel给出的最新数据声称,Ponte Vecchio FP32单精度、FP64双精度性能可达52TFlops,TF3.2浮点性能可达419TFlops,BF16、PF16浮点性能可达839TFlops,INT8整数性能则可达1678Tops。
Data Parallel C++ (DPC++)测试项目中,Ponte Vecchio的性能相比于NVIDIA A100可以领先1.4-2.5倍。
另外,ExaSMR OpenMC计算性能可领先2倍,NekRS性能则领先0.3-1.7倍。
当然,NVIDIA新一代的H100都已经发布了……