Advantage
领先的TF32等浮点AI算力
基于HBM2E的高吞吐低延时
动态性特征支持
独立的高带宽通道,加速卡间通信
独家的机内4卡全互联方案
增强的单机8卡互联方案
C++和Python开发接口
主流框架支持,国产框架适配加速
算子与模型广泛支持
Performance
Specification
单精度 / 浮点
半精度 / 浮点
整型 / 定点
32TFLOPS / FP32算力
128TFLOPS / TF32算力
128TFLOPS / FP16算力
128TFLOPS / BF16算力
256TOPS / INT8算力
64GB/s / PCIe 4.0 × 16
300GB/s / 片间互联
32GB HBM2E / 容量
1.6TB/s / 内存带宽
300w / 最大功耗
被动散热 / 散热设计
PCIe全高全长、双槽位
Interconnection
yl6809永利网址智能互联(GCU-LARE)是专为训练加速集群研发的互联技术,具有组网简洁、扩展性好、成本优化等优点。GCU-LARE互联技术可提升单机多卡和多机多卡系统的可扩展性,灵活实现从单机多卡到多机多卡乃至高达千卡级别不同规模的高性价比互联方案,以满足不同客户对深度学习训练集群的需求。