以下是英伟达H20与L20的参数对比表格:
参数 | H20 | L20 |
---|---|---|
GPU架构 | NVIDIA Hopper | NVIDIA Ada Lovelace |
内存类型 | HBM3 | GDDR6(带ECC) |
内存容量 | 96 GB | 48 GB |
内存带宽 | 4.0 TB/s | 864 GB/s |
INT8/FP8算力 | 296 TFLOPS | 239 TFLOPS |
BF16/FP16算力 | 148 TFLOPS | 119.5 TFLOPS |
TF32算力 | 74 TFLOPS | 59.8 TFLOPS |
FP32算力 | 44 TFLOPS | 59.8 TFLOPS |
NVLink支持 | 支持(900 GB/s) | 不支持 |
MIG功能 | 最多7个实例 | 未知 |
L2缓存 | 60 MB | 96 MB |
热设计功耗(TDP) | 400 W | 275 W |
外形规格 | 8路HGX(SXM接口) | 2槽FHFL(PCIe Gen4 x16) |
适用场景 | 大模型推理、多卡协同 | 工作站、服务器推理 |
关键差异说明:
-
架构与内存:
H20基于Hopper架构,配备更高带宽的HBM3内存,适合对显存带宽敏感的推理任务(如大模型Decode阶段);L20基于Ada Lovelace架构,内存类型为GDDR6,容量和带宽均低于H20。 -
计算能力:
H20的INT8/FP8算力(296 TFLOPS)高于L20(239 TFLOPS),但L20的FP32算力略优(59.8 TFLOPS vs 44 TFLOPS)。 -
互联与扩展性:
H20支持NVLink高速互联,可通过多卡堆叠提升性能;L20仅支持PCIe接口,扩展性受限。 -
功耗与定位:
H20功耗更高(400W),主打高并发推理场景;L20功耗较低(275W),适合对成本和空间敏感的工作站环境。
数据来源:
- 英伟达官方文档、广发电子研究报告、小牛行研等公开资料。
- 实际性能需结合具体应用场景(如模型类型、输入输出长度等)评估。