NVIDIA的GPU命名规则

以下是英伟达H20与L20的参数对比表格:

参数 H20 L20
GPU架构 NVIDIA Hopper NVIDIA Ada Lovelace
内存类型 HBM3 GDDR6(带ECC)
内存容量 96 GB 48 GB
内存带宽 4.0 TB/s 864 GB/s
INT8/FP8算力 296 TFLOPS 239 TFLOPS
BF16/FP16算力 148 TFLOPS 119.5 TFLOPS
TF32算力 74 TFLOPS 59.8 TFLOPS
FP32算力 44 TFLOPS 59.8 TFLOPS
NVLink支持 支持(900 GB/s) 不支持
MIG功能 最多7个实例 未知
L2缓存 60 MB 96 MB
热设计功耗(TDP) 400 W 275 W
外形规格 8路HGX(SXM接口) 2槽FHFL(PCIe Gen4 x16)
适用场景 大模型推理、多卡协同 工作站、服务器推理

关键差异说明:

  1. 架构与内存
    H20基于Hopper架构,配备更高带宽的HBM3内存,适合对显存带宽敏感的推理任务(如大模型Decode阶段);L20基于Ada Lovelace架构,内存类型为GDDR6,容量和带宽均低于H20。

  2. 计算能力
    H20的INT8/FP8算力(296 TFLOPS)高于L20(239 TFLOPS),但L20的FP32算力略优(59.8 TFLOPS vs 44 TFLOPS)。

  3. 互联与扩展性
    H20支持NVLink高速互联,可通过多卡堆叠提升性能;L20仅支持PCIe接口,扩展性受限。

  4. 功耗与定位
    H20功耗更高(400W),主打高并发推理场景;L20功耗较低(275W),适合对成本和空间敏感的工作站环境。

数据来源:

  • 英伟达官方文档、广发电子研究报告、小牛行研等公开资料。
  • 实际性能需结合具体应用场景(如模型类型、输入输出长度等)评估。