日前,英伟达首席执行官黄仁勋表示,美国对中国人工智能芯片的出口管制是 “失败的”。他指出,这一管制不仅未能阻挡中国在芯片领域的自主发展脚步,反而让美国公司承受了高达数十亿美元的销售损失。
黄仁勋所谈及的法规,是美国的《人工智能扩散规则》,其全称为《人工智能扩散出口管制框架》。这是美国商务部工业与安全局(BIS)于 2025 年 1 月 13 日发布的一项临时最终规则,美国以国家安全为借口,意图限制人工智能技术和芯片的出口,尤其将中国等 “受关注国家” 列为重点限制对象。该规则原计划于 2025 年 5 月 15 日正式生效,不过,当地时间 5 月 13 日,美国商务部工业和安全局(BIS)宣布启动撤销这一规则,同时宣称将采取额外措施加强全球半导体出口管制。
“总而言之,出口管制是失败的。” 黄仁勋明确表示,“起初支撑《人工智能扩散规则》的基本假设,首先就被证明是完全错误的。”
他进一步指出:“四年前,英伟达在中国的市场份额高达 95%,如今却仅剩 50%。剩下的市场份额已被中国本土技术占据。即便没有英伟达的产品,中国也会大量使用本土技术。”
为了能够继续进入中国市场,英伟达曾推出多款特供芯片,其中包括 H800 系列、A800 系列、H20 系列、B20 系列以及 L20 系列等。A800 和 H800 是该公司早期针对中国市场推出的特供版本,与 A100 和 H100 相比,它们的主要差异体现在 Nvlink 最大总网络带宽方面。具体而言,A100 的 Nvlink 最大总网络带宽为 600GB/s,而 A800 的这一数值仅为 400GB/s;H100 的 Nvlink 最大总网络带宽为 900GB/s,H800 同样只有 400GB/s 。随着美国相关政策不断收紧,英伟达不得不持续调整特供芯片的规格。以 H20 芯片为例,它是基于 Hopper 架构的训练级芯片,其 FP16 算力为 148 TFLOPS(大约仅为 H100 的 15%),FP8 算力为 296 TFLOPS;配备 96GB HBM3 显存,带宽达 4.0TB/s,支持多卡并联以弥补算力不足的短板。
然而,今年 4 月,特朗普政府宣布禁止英伟达向中国销售 H20 芯片,这一举措致使该公司资产减值减记了 55 亿美元。
尽管面临美国的封锁,中国的 AI 产业和 AI 芯片发展并未停滞。阿里巴巴旗下蚂蚁集团 Ling 团队发表了一篇名为《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》的论文。论文结果显示,其 3000 亿参数的 MoE(混合专家)大模型能够在使用国产 GPU 的低性能设备上高效完成训练,其性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当,而且训练成本降低了 20%。随后,彭博社报道称,蚂蚁集团采用了包括阿里巴巴和华为在内的中国科技厂商设计的国产 AI 芯片,运用混合专家模型(MoE,Mixture of experts)机器学习方法,训练成果可与英伟达公司的 H800 芯片相媲美。
目前,国内已出现多起基于国产芯片构建万卡集群的成功案例。例如,百度智能云成功点亮昆仑芯三代万卡集群,这是国内首个正式点亮的自研万卡集群。百度智能云指出,国产昆仑芯万卡集群以及未来三万卡集群的建设,从硬件到软件,面临着全方位的技术挑战。而在 2024 年 9 月升级的百度百舸 AI 异构计算平台 4.0,围绕大模型落地全流程的算力需求,在集群创建、开发实验、模型训练、模型推理这四大关键环节,能够为企业提供 “多、快、稳、省” 的 AI 基础设施,在万卡集群建设过程中发挥了极为关键的作用。
文章来自:电子发烧友