英伟达宣布创造满血 DeepSeek-R1 模型 AI 推理性能的世界纪录

发布时间:2025-03-21 19:28:05 来源:互联网

本站 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA BlackwellDGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行6710 亿参数的满血DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

    单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

    测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发

    计算精度:B200 采用 FP4,H200 采用 FP8 精度

    英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

      节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

      测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

      计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

      与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

      英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

      精度MMLUGSM8KAIME 2024GPQA DiamondMATH-500DeepSeek R1-FP890.8%96.3%80.0%69.7%95.4%DeepSeek R1-FP490.7%96.1%80.0%69.2%94.2%

      英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。本站注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。

本周热门教程

1
精品蜜桃秘一区二区三区:为什么这种高品质蜜桃会成为市场宠儿?

精品蜜桃秘一区二区三区:为什么这种高品质蜜桃会成为市场宠儿?

2025/03/18

2
日本黄冈站和日本黄冈站有什么区别?为什么它们在日本铁路网络中如此重要?

日本黄冈站和日本黄冈站有什么区别?为什么它们在日本铁路网络中如此重要?

2025/03/17

3
如何通过黄金网站9.1免费入口轻松获取丰富的资源和服务:安全保障与快速访问全揭秘

如何通过黄金网站9.1免费入口轻松获取丰富的资源和服务:安全保障与快速访问全揭秘

2025/03/18

4
HWDHDHDXⅩXXX69背后代表的技术与网络安全的未来发展:为什么这种符号如此重要?

HWDHDHDXⅩXXX69背后代表的技术与网络安全的未来发展:为什么这种符号如此重要?

2025/03/23

5
如何在陌陌影视平台在线观看高清完整版电影和电视剧:详细指南与问题解决方法

如何在陌陌影视平台在线观看高清完整版电影和电视剧:详细指南与问题解决方法

2025/03/18

6
草莓视频旧址为何依然吸引着用户?旧址与新平台的对比分析:你还在寻找那个熟悉的地址吗?

草莓视频旧址为何依然吸引着用户?旧址与新平台的对比分析:你还在寻找那个熟悉的地址吗?

2025/03/17

7
如何处理三个男躁一个女的复杂关系?从心理分析看情感互动的艺术

如何处理三个男躁一个女的复杂关系?从心理分析看情感互动的艺术

2025/03/17

8
郑州附近有200元随叫随到的学生靠谱吗?你需要了解这些信息

郑州附近有200元随叫随到的学生靠谱吗?你需要了解这些信息

2025/03/17

9
丁淑芬的陪读性经历:一段深入探索教育、亲情与个人成长的故事

丁淑芬的陪读性经历:一段深入探索教育、亲情与个人成长的故事

2025/03/18

10
《韩国大尺度《偷欢2》为何引发热议?深度解析电影内容与社会影响

《韩国大尺度《偷欢2》为何引发热议?深度解析电影内容与社会影响

2025/03/19