一文读懂显存、显存带宽、算力、外部通信等概念

最近,AMD发布了最新的AI生产力工具,打压下英伟达的嚣张气焰。

印象深刻的就是192GB显存,英伟达的H100为80GB,单卡跑400亿模型,毫无压力。但我觉得单卡H100其实也能跑。

重要参数对比:

AMD MI300X猛啊。

通过下图来稍微展开下几个参数

  1. 显存大小

模型的训练和推理都是要放到显存中的,显存越大,可支持的模型大小越大,训练也会加速。 之前的文章提到过具体细节(平凡的兵:怎样用单卡12GB显存训练大模型)

2. 显存带宽

GPU包含运算单元和显存,显存带宽就是运算单元和显存之间的通信速率,越大越好。

3. Nvlink和infinity fabric

一般用于显存之间的通信,分布式训练,无论是模型并行还是数据并行,GPU之间都需要快速通信,不然就是性能的瓶颈。

4. 算力FP32

32位浮点的运算能力。

5. 外部通信接口

这里主要是跟CPU和硬盘通信,AMD MI300用的是PCIE4.0接口,低于英伟达的H100。 我猜测,主要目前深度学习任务,瓶颈不在硬盘和GPU的通信上,也就是训练数据的载入上(dataloader),省点成本。

发表回复

相关推荐

Day 4 酒店前廳部組織結構及各崗位英文名稱

嗨,親愛的小夥伴們晚上好,堅持如期更新是一種好習慣。我們先來對上期內容考個試,很簡單,莫慌。HR是哪個部門的簡稱?哪個...

· 2分钟前

绝对实用:内存体质、内存超频、内存选购 频率&电压&时序

今天把一直想讲的内存问题讲一讲,起因是今天在张大妈的评论区的一个争论。 如下:

· 2分钟前

一篇文章了解DSD及DTS格式的相关疑问解答

《一》什么是DSD?这种格式有什么优缺点?DSD是Direct Stream Digital的缩写,是Sony与Philips推出SACD时所注册的商标。这种编 ...

· 6分钟前

解决iPad故障问题的三种重置方式:出厂恢复、软重置和强制重启

这篇文章解释了如何重新启动iPad,以及如果它没有响应,如何强制它重新启动。它还包括如何重置iPad的其他选项。

· 7分钟前

分享一下:马斯洛5个需求层次

1、生理需求 生理上的需要是人们最原始、最基本的需要,如空气、水、吃饭、穿衣、性欲、住宅、医疗等等。若不满足,则有生 ...

· 7分钟前