和硕亮相128核AMD MI350X AI机架，挑战英伟达垄断地位-AI+-智快网

在近期台北国际电脑展的盛会上，和硕公司惊艳亮相，推出了一款专为人工智能（AI）设计的创新机架解决方案，这一消息由知名硬件资讯平台Tom's Hardware率先披露。

这款解决方案的核心亮点在于，它搭载了高达128颗AMD最新一代的Instinct MI350X GPU，这些GPU专为AI推理与训练任务而打造，其架构设计相较于AMD官方机架方案领先整整一代。

据和硕透露，这一平台不仅是研发下一代AMD Instinct MI450X处理器IF64/IF128系统的重要技术验证阵地，更是预示着相关产品将在一年后步入量产阶段，引发了业界的广泛关注与期待。

和硕的AS501-4A1/AS500-4A1系统，在配置上采用了8组5U计算单元，每组配备1颗AMD EPYC 9005处理器和4颗Instinct MI350X加速器，为了确保在高负载下的稳定运行，该系统还采用了高效的液冷散热方案。整机设计符合OCP开放计算标准，专为云数据中心（如meta）打造，采用了51OU ORV3规格。

然而，值得注意的是，由于AMD尚未推出Infinity Fabric专用交换机，目前该系统主要通过400GbE网络连接不同的GPU，最大集群规模限制为8颗。相比之下，英伟达的GB200/GB300 NVL72平台则通过NVLink实现了72颗GPU的直连，因此在扩展性方面，MI350X系统暂时无法与英伟达方案相媲美。

尽管如此，和硕的这一系统仍然具有其独特的核心价值。它能够为OCP用户提供即插即用的AI算力平台，同时帮助开发者从软硬件层面深入掌握多GPU系统的搭建技术，为AMD挑战英伟达在机架级AI解决方案领域的垄断地位奠定了坚实的基础。

根据AMD官方提供的数据，和硕的128-GPU系统理论峰值性能可达1,177 PFLOPS（FP4精度），每颗MI350X GPU搭载了288GB HBM3E显存，系统总显存高达36.8TB，这一数据不仅超越了英伟达Blackwell架构GPU的容量上限，更能够支持巨型AI模型的运行。

当然，该系统也存在一定的局限性，尤其是在GPU间通信方面依赖于以太网，这限制了其在大规模语言模型训练等需要高度同步性的场景中的应用。然而，这无疑是高性能、大内存AI解决方案领域的一次重要突破，也为AMD下一代Instinct MI400系列产品的推出铺平了道路。