阿里云磐久服务器：GPU互联技术如何重塑AI算力格局

在人工智能技术飞速发展的今天，强大的算力基础设施已成为推动行业进步的关键力量。阿里云最新推出的磐久AL128超节点服务器，正是这一背景下的重要突破。这款面向下一代超大集群设计的服务器，通过革命性的GPU互联架构，在大模型训练与推理中实现了算力与通信的协同优化，为AI应用提供了前所未有的性能支撑。

阿里磐久服务器gpu

什么是超节点服务器？磐久AL128的定位解析

超节点服务器不同于传统的单机服务器，它是专门为大规模AI集群设计的新型计算架构。磐久AL128作为阿里云磐久AI Infra 2.0的核心组成部分，采用了面向下一代超大集群的服务架构，从根本上重构了GPU间的互连方式。

相比于传统架构，磐久AL128在同等AI算力下推理性能可提升50%。这一性能飞跃并非偶然，而是源于其对传统服务器设计理念的彻底革新。超节点服务器的核心思想是将多个计算单元有机整合，形成一个更高层次的“超级计算节点”，从而在更大范围内优化资源调度和数据流动。

磐久AL128的核心技术突破在于其ALink System，这套系统分为数据面(ALS-D)和管控面(ALS-M)两个关键部分。

数据面负责GPU间的高速数据传输，采用的是UALink技术，支持两大关键功能：

管控面则为不同的AI加速器芯片提供统一的软件接口和标准化接入方法。令人印象深刻的是，其GPU兼容性涵盖了海光、沐曦、燧原、天数智芯、摩尔线程等多个厂商的芯片，这种开放兼容的设计理念，为用户提供了更大的灵活性和选择空间。

在硬件层面，磐久AL128采用了“无背板正交架构”，这与华为CM384等传统有背板方案形成鲜明对比。

“机柜背面上下两个ALink-Switch节点，每个都竖插8个交换托盘，前面16块GPU单板（带64颗GPU）跟这些交换板是正交对着连的，没有传统的大背板，也不用乱拉电缆。”

这种设计的优势显而易见。传统背板线路多且长，高频信号传输时衰减和干扰严重，而正交直接连接将传输路径压缩到最短，部分连接甚至是PCB板直连，信号损耗几乎可以忽略不计。

更值得称道的是其维护性设计。交换托盘竖插的方式使得故障时能够直接抽出更换，无需拆卸整个机柜，大大提升了系统的可维护性和可用性。

磐久AL128在互联策略上展现了精妙的分层思想，采用了“铜-光”两层互联方案：

互联层级	传输介质	负责范围	技术特点
第一层	铜连接	Switch节点内部和64个GPU的“内部通勤”	支持224G速率，采用CPO连接器技术
第二层	光连接	上下Switch节点间的“跨区调度”	适应长距离传输，支持千级节点二级互联

这种分层设计的智慧在于充分发挥不同介质的优势。铜连接在短距离内延迟更小、成本更低，完全满足GPU内部scale up的需求；而光连接则在节点间距离较远时表现出色，能够支撑TB级互连带宽和PB级共享显存的实现。

ALink Switch并非孤立的交换芯片，而是与阿里自研的CIPU 2.0芯片深度绑定。CIPU 2.0向下管理计算、存储、网络的硬件资源，向上对接云系统，同时与EIC/MOC高性能网卡协同工作，最终实现Pb/s级别的带宽和百纳秒级的延迟。

这种深度集成的设计理念，使得整个系统能够在硬件层面实现极致的性能优化。CIPU 2.0的出现，代表了云计算基础设施从软件定义向硬件加速的重要转变。

阿里云在服务器架构上的创新不仅限于磐久系列，其F系列通用计算服务器同样体现了面向未来的设计理念。该系列服务器采用单路设计减少爆炸半径，优化散热支持600瓦TDP，并实现了CIPU节点比例灵活配比及部件模块化可插拔设计，这些改进显著提升了运维效率和客户响应速度。

这种架构演进反映了AI时代对计算基础设施的新要求。随着处理器核心数的快速增长——从2022年突破50核心到2024年业界主流服务器核心数已超过100核心，甚至达到160核心，传统服务器设计已难以满足大规模AI训练的需求。

磐久AL128的技术突破不仅仅是一款产品的成功，更是对整个AI算力基础设施的重新定义。其TB级互连带宽和PB级共享显存的能力，为大模型训练提供了前所未有的硬件支撑。

从技术角度看，这种架构创新解决了AI训练中的几个关键瓶颈：

展望未来，随着AI模型规模的持续扩大，对算力基础设施的要求将越来越高。磐久AL128所代表的超节点服务器架构，很可能成为未来大规模AI集群的标准配置，为人工智能技术的发展提供坚实的硬件基础。

内容均以整理官方公开资料，价格可能随活动调整，请以购买页面显示为准，如涉侵权，请联系客服处理。

本文由星速云发布。发布者：星速云。禁止采集与转载行为，违者必究。出处：https://www.67wa.com/148705.html