omniture

一区二区三区乱码国产在线_无码精品一区二区三区免费_日韩国产欧美一区二区三区_日韩欧美中文字幕一字不卡

浪潮信息發布"元腦SD200"超節點,面向萬億參數大模型創新設計

2025-08-08 21:07 436

北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發布面向萬億參數大模型的超節點AI服務器"元腦SD200"。該產品基于浪潮信息創新研發的多主機低延遲內存語義通信架構,以開放系統設計向上擴展支持64路本土GPU芯片。元腦SD200可實現單機內運行超萬億參數大模型,并支持多個領先大模型機內同時運行及多智能體實時協作與按需調用,目前已率先實現商用。在實際評測中,元腦SD200運行DeepSeek R1和Kimi K2等全參模型的64卡整機推理性能實現超線性擴展。


當前,混合專家模型(MoE)的高效架構正在驅動大模型參數規模持續擴展,國內外前沿大模型的參數量快速突破萬億規模,這給算力系統架構提出新的挑戰。一方面,模型參數量增加和序列長度增加帶來的鍵值緩存(KV cache)激增,需要智能計算系統具有超大顯存空間承載,依靠單芯片或節點的性能提升已難以為繼;且其推理過程作為通信敏感型計算,對分布式計算通信延時要求極高,需要構建更大向上擴展(Scale up)高速互連域。另一方面,智能體AI開啟多模型協作的新范式,其推理過程需要生成比傳統模型多近百倍的數據詞元(token),導致計算量激增。

元腦SD200超節點AI服務器是浪潮信息面向萬億參數大模型AI時代而設計,創新研發多主機低延遲內存語義通信架構,基于開放總線交換技術構建,在單機內實現了64路GPU芯片的高速統一互連,成功解決萬億大模型對超大顯存空間和超低通信延時的核心需求。在開放架構之上,元腦SD200通過智能總線管理和開放的預填充-解碼(Prefill-Decoder)分離推理框架實現軟硬件深度協同,智能化管理復雜AI計算任務。

- 在架構層面,元腦SD200基于自主研發的開放總線交換技術首創多主機三維網格系統架構,實現64路本土GPU芯片高速互連;通過創新遠端GPU虛擬映射技術,突破多主機交換域統一編址難題,實現顯存統一地址空間擴增8倍,單機可以提供最大4TB顯存和64TB內存,為萬億參數、超長序列大模型提供充足鍵值緩存空間。同時,依托百納秒級超低延遲鏈路,構建64卡大高速互連域統一原生內存語義通信,實測結果表明,在推理過程常見的小數據包通信場景中,全規約(All Reduce)性能表現優異,顯著提升計算與通信效率。

- 在系統層面,根據萬億參數大模型計算、通信需求特征,浪潮信息開發智能總線管理系統,實現超節點64卡全局最優路由的自動創建,支持不同拓撲切換,資源按需切分。對于全規約、全聚集(All Gather)等典型通信算子,開展不同數據量大小的細粒度通信策略設計,如多層級通信機制等,實現通信延時進一步降低。同時依托開放的PD分離框架,支持異步KV Cache高效傳輸與差異化并行策略,在提升業務服務級別目標的同時保持對多元算力的兼容性,實現計算與通信架構的深度協同優化。

元腦SD200超節點AI服務器通過軟硬協同系統創新,成功向上擴展突破芯片性能邊界,在大模型場景中展示出優異的性能表現。結合優化的PD分離框架,SD200超節點滿機運行DeepSeek R1全參模型推理性能超線性提升比為3.7倍,滿機運行Kimi K2全參模型推理性能超線性提升比為1.7倍。


當前,開源模型的飛躍式進步正在加速智能時代的到來,推動研發范式從封閉走向開放協作。同時,隨著大模型參數量的持續提升,對算力基礎設施的建設提出了更高要求。浪潮信息通過開放系統架構創新,為開源大模型的規模化落地和應用創新提供關鍵支撐。

消息來源:浪潮信息
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發布全球互聯網、科技、媒體、通訊企業的經營動態、財報信息、企業并購消息。掃描二維碼,立即訂閱!
collection
主站蜘蛛池模板: 淄博市| 清徐县| 喀喇沁旗| 太仓市| 广西| 石景山区| 佳木斯市| 兴山县| 商水县| 武宣县| 临高县| 邹平县| 德安县| 安龙县| 都昌县| 高青县| 本溪市| 甘泉县| 社旗县| 汉寿县| 宽城| 清水县| 凤庆县| 资讯 | 隆安县| 弋阳县| 岚皋县| 沅陵县| 察哈| 南宁市| 达拉特旗| 藁城市| 洪洞县| 邢台市| 平武县| 荥阳市| 尤溪县| 丰台区| 康平县| 康乐县| 藁城市|