中國移動打造超大規(guī)模智算中心,助力數(shù)字經(jīng)濟創(chuàng)新發(fā)展
隨著新一輪科技革命與產(chǎn)業(yè)變革的深入推進,人工智能已從賦能千行百業(yè)提質增效的輔助工具,躍升為全面使能經(jīng)濟社會轉型發(fā)展的核心能力,智算中心作為新型信息基礎設施,是“AI+”戰(zhàn)略轉型與數(shù)字經(jīng)濟發(fā)展的重要底座。中國移動作為中央企業(yè),認真履行“三大責任”,積極發(fā)揮“三個作用”,依托戰(zhàn)新百大工程,將國家算力基礎設施高質量發(fā)展行動計劃與AI+行動要求做深做實。
2024年,中國移動勇?lián)撬阒行慕ㄔO的“開拓者”、AI+戰(zhàn)略轉型的第一批“踐行者”、行業(yè)智算技術方案的“引領者”,秉持“公共普惠、創(chuàng)新領先、綠色低碳、自主可控”的原則,啟動了超大規(guī)模國產(chǎn)化智算中心項目建設。在項目推進過程中,中國移動以“科技攻關、產(chǎn)業(yè)帶動、價值貢獻”為指引,聚焦工程建設與技術創(chuàng)新雙軌道同步發(fā)力,為全球AI產(chǎn)業(yè)發(fā)展注入了新活力。
夯實智算資源底座,鑄就全球卓越算力
中國移動在呼和浩特和哈爾濱高效率建成了兩個全球運營商“最大”智算中心。其中,全球運營商最大單體智算中心(呼和浩特節(jié)點),智能算力規(guī)模達1.9萬卡,采用了業(yè)界先進的計算、存儲和網(wǎng)絡架構,并首次實現(xiàn)了異構算力、GPU池化、扣卡模組、冷板式液冷等先進技術,成功入選“2023年度央企十大超級工程”。全球運營商最大單集群智算中心(哈爾濱節(jié)點),單集群超過1.8萬張AI加速卡,規(guī)模應用智算服務器互聯(lián)的高性能無損網(wǎng)絡、全調度以太網(wǎng)以及融合分級存儲等多項創(chuàng)新技術,搭載移動云智算平臺和智管平臺,超長穩(wěn)訓(千卡穩(wěn)訓25天、萬卡穩(wěn)訓14天)、斷點續(xù)訓(千卡任務恢復時間30分鐘)、異構混訓(百卡級)能力業(yè)界領先,支撐完成“九天”萬億大模型以及頭部行業(yè)客戶千億模型訓練。這兩個智算中心的建成,標志著我國國產(chǎn)芯片商用部署達到了新的水平,進一步縮小了與國際先進水平的差距。
強化技術創(chuàng)新引領,突破智算關鍵瓶頸
在構建超萬卡智算集群方面,中國移動主導提出“機間互聯(lián)”GSE全調度以太網(wǎng)技術和標準體系,對標國際主流的IB和UEC方案,解決超大規(guī)模智算集群服務器之間高效組網(wǎng)的難題;主導提出“卡間互聯(lián)”O(jiān)ISA全向智感互聯(lián)技術及標準體系,建立OISA協(xié)同創(chuàng)新平臺,有效提升國產(chǎn)GPU卡間互聯(lián)帶寬及規(guī)模;自研智算平臺,具備萬卡并行訓練、斷點自動續(xù)訓、算存網(wǎng)一站式調度等能力,確保AI大模型訓得好、訓得快、訓得穩(wěn)。自研“芯合”異構混訓系統(tǒng),構建了跨架構混合訓練平臺原型系統(tǒng),打通了生態(tài)豎井。這些“系統(tǒng)級”技術創(chuàng)新思路與成果有效彌補了我國單點技術不足,通過產(chǎn)業(yè)合作將極大地推動國內智算產(chǎn)業(yè)整體升級。
推動產(chǎn)業(yè)聯(lián)合創(chuàng)新,提升全球競爭實力
人工智能已成為國家戰(zhàn)略的重要組成部分,中國移動建設的超大規(guī)模智算中心工程有助于形成國家人工智能重大科學裝置,加速人工智能領域技術突破,帶動產(chǎn)業(yè)聯(lián)合創(chuàng)新。對標國際大模型演進趨勢及國際AI科技巨頭十萬卡超級集群建設,中國移動勇當“AI+”新時代的“基礎設施提供者、場景應用匯聚者、技術算法驅動者、智能生態(tài)構建者”,將大力推進智能算力布局建設和人工智能領域技術創(chuàng)新,積極投入十萬卡超級智算集群技術研究,與行業(yè)合作伙伴加強基礎設施共建、自主可控技術共創(chuàng)、創(chuàng)新研發(fā)能力共享,促進智算領域自主技術成熟升級,推進智算自主可控產(chǎn)品迭代應用,發(fā)揮中國移動產(chǎn)業(yè)鏈“鏈長”融通帶動作用,推動國產(chǎn)智算產(chǎn)業(yè)鏈成熟,進一步提升我國在全球AI產(chǎn)業(yè)中的科技競爭實力。
面向“AI+時代”,中國移動將繼續(xù)肩負起推動AI普惠發(fā)展、創(chuàng)新突破的重要使命,大力實施“AI+”行動計劃,為我國人工智能產(chǎn)業(yè)的發(fā)展持續(xù)提供強大的算力支撐,也為全球AI技術的進步貢獻出更多中國智慧和中國方案。