北京時間 3 月 19 日 (星期三) GTC AI 大會在美國加州圣何塞舉行,GTC 大會是探索 AI 真實用例及其優(yōu)勢的平臺,NVIDIA CEO 黃仁勛分享NVIDIA的加速計算平臺如何推動人工智能、數(shù)字孿生、云技術(shù)和可持續(xù)計算的下一波浪潮。大會提到英偉達關(guān)于AI工廠的未來路標(biāo),整體架構(gòu)會從NVL72液冷升級到NVL576液冷,計算架構(gòu)從Blackwell升級到Rubin,而在Scale-Up的NVLink互聯(lián)速率將從1800GB/s提升到未來的3600GB/s,同時Scale-Out的互聯(lián)方案將從Spectrum5的51T+CX8的800G升級到Spectrum6 102T的CPO液冷+CX9 1600G。
圖1 NVlDlA為千兆瓦級人工智能工廠鋪路
隨著整體人工智能工廠能力和功耗的提升,網(wǎng)絡(luò)側(cè)互聯(lián)的光模塊功耗也成為重點關(guān)注對象,單個互聯(lián)光模塊最大功耗30瓦特,只是用作數(shù)據(jù)的轉(zhuǎn)發(fā)卻不參與任何計算。在GTC2025發(fā)布會上,英偉達推出了全新的NVIDIA Photonics硅光子技術(shù)。這項技術(shù)通過共封裝光學(xué)(CPO)取代傳統(tǒng)的可插拔光學(xué)收發(fā)器,使光纖直接連接到交換機,大幅減少數(shù)據(jù)中心的功耗。據(jù)英偉達測算,該技術(shù)可降低40MW的功耗,并提高AI計算集群的網(wǎng)絡(luò)傳輸效率,為未來超大規(guī)模AI數(shù)據(jù)中心奠定基礎(chǔ)。
圖2 NVlDlA發(fā)布CPO交換機
作為數(shù)字化解決方案領(lǐng)導(dǎo)廠商,紫光股份旗下新華三集團早在2023年便發(fā)布了業(yè)界首款800G硅光交換機S9827-64EO,通過光電合封CPO、液冷、智能無損等先進技術(shù)的融合,旨在解決AIGC對網(wǎng)絡(luò)高性能、高可靠、低能耗訴求的矛盾,實現(xiàn)魚與熊掌兼得。
超高吞吐:
引領(lǐng)數(shù)據(jù)中心800G超寬時代
H3CS9827-64EO是全球首款基于51.2T高性能芯片設(shè)計的 800G CPO交換機,最大支持64端口800G端口,可擴展為128*400G/200G/100G端口,單POD可支持超過8000張400G網(wǎng)卡。
圖3 S9827硅光交換機前面板實物圖
如上圖,S9827-64EO上半部分采用32組MDC光纖接口,客戶只需要通過連接不同的光纖,便可實現(xiàn)64*800G或128*400G的對外連接能力。相對于傳統(tǒng)的MPO/LC連接器,MDC采用了獨有的端面研磨技術(shù),降低了端面連接損耗,在單條鏈路中累計可降低光鏈路損耗約1.6dB,在高速網(wǎng)絡(luò)中可以保障穩(wěn)定的光信號傳輸能力。且經(jīng)過測試采用CPO技術(shù)轉(zhuǎn)發(fā)芯片直接出光相比普通插拔模塊時延更低,轉(zhuǎn)發(fā)時延同比傳統(tǒng)設(shè)備降低20%以上。
在S9827-64EO主機的下半部分,采用16個外置光源集成方案,通過外部獨立光源模塊提供純凈光信號,將光源耦合到光通路后再耦合至調(diào)制器。
液冷技術(shù):
低碳減排,提升使用體驗
在傳統(tǒng)印象中,如果采用了高性能數(shù)據(jù)中心交換機,伴隨而來的一定是高功耗對機房供電系統(tǒng)的挑戰(zhàn),以及散熱風(fēng)扇全速運轉(zhuǎn)時喧囂的噪音,對用戶的使用支出和運維體驗都造成了負(fù)面影響。而在800G CPO展示產(chǎn)品上,新華三驗證并實現(xiàn)液冷技術(shù),解決了以上難題。
圖4液冷數(shù)據(jù)中心機房示意圖
端網(wǎng)融合零丟包:
助力智算網(wǎng)絡(luò)應(yīng)用進化
雖然高速以太網(wǎng)技術(shù)能夠提供充足的網(wǎng)絡(luò)通道資源,但同時也意味著同樣時間的網(wǎng)絡(luò)擁塞,其帶來的丟包數(shù)量和影響也將數(shù)倍于上一代速率標(biāo)準(zhǔn)。因此,新華三在S9827-64EO上,集成了全面的智能無損網(wǎng)絡(luò)特性,包括打造端網(wǎng)融合的負(fù)載均衡,解決從端側(cè)到網(wǎng)側(cè)整體流量負(fù)載不均難題。
同時結(jié)合AI ECN技術(shù),實時監(jiān)測不同隊列的傳輸時延、隊列長度、緩存變化等,自動調(diào)整傳輸門限,實現(xiàn)端到端無損網(wǎng)絡(luò)。并且支持端網(wǎng)融合的路徑導(dǎo)航負(fù)載均衡技術(shù)實現(xiàn)整網(wǎng)流量無擁塞,提升了AI訓(xùn)練效率。 S9827硅光交換機支持ns級硬件自動感知能力,能夠快速識別鏈路切換動作極大降低了網(wǎng)絡(luò)故障對業(yè)務(wù)的影響程度,有力支撐智算網(wǎng)絡(luò)集群穩(wěn)定運行。
圖4 S9827-64EO實物圖
如今S9827-64EO硅光交換機基于最新的新華三智算網(wǎng)絡(luò)架構(gòu)進一步為用戶提供高性能的智算網(wǎng)絡(luò)聯(lián)接(如圖4),以其硅光互聯(lián)技術(shù)為支撐,實現(xiàn)高吞吐量、低時延、低能耗等多項特點,可與業(yè)界主流的400G GPU實現(xiàn)互聯(lián),單POD最大可支持超2000個800G端口或8000個400G端口規(guī)模。S9827-64EO將在人工智能等數(shù)字化領(lǐng)域繼續(xù)發(fā)揮更加重要的作用,助力各行業(yè)客戶暢享智算新時代。
2025年,新華三繼續(xù)推動光互連技術(shù)的創(chuàng)新落地,即將發(fā)布新一代智算網(wǎng)絡(luò)交換機產(chǎn)品,敬請期待。