LC:OCP峰會特別關注光學連接和人工智能

訊石光通訊網(wǎng) 2022/11/18 9:32:47

  ICC訊(編譯:Nina)近日,LightCounting(LC)發(fā)布了一份關于2022年OCP峰會(OCP Summit 2022)的研究報告。以下是關于這份報告的關鍵信息。

  2022年OCP峰會對行業(yè)來說是一場富有成效的盛會。它提供了一個難得的機會,可以與領先的云計算公司的技術專家見面,并了解他們的未來計劃。這些計劃是變化的,但有一個明確的方向,即部署更多的人工智能(AI)硬件和網(wǎng)絡來支持它,同時優(yōu)化電力效率。該行業(yè)正準備承擔更多風險,并部署一系列新技術:從液體冷卻到共封裝光學(Co-packaged optics,CPO)。

  OCP已經(jīng)啟動了未來技術計劃(Future Technology Initiative),以促進研究界和初創(chuàng)企業(yè)與云計算公司專家和關鍵供應商之間的互動,以確定新的有前途的技術?!芭嘤率袌觥笔荗CP目前的首要任務之一。

  光學是OCP的另一個新優(yōu)先事項。今年的峰會包括由Andy Bechtolshem主持的為期半天的新“Optical track”會議。LightCounting有幸主持了最后的小組討論。

  Meta基礎設施副總裁Alexis Bjorlin的主題演講,明確了峰會議程的重點,包括AI硬件、軟件和包括光連接在內(nèi)的所有支持技術。Alexis在她的主題演講中總結了AI硬件和架構的發(fā)展,包括下圖。它清楚地表明,DRAM和互連的帶寬進步遠遠落后于計算硬件的進步。這種情況必須改變。

  Meta最新的AI平臺Grand Teton在此次活動中亮相,與不到兩年前推出的Zion EX相比,該平臺提供了4倍的主機GPU和2倍的網(wǎng)絡帶寬。

  不斷增加的AI硬件功耗是另一個主要挑戰(zhàn)。Meta為OCP提供了一款全新的開放式機架v3,專為空氣和液體冷卻而設計。任何能夠提高AI硬件和網(wǎng)絡能效的新技術都必須認真對待,包括CPO。Alexis在之前擔任Broadcom光學部總經(jīng)理期間領導了CPO的開發(fā)。

  Meta在元宇宙領域的早期失誤受到了媒體的嘲笑,該公司被迫承認在學習AI的魔力方面落后于競爭對手。在幾名高管進入公司后,Alexis被任命負責重振公司的AI戰(zhàn)略和支持該戰(zhàn)略的基礎設施。鑒于她在光學行業(yè)的過往經(jīng)驗,Meta的未來現(xiàn)在已盡在掌握中。

  Alexis在她的主題演講中承認,光學對她來說仍然很重要。她現(xiàn)在有能力承擔一個經(jīng)過計算的風險,給包括CPO在內(nèi)的新光學技術一個機會。這對幾十年來一直被業(yè)內(nèi)高管們所輕視的光學行業(yè)來說是一個極好的機會。

  英偉達(Nvidia)的Craig Thompson提出了一個引人注目的論點,認為AI集群所需的網(wǎng)絡連接帶寬將增加32倍。他還指出,用目前的可插拔光模塊設計來實現(xiàn)這一目標是不現(xiàn)實的:這將使整個系統(tǒng)的成本翻倍,并增加20-25%的功耗。Craig強調(diào),需要新的激光器和調(diào)制器設計,以降低AI集群中光學連接的成本和功率。CPO可能會降低50%的功耗,但需要額外提高10倍,才能為AI系統(tǒng)帶來更多的光學連接。Craig還提到,英偉達計劃率先推出200G Serdes和更快的芯片間(chip-to-chip)連接。他預計NVlink將成為市場上最快的互連技術。

新聞來源:訊石光通訊網(wǎng)

相關文章