在全光線路交換(OCS)互連的全光網絡支持下,分解式網絡為人工智能和機器學習帶來全新網絡設計。
云計算領域的超大規(guī)模企業(yè)和其他高性能計算 (HPC) 服務提供商必須構建和拓展其計算平臺,以滿足客戶對人工智能應用的需求,同時控制資本支出并降低能耗需求。特別是,所需的處理能力已經提高了幾個數量級。
資源分解是降低成本和能耗的關鍵
不同于將這些平臺的構建塊緊密地、但不靈活地捆綁在一個相對單一的平臺(如標準服務器機箱)中,而“分解”必要的組件或子系統(tǒng)的過程避免了效率低下和一些關鍵底層資源利用率不足的風險,更重要的是,如果簡單地 “架設和堆疊”更多服務器,則不可避免地出現過度地能耗。
在分解式架構中,這些資源(CPU、內存、存儲、各種形式的加速硬件)使用集成式高速數字收發(fā)器和基于適當傳輸介質和交換技術的專用互連結構進行互連,因此實現了靈活的組合。資源可以相互獨立地組合和適當擴展,滿足預期工作負載的需求。
靈活利用資源
資源分解原理如上圖所示。利用底層細粒度資源的公共池,所需資源以定制比率捆綁在一起,動態(tài)“組合”形成占比靈活的“裸金屬主機”硬件主機。在這種情況下,關鍵構建塊是低級別的資源元素本身,例如 CPU、內存、存儲和各種加速器(GPU、TPU、FPGAs)。
就可訪問和可消耗的資源塊的細粒度,可以定義不同的分解級別。
在細粒度最高的分解形式中,每個資源塊(例如一組 DRAM、一個 CPU、一個加速器)都擁有板載硬件,以便于其資源與互連平臺進行必要的高速、低延遲連接。
細粒度稍低的資源分解形式與當前硬件實施更加兼容,可被視為促進向完全分解平臺漸進過渡的一種方式。其中包括:覆蓋在分組交換結構上的光互連和改變傳統(tǒng)服務器的用途。
疊加在分組交換架構上的光互連
在這種應用中,動態(tài)互連的計算資源組件僅限于加速器硬件。通過單模光模塊,它們可以使用專用光交換結構,靈活、直接地與其他主機中的同類組件互連,該專用光交換結構有效地疊加在包交換網絡上,這些包交換網絡已經將集群中主機之間互聯起來。
改變傳統(tǒng)服務器的用途
除單獨對加速卡進行互連外,還可以訪問傳統(tǒng)服務器群中已經存在的更多資源,配備專業(yè)的 SerDes 處理硬件和固件以及高密度、高速光收發(fā)器的專用 PCIe 互連卡充當機箱中與 PCIe 連接的計算資源和光互連結構之間的高性能網關。
互聯結構
這是一種采用透明全光線路交換的光互連結構,該結構提供了確定性、線路交換的固定帶寬數據路徑,非常適合硬件資源地互連,否則這些硬件資源將通過服務器主板上的專用線路或者PCI Express 等特定總線直連進行固定的低級互連。
與電交換網絡相比,它還能夠大幅降低網絡本身的功耗,顯著降低與數據路徑相關的延遲,以及更好地對網絡架構進行縱向和橫向擴展。由于全光交換網絡對與分解式資源元素相關聯的光收發(fā)器之間的序列化數據流量的格式和線路速率具有固有的透明性,因此面為未來帶寬升級更加友好。
POLATIS DirectLight?
全光交換機等損耗最低的全光線路交換機允許用多達四級或四級以上的交換來構建網絡架構,同時保持在使用分解式資源元素的典型光收發(fā)器的光損耗預算之內。
分解計算的優(yōu)勢
可以靈活快速地組建硬件計算平臺
可將平臺擴展到適合在硬件運行的各種工作負載的可用資源類型的任何大小和比率。
在運行特定工作負載的過程中,可以隨資源消耗需求的變化調整平臺的大小。
可以暫時關閉不需要的資源,節(jié)省運營開支 (OPEX)。
借助分解網絡架構,運營商能夠:
為各種組件構建塊選擇一流的供應商。
使用那些僅支持他們所需特定功能的資源。
根據需要升級資源元素的不同類型和/或塊。