本文的主要內(nèi)容有:
一、數(shù)據(jù)中心的網(wǎng)絡結構
二、400G光模塊的分類
三、400G光模塊主要測試項目
四、測試儀器
五、總結
一、數(shù)據(jù)中心的網(wǎng)絡結構
隨著云計算和大數(shù)據(jù)的普遍應用,數(shù)據(jù)中心作為云計算的核心基礎設置,其計算能力和內(nèi)部數(shù)據(jù)交換能力也呈現(xiàn)出指數(shù)級的發(fā)展。
對于數(shù)據(jù)中心來說,其內(nèi)部服務器以及交換機間普遍采用光模塊或AOC電纜進行互聯(lián)。現(xiàn)代新一代的數(shù)據(jù)中心為了應對數(shù)據(jù)流量的增長以及兼顧更靈活的擴容升級和冗余備份能力,普遍開始采用以Facebook公司倡導的Spine-Leaf的網(wǎng)絡架構,數(shù)據(jù)中心內(nèi)部的數(shù)據(jù)交換和吞吐能力更強,同時網(wǎng)絡結構也更加扁平化和密集。
因此,現(xiàn)代大規(guī)模數(shù)據(jù)中心對于光模塊的需求量及光纖資源的需求量非常大,光互聯(lián)的成本占了網(wǎng)絡成本的很大比例,如何選擇合適的技術同時兼顧技術發(fā)展和建設及運維成本是巨大的挑戰(zhàn)。
從技術需求來說,數(shù)據(jù)中心的光模塊選擇主要考慮的是傳輸距離、速率、密度和功耗。
從傳輸距離來說,其應用場景主要分為以下幾個方面:
<20m,主要用于機柜內(nèi)部的服務器和TOR交換機互聯(lián),目前數(shù)據(jù)速率以10G、25G為主,正在向50G或100G過渡。實現(xiàn)方式以DAC(直接連接的銅線電纜)或AOC(有源光纜)電纜為主。
<500m,主要用于數(shù)據(jù)中心同一機房內(nèi)Leaf到Spine交換機的互聯(lián)。目前數(shù)據(jù)速率以40G、100G為主,正在向400G過渡。其中100m以下的短距離主要以850nm的多模(MM)光纖為主;100m~500m距離多采用1310nm波長的單模(SM)光纖,出于成本考慮主要采用并行單模(PSM)技術。
<10km,主要用于數(shù)據(jù)中心樓宇間交換機或路由器的互聯(lián)。目前數(shù)據(jù)速率以100G為主,正在向400G過渡。這個距離上光纖的成本占比已經(jīng)較大,因此多采用波分復用技術在單根光纖上傳輸更多路信號,以1310nm波長的粗波分復用(CWDM)技術為主,部分短距離(500m~2km)場合仍可以使用PSM技術。
>10km,主要用于多個數(shù)據(jù)中心間的互聯(lián)(DCI)。目前實現(xiàn)方式以100G+DWDM(密集波分復用為主),未來80km以上主要采用400G相干通信+DWDM,80km以下也有采用PAM4+DWDM的實現(xiàn)方式。傳輸波長以1550nm波長為主,通過DWDM方式在單根光纖上實現(xiàn)40~80個波長的復用來達到4T~32T的傳輸速率。部分短距離(10km~40km)、速率要求不高的場合仍可以使用1550nm波長的CWDM技術。
二、400G光模塊的分類
光模塊是實現(xiàn)數(shù)據(jù)中心內(nèi)部光網(wǎng)絡互聯(lián)的關鍵硬件設備,隨著端口數(shù)和密度的提升,光模塊的成本會占到數(shù)據(jù)中心光網(wǎng)絡成本的接近一半。目前各大互聯(lián)網(wǎng)公司新建的數(shù)據(jù)中心已經(jīng)普遍采用100G的互聯(lián)技術,并會在未來2~3年內(nèi)大規(guī)模商用400G的互聯(lián)技術。因此,400G光模塊的實現(xiàn)技術成為業(yè)界關注的重點。
從光波長上區(qū)分,400G光模塊可以分為多模(MM)、單模(SM);從信號調制方式上,分為NRZ和PAM4調制(目前以PAM4為主);從傳輸距離上區(qū)分,400G光模塊可以分為SR、DR、FR、LR;從封裝形式上,400G光模塊可以分為CDFP、CFP8、OSFP、QSFP-DD等。下圖是400G光模塊的技術分類。
早期的400G光模塊使用的是16路*25Gbps NRZ的實現(xiàn)方式(如400G-SR16),采用CDFP或CFP8的封裝。其優(yōu)點是可以借用在100G光模塊上成熟的25G NRZ技術,但缺點是需要16路信號進行并行傳輸,功耗和體積都比較大,不太適合數(shù)據(jù)中心的應用。
目前的400G光模塊中,在光口側主要是使用8路*53Gbps PAM4(400G-SR8,FR8,LR8)或者4路*106Gbps PAM4(400G-DR4,FR4,LR4)實現(xiàn)400G的信號傳輸,在電口側使用8路*53Gbps PAM4電信號,采用OSFP或QSFP-DD的封裝形式。OSFP和QSFP-DD封裝都可以提供8路電信號接口。相比較來說,QSFP-DD封裝尺寸更小(和傳統(tǒng)100G光模塊的QSFP28封裝類似),更適合數(shù)據(jù)中心應用;OSFP封裝尺寸稍大一些,由于可以提供更多的功耗,所以更適合電信應用。
下圖分別是400G-FR8/LR8以及400G-FR4的實現(xiàn)方式(Reference:OSFP MSA Specification for OSFP OCTAL SMALL FORM FACTOR PLUGGABLE MODULE)??梢钥吹剑潆娍趥榷际?路53Gbps PAM4信號。
光口側情況稍微復雜一些,對于400G-SR8/FR8/LR8等模塊來說,光模塊內(nèi)部只是做CDR(時鐘恢復)以及電/光或光/電轉換,因此光口側與電口測一樣,也是8路53Gbps PAM4信號;對于400G-DR4/FR4/LR4等模塊來說,光模塊內(nèi)部還有Gearbox(變速箱)芯片把兩路電口輸入復用成一路信號再調制到光上,因此光口側的速率是電口側速率的2倍,即4路106Gbps PAM4信號。
另外,由于多模光纖在短距離傳輸上的成本優(yōu)勢,所以IEEE也在2018年3月份成立了802.3cm工作組,把之前在業(yè)界討論的用8路(SR8)甚至4路(SR4.2)多模光纖實現(xiàn)400G傳輸?shù)募夹g納入規(guī)范討論中。
從未來來說,出于成本的考慮,用4路光信號實現(xiàn)400G傳輸?shù)姆绞娇赡軙蔀橹髁?同時光模塊的電接口也可能會逐漸升級到4路*106Gbps PAM4的形式,以省去Gearbox芯片從而節(jié)省功耗和成本。在超遠距離(>80km)傳輸上,以OIF組織正在制定的400G-ZR規(guī)范為例,會采用相干通信+DWDM方式實現(xiàn)。
三、400G光模塊主要測試項目
從前一章的介紹可以看到,400G的光模塊普遍采用了PAM4(4-level Pulse Amplitude Modulation:4電平脈沖幅度調制)的信號調制技術,即采用4個不同的信號電平來進行信號傳輸,每個符號周期可以表示2個bit的邏輯信息(0、1、2、3)。
因此,要實現(xiàn)同樣的信號傳輸能力,PAM4信號的符號速率只需要達到NRZ信號的一半即可,傳輸通道對其造成的損耗大大減小,但付出的代價是信噪比會比NRZ信號惡化很多,測量方法也會有比較大的差異。下圖是典型的NRZ信號的波形、眼圖與PAM4信號的對比。
對于400G光模塊來說,其主要的高速接口包含電輸入接口、光輸出接口、光輸入接口、電輸出接口,以及其它的電源和低速管理接口。
因此,對于400G光模塊的電氣性能驗證來說,其主要測試項目分為光口發(fā)射機指標、光口接收機容限、電口發(fā)射機指標、電口接收機容限、系統(tǒng)測試。
3.1 發(fā)射機測試
光發(fā)射機、電發(fā)射機電氣特性測試環(huán)境如下。
發(fā)射機的測量項目又分為光發(fā)射機的測量項目和電發(fā)射機的測量項目,主要用于驗證光口及電口輸出信號的質量。
3.1.1 光發(fā)射機測試方法
主要用于驗證被測光模塊發(fā)出光信號的質量。測試方法如下:被測光模塊插在MCB夾具上,上電并配置正常工作;誤碼儀產(chǎn)生PAM4電激勵信號送給光模塊一路電輸入端,使得被測光模塊輸出SSPRQ的光信號,模塊的相鄰電通道上輸入PAM4的串擾信號。輸出光信號經(jīng)時鐘恢復進采樣示波器進行光發(fā)射機參數(shù)測試。更換其它通道依次測量所有通道光發(fā)射機指標。
TDECQ (Transmitter and dispersion eye closure for PAM4)即發(fā)射機色散眼圖閉合代價,是衡量光發(fā)射機經(jīng)過一個典型的光通道后PAM4信號功率裕量的損失。正常用于光信號傳輸?shù)募す馄鞫加幸欢ǖ淖V線寬度,經(jīng)過一段距離傳輸后,色散效應就會造成信號中不同波長成分的傳輸時延的變化。這些不同傳輸時延的信號在接收端疊加在一起就會造成信號質量的惡化,從而導致接收端的靈敏度下降。
在10G以太網(wǎng)IEEE 802.3ae標準里,這個指標定義為TDP (Transmitter and Dispersion Penalty) ;在100G以太網(wǎng)IEEE 802.3bm標準里,這個指標定義為TDEC(Transmitter and Dispersion Eye Closure) ;而在針對200G/400G以太網(wǎng)IEEE 802.3bs標準里,這個指標就是TDECQ(Transmitter and dispersion eye closure for PAM4)。
TDECQ通常用dB表示,對于PAM4信號來說,TDECQ值越小,表示這個信號相對于理想信號的功率裕量損失越小,或者說能在光纖里傳輸更遠的距離。根據(jù)802.3bs里的定義,TDECQ的參考測試方法如下圖所示:
在測試中,被測件產(chǎn)生SSPRQ碼型的光信號,然后經(jīng)過測試光纖進行傳輸。被測信號經(jīng)光纖傳輸后進入測量用的采樣示波器,采樣示波器一方面通過符合規(guī)范的CRU(Clock Data Recovery)電路進行時鐘恢復,另一方面把被測光信號經(jīng)過參考濾波器后進行采樣。采樣后的波形要進行5階FFE的信號均衡,然后以CRU恢復時鐘為基準形成PAM4信號眼圖。
眼圖形成以后,再根據(jù)信號眼圖的光調制幅度(OMA)、信號幅度噪聲(R)、以及和誤碼率要求對應的外推系數(shù)(Qt)根據(jù)公式計算TDECQ的值。
下圖是在采樣示波器里對均衡后光信號的參數(shù)進行OMA、ER、TDECQ等參數(shù)測試的例子。我們可以看到,盡管很多測量參數(shù)的定義非常繁瑣,但基于示波器里的PAM4測量選件,使用者不需要繁瑣的操作,就可以快速得到需要的測量結果。
3.1.2 電發(fā)射機測試方法
主要用于驗證被測光模塊電口輸出的質量。測試方法如下:被測光模塊插在MCB夾具上,上電并配置正常工作;誤碼儀產(chǎn)生PAM4電激勵信號送給光模塊一路電輸入端,光模塊相鄰電通道上輸入PAM4的串擾信號。輸出光信號環(huán)回到光接收機,并測試其電通道輸出的PRBS13Q信號參數(shù)。
眼高(Eye Height)和眼寬(Eye Width)是400G光模塊電信號質量測試的重要參數(shù)。在IEEE 802.3bs規(guī)范中,定義眼圖測試時使用PRBS13Q的PAM4碼型。被測點輸出的信號經(jīng)過參考均衡器和時鐘恢復后疊加形成眼圖。因此,合適帶寬的示波器、正確的均衡器以及可靠的時鐘恢復對于PAM4信號的眼圖測試至關重要。而對于Module輸出端的測試來說,還需要模擬出信號經(jīng)過Host內(nèi)部走線損耗對于信號的影響,所以測試中示波器還需要在捕獲到的信號上疊加上約6.4dB的傳輸通道損耗。
由于PAM4信號會形成3層眼圖,所以對每層眼圖要分別測量。在IEEE 802.3bs規(guī)范里,定義以中間層眼圖的中心位置為參考點計算眼高和眼寬。在測試過程中要更換不同的均衡器的值,并根據(jù)信號的噪聲和抖動概率分布來計算等效的眼高和眼寬,這是一個非常復雜的計算過程,這里不做具體論述。
3.2 接收機及誤碼率測試
發(fā)射機的測試項目主要用于保證光模塊的光口和電口輸出信號的質量。嚴格來說,還需要驗證光模塊的光口和電口接收信號的能力。
光模塊接收到的光信號通常經(jīng)過很長距離的光纖傳輸,接收到的光信號上可能疊加了各種抖動和噪聲,所以光接收機測試可以用于驗證被測光模塊對于惡劣光信號的容忍能力。
同時,光模塊需要從電口接收交換機或服務器發(fā)送過來的電信號并轉成光信號發(fā)出去。由于電信號經(jīng)PCB、連接器傳輸會產(chǎn)生較大的損耗和發(fā)射,所以電接收機測試項目可以驗證被測光模塊對于惡劣電信號的容忍能力。
3.2.1 光接收機測試方法
IEEE 802.3bs規(guī)范中對于光接收機的壓力容限測試方法描述如下:通過參考的PAM4信號源與抖動、噪聲、碼間干擾注入源,以及參考的光發(fā)射機產(chǎn)生所需的光壓力信號。
對光壓力信號由外圍消光比OER,外光調制幅度OOMA和壓力眼圖閉合代價SECQ來表征。PAM4光壓力信號首先由一個參考光接收機進行校準,以確保其參數(shù)符合規(guī)范要求。這個接收機包含符合規(guī)范要求的理想4階貝塞爾-湯姆遜低通濾波器,規(guī)范要求的FIR均衡器以及時鐘恢復功能。
校準后的光壓力信號輸入被測接收機的一個通道,被測接收機其余通道輸入正常通信的光信號。最后由被測光模塊環(huán)回電信號到誤碼儀的誤碼檢測口,或通過接收機內(nèi)部的誤碼統(tǒng)計功能進行誤碼和壓力靈敏度等測試。下圖是400G-DR4光模塊的光壓力眼圖測試框圖,以及各部分對應的測試儀表。
3.2.2 電接收機測試方法
IEEE 802.3bs規(guī)范中對于光模塊的電輸入口的壓力容限測試方法描述如下:通過參考電發(fā)射機(通常是碼型發(fā)生器)以及抖動注入源、碼間干擾源和串擾源,將壓力電信號輸入MCB夾具。之后將參考接收機(通常是示波器)通過HCB夾具與MCB夾具連接在一起,對壓力電信號進行校準。
參考接收機包含符合規(guī)范要求的理想4階貝塞爾-湯姆遜濾波器,規(guī)范要求的CTLE均衡器以及時鐘恢復功能。PAM4電壓力信號由眼圖對稱模板寬度ESMW,眼寬EW,眼高EH和附加正弦抖動SJ的頻率和幅度來表征。經(jīng)過校準的電壓力信號接入被測模塊電輸入口被測通道,并由模塊內(nèi)的FEC誤碼檢測功能進行誤碼與接收容限測試,或將信號環(huán)回輸出至外部的誤碼分析儀進行分析。
下圖是測試中用到的實際測試儀器。
3.3 系統(tǒng)測試
系統(tǒng)測試的主要目的是驗證被測光模塊配合交換機工作時,在真實的業(yè)務流量情況下的誤碼率以及錯誤容忍能力。400G的光模塊普遍采用了PAM4(4電平調制)技術,雖然減少了高速信號傳輸需要的帶寬,但由于信噪比的惡化,使得其原始誤碼率很難達到傳統(tǒng)2電平調制時1e-12的水平,所以其原始誤碼率的要求比較低,比如IEEE 802.3bs中對于光口誤碼率的要求僅僅為2.4e-4。
很多通信過程在這么高的誤碼率情況下是無法正常工作的,所以FEC(前向糾錯)技術被普遍采用。FEC是通過在數(shù)據(jù)塊里插入一些冗余的校驗bit,可以對隨機產(chǎn)生的錯誤bit進行修正,從而保證最終數(shù)據(jù)包的丟包率在可以接受的范圍之內(nèi)( <6.2e-11)。
因此,系統(tǒng)測試中需要對光模塊的原始誤碼率以及經(jīng)過FEC修正后的丟包率都進行測試,并驗證在出現(xiàn)已定隨機錯誤符號或者頻率偏差時系統(tǒng)性能是否受到影響。典型的系統(tǒng)測試環(huán)境如下:
其測試方法如下:在數(shù)據(jù)流量測試儀上發(fā)送64字節(jié)長度連續(xù)數(shù)據(jù)幀,F(xiàn)EC修正前的BER值應小于2.4e-4;在流量測試儀上運行以太網(wǎng)流量測試軟件,并發(fā)送64字節(jié)長度、100%線速率的數(shù)據(jù)幀,累積至少1e+12個數(shù)據(jù)幀后,讀取端口的Frame Loss Ratio值應小于6.2e-11;在流量測試儀上進行FEC后單個或多個(<15個)的誤碼注入,并驗證經(jīng)FEC后的誤包率滿足802.3bs的規(guī)范要求;在流量測試儀上對速率進行100ppm的調整,并驗證誤碼率和誤包率滿足802.3bs的規(guī)范要求。
下圖是進行FEC修正前的誤碼率及FEC修正后的丟包率測試的例子。
四、測試儀器
4.1 高性能采樣示波器(光/電眼圖儀)及時鐘恢復
高速采樣示波器主要用于光發(fā)射機的光眼圖測試、光模塊以及AOC的電眼圖測試等,也可以用于未來電接收機以及光接收機容限測試中的信號校準。眼圖儀的測試需要和信號同步的工作時鐘,當被測件無法提供同步參考時鐘時,需要光/電時鐘恢復模塊從被測件恢復時鐘才能進行測試。
Keysight N1000A系列是在原86100D基礎之上再續(xù)經(jīng)典的采樣示波器系列,它可向下兼容原有86100D平臺上的模塊,與高帶寬并內(nèi)置CDR, PTB功能的N1060A模塊組合使用是研發(fā)階段的調試利器。N1092系列光/電采樣示波器和N1077A/N1078A光/電時鐘恢復模塊是市面上集成度最高、功能最靈活的高速光/電眼圖測試儀器。其主要指標及特性如下:
單模/多模光口測試:工作波長范圍830 至 1600 nm
光通道速率:支持25G/28Gbps NRZ、53G/56Gbps PAM4、106G/112Gbps PAM4光信號測試
靈敏度:-11dbm @850nm;-12.5dbm@1310nm
差分電口測試:集成差分50GHz帶寬電口,支持32Gbps NRZ和64Gbps PAM4的電眼圖測試
固有抖動:≤200fs rms
時鐘恢復:支持32Gbps NRZ和64Gbps PAM4的光/電時鐘恢復
多通道擴展:通過電腦USB口控制,可連接多個模塊;測試軟件支持最多8個測量模塊、共32個光或電通道的并行眼圖測試。
軟件功能強大:支持100GE 802.3 發(fā)射機各種參數(shù)的測試,包括抖動TJ, DJ, RJ, PJ, DDJ, ISI, BUJ, J1~J9, UJ, F/2, TI, DI, RI, OMA, Q值及 RIN, RIN&OMA 等測試,還包括802.3bm標準中對多模信號的TDEC測試,以及400G PAM4 信號波形參數(shù)的測試以及TDECQ測試等。
和Keysight 誤碼儀以及其他光學儀表配合,可以測試100G或400G光接收機的壓力容限,是業(yè)界唯一可以提供所有壓力容限測試方案的廠家,保證了未來測試系統(tǒng)的平滑升級。
4.2 高速PAM4誤碼儀
高速誤碼儀主要用于光發(fā)射機(光眼圖)測試中產(chǎn)生高質量的電信號激勵以及誤碼率測試,也可以用于電接收機以及光接收機容限測試中產(chǎn)生帶抖動和壓力的電信號驗證接收容限。如果僅僅進行光眼圖或電眼圖測試,可以用經(jīng)過驗證的高質量的流量測試儀產(chǎn)生電信號激勵。
Keysight M8040A誤碼儀是市面上性能最高、最靈活、連接最簡單的NRZ及PAM4誤碼儀,其主要特性和指標如下:
高速電信號產(chǎn)生:單機箱內(nèi)可以產(chǎn)生1~2路32Gbps的NRZ信號產(chǎn)生,可以升級64Gbps的PAM4信號或128Gbps的PAM4信號功能用于400G模塊測試。
高速電信號誤碼檢測:單機箱內(nèi)可以支持1~2路32Gbps的NRZ信號誤碼率檢測,可以升級64Gbps的PAM4信號或128Gbps的PAM4誤碼率檢測功能用于400G模塊測試。
光壓力眼測試:可以升級100G、400G光模塊的光壓力眼測試及自動校準功能。
預加重:可選內(nèi)置4階NRZ/PAM4信號預加重。
抖動注入:可選內(nèi)置NRZ/PAM4信號的PJ、RJ、BUJ等抖動注入
線性度調整:對PAM4信號3個眼高可獨立調整。
接收機均衡:內(nèi)置可調CTLE均衡器,用于優(yōu)化誤碼接收。
自動抖動容限測試:可根據(jù)事先設定參數(shù)自動調整注入到信號上的抖動頻率和大小,并根據(jù)誤碼率變化自動掃描出抖動容限曲線。
PRBS碼類型:2n-1, n=7, 10, 11, 13, 15, 23, 31等。
自定義碼型長度(每通道):2Gbit(NRZ)或1G 符號(PAM4) 。
4.3 數(shù)據(jù)流量測試儀
Keysight公司的數(shù)據(jù)測試儀表通過測試儀機框插入測試業(yè)務板卡的方式完成組裝,并根據(jù)插入的不同測試業(yè)務板卡提供不同的測試能力。
Novus測試業(yè)務板卡提供QSFP28接口,K400測試業(yè)務卡提供QSFP_DD測試接口。
QSFP28測試業(yè)務板卡支持根據(jù)IEEE協(xié)議,提供扇出(即FAN-OUT) 能力,每個QSFP28接口支持扇出成4個25GE速率SFP28接口,相關協(xié)議標準為IEEE 802.3 100GBASE-R、IEEE P802.3bj、IEEE P802.3bm、IEEE P802.3by。
K400測試業(yè)務板卡支持400G、200G、100G PAM4速率轉換。基于QSFP_DD支持前向糾錯(FEC)端口統(tǒng)計,具體的包括: Total Bit Errors, Max Symbol Errors, Corrected Codewords, Total Codewords, Uncorrectable Codewords, Frame Loss Ratio, Pre-FEC Bit Error Rate, and Codeword error distribution analysis;協(xié)議以為KP4 RS-544。
支持對400G前向糾錯(FEC)注入差錯。
支持L1 BERT測試。
五、總結
綜上可見,數(shù)據(jù)中心的光互聯(lián)網(wǎng)絡正面臨從100G到400G的過渡,針對不同應用場景的技術也在彼此競爭。400G光模塊作為未來數(shù)據(jù)中心內(nèi)部光網(wǎng)絡互聯(lián)的關鍵硬件設備,也面臨速率、功耗、體積、成本等方面的挑戰(zhàn)。同時,PAM4、FEC技術的廣泛采用也使得400G光模塊的測試和評估方法與傳統(tǒng)的100G光模塊有比較大的區(qū)別。為了保證其在有限成本和功耗下的性能,需要對其光口、電口的輸出質量、接收容限,以及承載真實業(yè)務數(shù)據(jù)下的誤碼率等表現(xiàn)進行詳細的測試,以保證設備間良好的互聯(lián)互通及可靠數(shù)據(jù)傳輸。
關于是德科技
我們致力于幫助企業(yè)、服務提供商和政府客戶加速創(chuàng)新,創(chuàng)造一個安全互聯(lián)的世界。自 1939 年惠普公司成立,到 2014 年 11 月 1 日是德科技作為一家新電子測試測量公司獨立運營,我們繼續(xù)秉承不變的企業(yè)家精神和激情開啟新航程,鼓舞全球創(chuàng)新者,幫助他們實現(xiàn)超乎想象的目標。我們的解決方案旨在幫助客戶在 5G、汽車、物聯(lián)網(wǎng)、網(wǎng)絡安全等領域不斷創(chuàng)新。