前言
11月19日第十一屆網絡平臺部技術峰會在深圳圓滿落幕。本次峰會圍繞硬件研發(fā)、硬件加速、網絡產品、網絡運營四大領域,深度全面地展示了網絡平臺部不斷精進的研發(fā)能力及探索成果。下面讓我們共同回顧本次峰會中由硬件研發(fā)專家——孫敏博士呈現的《光模塊:從自采到自研》的精彩內容。
光模塊及應用
光模塊首次站在技術大會的舞臺,回顧了光模塊產品從商用到自采,再到自研的發(fā)展歷程。著眼未來,我們從“芯”出發(fā),把握關鍵技術路徑,同時探索新型開發(fā)模式。
光模塊麻雀雖小,五臟俱全,可以說是一套完整的小系統。電信號輸入,經過dsp等芯片解析,然后進入驅動芯片,再去帶動光芯片進行調制,調制出來的光再進入到光無源系統進行耦合,最后耦合光進入光纖系統傳輸。
光模塊不是數據中心專屬的,而是電信網絡,特別是長距離傳送網絡最早開始使用的。但是隨著數據中心的發(fā)展,包括設備的帶寬的提升,光模塊開始進入到數據中心應用中。由于數據中心的發(fā)展速度遠超傳統電信行業(yè),所以數據中心對光模塊的需求增長也遠超傳統電信行業(yè)。
從商用到自采
對騰訊而言,早期的40G網絡實際上是一個封閉的系統,比如說我們買的實際上是傳統設備廠商的整個網絡系統,包括軟件,交換設備和光模塊等。商用系統成本高,出了問題不便于運維,這是商用轉自采的一個重要原因。
結合25G服務器的上線應用,25G/100G模塊開啟自采之路,挑戰(zhàn)是必然的,第一個挑戰(zhàn)其實就是設備之間的適配,光模塊單體測試雖然沒有問題,但是在自采灰度階段,我們遇到了很多設備兼容性的問題,我們發(fā)現不同廠商的模塊在不同設備上每個端口的表現不一樣,在不同設備上的表現也不一樣,而且為了保證大家都可以傳得通,必須得做一個完善的適配方案,形成一套復雜的測試系統,很多時候甚至要一對一針對端口參數進行優(yōu)化。
但是如果能把自采模塊管理的很精細,將會是一個非常有收益的事情。記得在15年到17年之間,我們現網出現大量的40G光模塊的故障替換,究其原因,其實是系統集成廠商的光模塊都是外購的,對光模塊了解較淺,并且對光模塊的質量問題如何攔截也基本依靠模塊廠商。如果結合自己的實際應用場景,把端到端的模塊技術方案進行管理,端到端的流程進行管控和優(yōu)化,同時把系統的質量管理方案做到位的話,完全可以避免上面出現的這些問題。通過2到3年對自采光模塊的不斷優(yōu)化和管控,我們發(fā)現不只是成本逐年有收益,而且質量問題得到系統改善,現網故障率不斷下降。
從自采到定制
自采光模塊的另一個優(yōu)勢是能夠滿足我們自己網絡的多樣化發(fā)展帶來的多樣化定制需求,比如業(yè)務部門提到10km分光監(jiān)控場景的需求,需要10km的模塊進行互連,因為現成收發(fā)一體模塊價格高昂,在需求推動下,我們借助現有的模塊平臺去做一些微小的改進,實現低成本方案。另一個例子是DCI提到了2km的分光的需求,整個項目很有收益,但是技術方案上很有挑戰(zhàn),需要結合我們的現網環(huán)境,對現有的模塊進行的深度的設計優(yōu)化,包括規(guī)格、模塊光學部分及芯片層面的一系列升級優(yōu)化。
從定制到自研
隨著100G服務器的批量上線,200G網絡進入量產應用,自研光模塊產品的誕生也契合了整個網絡從100G升級迭代到200G。光模塊行業(yè)一個很大特點,就是整個產業(yè)鏈類似于一個“陀螺式”或者“橄欖球形”,中間大,兩頭小,整個行業(yè)號稱可以做光模塊的公司不下于200家,但是處于產業(yè)鏈最上游的各類芯片廠家可能只有不超過10家,特別像DSP這樣技術門檻較高的芯片更是不超過5家,而最下游的應用方或者終端用戶的數量也遠少于光模塊廠商數量,呈現出來產業(yè)結構混亂,同時也引申出來一些問題,需求不明確,不具體,芯片價值不清晰。自研光模塊的第一個目標就是要打破這個生態(tài),即我們與芯片廠商直接討論規(guī)格需求和成本(用量)需求,從而去實現真正的端到端的成本的競爭力。模式上,我們稱之為多方JDM模式,就是我們直接向芯片廠商發(fā)出規(guī)格需求,以及一些定制化功能,芯片廠商根據我們的需求進行優(yōu)化或者重新開發(fā),同時模塊廠商結合芯片的設計,與騰訊聯合設計模塊方案,最后由模塊廠商負責生產制造。
進入自研階段,我們要考慮的最重要的問題就是方案的設計和選擇如何實現最大價值?!肮狻备半姟睆膫鬏攲傩陨嫌兄举|的差異,光有它自己的一些特殊屬性,比如不同溫度下的光功率特性,不同電流下的帶寬特性,還有不同條件下的波長特性。在光模塊開發(fā)過程中,往往會遇到,當想去用一些非常有潛力的電芯片方案的時候,你會發(fā)現它不太懂光芯片特性,或者考慮不是那么周全,這種問題如果流入到現網,就會發(fā)生類似100G網絡時代經常遇到的“鏈路抖動”。如果普通開發(fā)模式,為了滿足交付,難以繼續(xù)開發(fā),但在自研模式下,我們就可以結合系統規(guī)格持續(xù)去推動方案的不斷優(yōu)化,把電芯片做到更加懂光,從而發(fā)揮出更大的技術優(yōu)勢。
光模塊大家常常理解為標準品,因為定義好了外殼形態(tài),輸入輸出接口規(guī)格,但內部的光學封裝是一個特殊的東西,封裝方式五花八門,每一個廠商的設計都不一樣,涉及到的制造設備也是定制化的,如果我們要快速設計及制造一個自研模塊,我們就要面臨平臺選擇的問題。自研光模塊模式下,充分利用已經成熟的100G模塊的封裝平臺,同時針對性的做一些升級改造,是滿足質量穩(wěn)定性,開發(fā)效率以及低成本等訴求的最好解決方案。
對下一階段的探索
我們的網絡基本上是2到3年迭代一次,從交換芯片的路標來看,全面112G網絡將在2023年來臨。近期大家已經在討論下一代基于112Gbpsl的網絡開發(fā)的事情,包括網卡和交換設備。
在模塊層面,前面2年我們也陸陸續(xù)續(xù)做了一些技術摸底,從100G到400G&800G,模塊功耗肯定會持續(xù)提升,同時,BER就是我們說的誤碼率,也會面臨指數級的劣化。這些需要加大在芯片層面的設計和優(yōu)化工作,甚至包括參與芯片的設計。光學封裝方面也會面臨一系列的挑戰(zhàn),需要探尋各種新的提高光學集成度的方案,在傳輸方案上,我們也需要持續(xù)挖掘以滿足騰訊的網絡場景需求。
信號傳輸距離是互聯硬件的一個基本屬性,也是我們每次探討未來技術方案和發(fā)展趨勢的時候,必須要討論的關鍵約束條件。隨著基礎速率的不斷提升,我們的數據中心機房或者IDC在物理距離上基本不太會有大變化。因此,在做連接兩臺設備之間的模塊或者技術方案的選擇的時候,需要隨著傳輸技術的迭代而發(fā)生迭代的?!熬嚯x”的演進上有三個界面,從短距離接入側來看,是“光”進“銅”退,從IDC機房內部連接來看,是單模替代多模,從DCI連接來看,是相干技術的不斷下沉。以上這些方面,我們也陸續(xù)做了一些提前布局,包括在112Gbpsl網卡接入這一塊,我們正在布局基于112Gbpsl TAC技術以及相應的芯片合作開發(fā)。IDC機房內部的連接方面, MM SR模塊可能無法滿足我們數據中心機房 (Building Range)內部的連接,特別是跨房間的連接,這里,我們也在探索單模替代多模的方案,特別是在單模全集成芯片方案上也做了一些聯合開發(fā)的嘗試。IMDD和coherent的選擇和替代,我們預計可能會在1.6T或者單波400G這一代到來,所以未來我們會在Coherent-lite這個領域,特別是oDSP算法上做一些工作。
從“芯”出發(fā)
400G+上我們還會探索一些新的模式,其實有一些我們已經在布局,包括建立芯片實驗室及芯片級系統驗證平臺,以及牽引一些行業(yè)的標準等。
光模塊跟傳統電氣器件/設備的一個關鍵的區(qū)別,就是它不僅要有“電”的特性,還要有“光”的特性,所以它必須同時面對微電子的摩爾定律和光電子的摩爾定律。隨著光進銅退的趨勢,全球都在不斷整合核心的光電資源,以傳統電芯片領域的巨頭為首的廠商,他們也在往光電子這個領域不斷的去擴張,為未來的光電融合趨勢做準備。同樣,我們也需要做些什么,去迎接一個又一個挑戰(zhàn)。112Gbpsl可能是一個很長的過程,基于112G Serdes的400G+系統,正是我們需要在當下布局, 展望未來的最好契機!
新聞來源:鵝廠網事