ICC訊 近年來(lái),人工智能大模型的迅猛發(fā)展催生對(duì)綠色智能計(jì)算的巨大需求。硅基光電子技術(shù),憑借其高能耗效率、低延遲、大帶寬、高并行度及與CMOS兼容等多重優(yōu)勢(shì),已經(jīng)成為智能計(jì)算硬件領(lǐng)域極具發(fā)展?jié)摿Φ慕鉀Q方案。近日,國(guó)家信息光電子創(chuàng)新中心肖希博士團(tuán)隊(duì),聯(lián)合光通信技術(shù)和網(wǎng)絡(luò)全國(guó)重點(diǎn)實(shí)驗(yàn)室、鵬城實(shí)驗(yàn)室,提出一種基于相干光學(xué)頻率梳與硅光集成鏈路的新型類(lèi)腦計(jì)算架構(gòu)。該架構(gòu)具有高集成性與可擴(kuò)展,采用自主研發(fā)的集成相干收發(fā)芯片ICTROSA(Integrated Coherent Transmit-Receive Optical Sub-Assemblies),并完成概念驗(yàn)證。實(shí)驗(yàn)結(jié)果顯示,單個(gè)計(jì)算單元的卷積計(jì)算算力超過(guò)1TOPS(Tera Operations Per Second),且實(shí)現(xiàn)了全連接神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò),其推理精度與電子數(shù)字計(jì)算硬件相當(dāng)。該工作為硅基光電計(jì)算邁向超POPS(Peta Operations Per Second)級(jí)別算力、以及支撐更加復(fù)雜的超算和智算應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。
硅光類(lèi)腦計(jì)算加速器架構(gòu)
圖1:硅光類(lèi)腦計(jì)算加速器架構(gòu)概念圖. (a) 硅光集成. (b)硅光類(lèi)腦計(jì)算加速陣列. (c) 硅光類(lèi)腦計(jì)算單元.
圖源:Optica
該硅光類(lèi)腦計(jì)算加速器的核心理念來(lái)自于卷積定理,即在頻域的卷積操作等同于時(shí)域的點(diǎn)乘運(yùn)算。因此,可利用相干接收結(jié)構(gòu)對(duì)信號(hào)實(shí)施點(diǎn)乘操作,從而完成對(duì)輸入信號(hào)頻域上的數(shù)值卷積(圖1)。硅基光電子器件因其具備大帶寬和低能耗等特性,能夠有效地在頻域上加載并處理大量的數(shù)據(jù),因此該架構(gòu)可獲得極大的卷積算力。數(shù)據(jù)的加載環(huán)節(jié)在電域上進(jìn)行,可根據(jù)實(shí)際所需的計(jì)算數(shù)據(jù)規(guī)模、處理速率及精度要求,靈活配置系統(tǒng)的工作頻率,以實(shí)現(xiàn)最優(yōu)性能。此外,值得注意的是,該架構(gòu)的卷積算力隨計(jì)算單元數(shù)量的增長(zhǎng)而呈現(xiàn)平方級(jí)提升,展現(xiàn)出良好的可擴(kuò)展性。
硅光類(lèi)腦計(jì)算加速器實(shí)驗(yàn)系統(tǒng)和應(yīng)用
基于自主研發(fā)的集成相干收發(fā)芯片(圖2),搭建了硅光類(lèi)腦計(jì)算加速器的原型驗(yàn)證系統(tǒng)(圖3)。
圖2:硅光IC-TROSA. (a) 硅光IC-TROSA,內(nèi)部集成有硅光相干收發(fā)芯片,驅(qū)動(dòng)芯片,跨阻放大芯片. (b) 硅光收發(fā)芯片. (c) 硅光收發(fā)芯片結(jié)構(gòu). (d) Tx EO S21 頻率響應(yīng). (e) Rx OE S21 頻率響應(yīng).
圖源:Optica
圖3:實(shí)驗(yàn)系統(tǒng)圖
圖源:Optica
如圖2(d),(e)所示,該自研芯片具備超40GHz的工作帶寬,因此,即便在現(xiàn)有實(shí)驗(yàn)條件下,系統(tǒng)因信號(hào)串?dāng)_導(dǎo)致部分頻帶無(wú)法利用,整個(gè)系統(tǒng)仍可實(shí)現(xiàn)達(dá)1.024TOPS的卷積算力(圖4)。研究團(tuán)隊(duì)還在該系統(tǒng)上部署了全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)模型,并在對(duì)手寫(xiě)數(shù)字的識(shí)別任務(wù)中取得了96.67%的推理精度,這一性能與相同結(jié)構(gòu)網(wǎng)絡(luò)在電子數(shù)字計(jì)算硬件上的實(shí)現(xiàn)效果相當(dāng)。
圖4:不同長(zhǎng)度的隨機(jī)向量卷積結(jié)果,n代表被卷積向量長(zhǎng)度,橫坐標(biāo)為歸一后理論輸出結(jié)果,縱坐標(biāo)為歸一后的實(shí)驗(yàn)測(cè)試輸出結(jié)果,可以看到雖然隨著n的增加,輸出結(jié)果逐漸偏離了y=x,但是n=128,實(shí)驗(yàn)測(cè)試結(jié)果仍保持較好的準(zhǔn)確度,此時(shí)卷積算力為1.024TOPS。
圖源:Optica
此外,該工作對(duì)系統(tǒng)的能耗效率進(jìn)行了深入探討?;谧钚录夹g(shù),該架構(gòu)有望實(shí)現(xiàn)低于10pJ/MAC能耗效率。同時(shí),作者還討論了器件線(xiàn)性范圍、系統(tǒng)的功率預(yù)算,以及噪聲因素對(duì)計(jì)算精度的影響,并對(duì)硅光計(jì)算器件的設(shè)計(jì)和優(yōu)化提出了明確要求。
總結(jié)與展望
綜上所述,硅光類(lèi)腦計(jì)算加速器具備計(jì)算速度和能耗效率的雙重優(yōu)勢(shì),該工作也是對(duì)后摩爾時(shí)代光電子AI深度融合關(guān)鍵技術(shù)的一次積極探索。隨著硅基光電子技術(shù)日益成熟,有理由期待其在智算領(lǐng)域發(fā)揮更加重要的作用。
論文信息
Ying Zhu, Ming Luo, Xin Hua, Lu Xu, Ming Lei, Min Liu, Jia Liu, Ye Liu, Qiansheng Wang, Chao Yang, Daigao Chen, Lei Wang, and Xi Xiao, "Silicon photonic neuromorphic accelerator using integrated coherent transmit-receive optical sub-assemblies," Optica 11, 583-594 (2024)
https://doi.org/10.1364/OPTICA.514341
作者:朱盈 國(guó)家信息光電子創(chuàng)新中心