用戶名: 密碼: 驗(yàn)證碼:

RDMA時代到了

摘要:Mellanox公司作為RDMA技術(shù)和設(shè)備的主要提供商,RDMA技術(shù)正在成為以數(shù)據(jù)為中心的計算模型的關(guān)鍵,如何快速、安全的傳輸和處理數(shù)據(jù),直接關(guān)系到數(shù)據(jù)中心性能的好壞。

  ICCSZ訊 2019年8月, 網(wǎng)絡(luò)界的兩大盛會,ACM Sigcomm2019和APNet’19在北京相繼召開,來自世界各地的網(wǎng)絡(luò)界精英齊聚北京,共同分享他們在網(wǎng)絡(luò)研究中的成果和面臨的挑戰(zhàn)。兩個大會都從如何解決傳統(tǒng)TCP協(xié)議面臨的問題入手,提出了各種不同層面的解決方案,從4G/5G無線網(wǎng)絡(luò),到邊緣數(shù)據(jù)中心網(wǎng)絡(luò),到核心數(shù)據(jù)中心,再到跨數(shù)據(jù)中心的網(wǎng)絡(luò)等。

  在數(shù)據(jù)中心網(wǎng)絡(luò)的報告中,RDMA的大規(guī)模應(yīng)用和網(wǎng)絡(luò)擁塞控制成為了兩個大會上的熱門話題,多篇論文談到了這個問題和他們的解決方案。其中的兩片論文《HPCC: High Precision Congestion Control》和《Gentle Flow Control: Avoiding Deadlock In Lossless Networks》收到了格外的關(guān)注。

  《HPCC: High Precision Congestion Control》是由哈佛大學(xué)、阿里巴巴公司和劍橋大學(xué)聯(lián)合發(fā)表,該論文介紹了由于RDMA技術(shù)的性能優(yōu)勢,基于RDMA技術(shù)的網(wǎng)絡(luò)已經(jīng)在數(shù)據(jù)中心中得到大規(guī)模部署,但是隨著部署規(guī)模的越來越大,傳統(tǒng)的擁塞控制CC(Congestion Control)機(jī)制暴露出了其局限性,如收斂速度、穩(wěn)定性、配置復(fù)雜等。為了解決這個問題,本論文中介紹了HPCC(High Precision Congestion Control)技術(shù),利用交換機(jī)網(wǎng)絡(luò)遙測技術(shù)(INT)來獲得精確的鏈路負(fù)載信息,并通知到發(fā)送端,由發(fā)送端根據(jù)鏈路負(fù)載進(jìn)行流量調(diào)整;同時通過將Per-ACK的Reaction做成Per-RTT的Reaction,來確保高性能的傳輸下不會出現(xiàn)Over-React。從而實(shí)現(xiàn)了高速且高精度的擁塞控制- High Precision Congestion Control。這個實(shí)現(xiàn)對于RDMA技術(shù)的大規(guī)模應(yīng)用起到了很重要的作用,為廣大的RDMA用戶提供了新的思路和方向。隨著數(shù)據(jù)中心的規(guī)模增大,RDMA技術(shù)成為了保障數(shù)據(jù)中心性能的重要手段,傳統(tǒng)的TCP網(wǎng)絡(luò)中的很多技術(shù)已經(jīng)不能適應(yīng)高速RDMA網(wǎng)絡(luò)的需求,新技術(shù)的涌現(xiàn)推動力RDMA技術(shù)在大規(guī)模數(shù)據(jù)中心中應(yīng)用的成熟。

  清華大學(xué)代表在介紹其論文《Gentle Flow Control: Avoiding Deadlock In Lossless Networks》時強(qiáng)調(diào),無論是計算還是存儲,分布式系統(tǒng)已經(jīng)成為了提升性能的必經(jīng)之路,很多基于分布式系統(tǒng)的應(yīng)用都需要無損網(wǎng)絡(luò)的支持。傳統(tǒng)的無損網(wǎng)絡(luò)實(shí)現(xiàn)方案(如PFC等)有時會帶來網(wǎng)絡(luò)的死鎖,目前面向解決網(wǎng)絡(luò)死鎖的方案增加了網(wǎng)絡(luò)配置的復(fù)雜度,同時也影響到了網(wǎng)絡(luò)的性能。針對這個問題,清華大學(xué)提出了溫和流量控制(GFC)的方式來控制端口速率,使所有端口都能保持?jǐn)?shù)據(jù)包的流動,即使存在循環(huán)緩存區(qū)的依賴關(guān)系,也可以避免網(wǎng)絡(luò)的死鎖。清華大學(xué)還用實(shí)驗(yàn)和仿真驗(yàn)證了GFC的實(shí)現(xiàn)和對網(wǎng)絡(luò)帶寬的影響(小于0.5%)。這篇文章提供了另一種實(shí)現(xiàn)大規(guī)模RDMA應(yīng)用的思路,值得數(shù)據(jù)中心用戶去借鑒。

  Mellanox公司作為RDMA技術(shù)和設(shè)備的主要提供商,RDMA技術(shù)正在成為以數(shù)據(jù)為中心的計算模型的關(guān)鍵,如何快速、安全的傳輸和處理數(shù)據(jù),直接關(guān)系到數(shù)據(jù)中心性能的好壞。在Sigcomm和APNet這兩個大會中,關(guān)于對RDMA、無損網(wǎng)絡(luò)、擁塞控制等的探索和研究,為RDMA技術(shù)的大規(guī)模應(yīng)用起到了積極的推動作用,證明了RDMA大規(guī)模應(yīng)用的可行性。Mellanox的網(wǎng)絡(luò)計算(In-Network Computing)技術(shù),除了RDMA以外,更是添加了SHARP(Scalable Hierarchical Aggregation and Reduction Protocol, 在交換機(jī)中做通信計算) 技術(shù), SHIELD(Self Healing Technology,網(wǎng)絡(luò)自愈) 技術(shù), AR(Adaptive Routing,動態(tài)路由) 等新的技術(shù)來面對傳統(tǒng)以CPU為核心的數(shù)據(jù)中心面臨的通信和計算的瓶頸問題,通過新的網(wǎng)絡(luò)計算技術(shù),將網(wǎng)絡(luò)變成了IPU(I/O Process Unit),將計算工作分散到了數(shù)據(jù)中心的各個單元,計算將會發(fā)生在最合適的地方,而不是必須要發(fā)送到CPU再做計算,實(shí)現(xiàn)了真正的以數(shù)據(jù)為中心。 In-CPU Computing,In-Network Computing和In-Storage Computing的有效整合,將會是構(gòu)建未來高性能數(shù)據(jù)中心的關(guān)鍵。網(wǎng)絡(luò)作為CPU到CPU, CPU到存儲以及存儲到存儲之間通信的必經(jīng)之路,已經(jīng)成為了數(shù)據(jù)中心性能的最大挑戰(zhàn)。新的挑戰(zhàn)需要新的技術(shù)來解決,增加蠟燭的數(shù)量不能發(fā)明電力;增加CPU的數(shù)量、網(wǎng)絡(luò)的帶寬和降低網(wǎng)絡(luò)的延遲不再能解決目前數(shù)據(jù)中心的挑戰(zhàn),我們需要新的創(chuàng)意、新的技術(shù)來構(gòu)建下一代的數(shù)據(jù)中心。

  Mellanox 公司的英文全稱是 Mellanox Technologies(中文名:邁絡(luò)思),是一家在全球范圍內(nèi)為服務(wù)器和存儲提供端到端InfiniBand和以太網(wǎng)智能互連解決方案及服務(wù)的領(lǐng)軍企業(yè)。Mellanox互連解決方案憑借其低延遲、高帶寬、網(wǎng)絡(luò)計算等優(yōu)勢, 可在應(yīng)用之間快速地傳遞數(shù)據(jù),提升系統(tǒng)性能和提高數(shù)據(jù)安全性,極大地提升了數(shù)據(jù)中心效率。Mellanox的端到端高速互連產(chǎn)品包括: 網(wǎng)卡、交換機(jī)、線纜、光模塊、軟件和芯片等,用以加速應(yīng)用的性能、優(yōu)化業(yè)務(wù)的投資回報率,覆蓋云服務(wù)、超大規(guī)模數(shù)據(jù)中心、高性能計算、人工智能、企業(yè)級數(shù)據(jù)中心、網(wǎng)絡(luò)安全、存儲以及金融服務(wù)等各個行業(yè)。更多信息請關(guān)注:www.mellanox.com。

內(nèi)容來自:Mellanox
本文地址:http://m.huaquanjd.cn//Site/CN/News/2019/10/14/20191014090810668286.htm 轉(zhuǎn)載請保留文章出處
關(guān)鍵字: 數(shù)據(jù)中心
文章標(biāo)題:RDMA時代到了
【加入收藏夾】  【推薦給好友】 
免責(zé)聲明:凡本網(wǎng)注明“訊石光通訊咨詢網(wǎng)”的所有作品,版權(quán)均屬于光通訊咨詢網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。 已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
※我們誠邀媒體同行合作! 聯(lián)系方式:訊石光通訊咨詢網(wǎng)新聞中心 電話:0755-82960080-168   Right