ICCSZ訊 “更高帶寬,更高性能”,一直以來都是網(wǎng)絡(luò)領(lǐng)域的不懈追求。如今,隨著云計(jì)算、大數(shù)據(jù)、移動化等新一代IT技術(shù)的應(yīng)用帶來了數(shù)據(jù)量的海量增長,以及用戶對體驗(yàn)的關(guān)注,這一目標(biāo)顯得更為緊迫和現(xiàn)實(shí)。比如,NVIDIA(英偉達(dá))最新推出的深度學(xué)習(xí)一體機(jī)對網(wǎng)絡(luò)帶寬和性能的要求已經(jīng)達(dá)到了新的高度,標(biāo)配就有4片100G的網(wǎng)卡。
其實(shí),網(wǎng)絡(luò)領(lǐng)域也一直在不斷創(chuàng)新,努力提升網(wǎng)絡(luò)產(chǎn)品的性能和帶寬,“卸載”(即將傳統(tǒng)由CPU處理的部分工作轉(zhuǎn)移到網(wǎng)絡(luò)設(shè)備進(jìn)行)就是其中的技術(shù)之一。Mellanox就是這一技術(shù)的主要倡導(dǎo)者和實(shí)踐者,正是基于這一創(chuàng)新技術(shù),Mellanox不斷推出新一代更高性能的網(wǎng)絡(luò)產(chǎn)品。日前Mellanox全球市場部副總裁 Gilad Shainer在接受記者采訪時表示,明年Mellanox將推出200Gb/s的InfiniBand和以太網(wǎng)交換機(jī),這也是業(yè)界首次推出如此高速的網(wǎng)絡(luò)設(shè)備。此舉無疑會又一次推動網(wǎng)絡(luò)傳輸能力的升級。
Mellanox全球市場部副總裁 Gilad Shainer
加速網(wǎng)絡(luò)互連
提到Mellanox,在HPC領(lǐng)域幾乎無人不知。Mellanox成名于HPC,從其2001年推出一代InfiniBand產(chǎn)品以來,一直是InfiniBand市場的領(lǐng)導(dǎo)者。在最近一期的全球超級計(jì)算機(jī)500強(qiáng)(TOP500)榜單上,前500套HPC中有39%(194套系統(tǒng))采用了Mellanox的InfiniBand產(chǎn)品。如果以其中真正用于超級計(jì)算的設(shè)備來計(jì)算,占比會更高,達(dá)到65%。
“在HPC市場InfiniBand占有絕對的優(yōu)勢。在排名最靠前的這些系統(tǒng),比如千萬億次的系統(tǒng)中,我們占據(jù)了近一半的市場份額,這充分了Mellanox在高性能計(jì)算系統(tǒng)里面的實(shí)力。”Gilad Shainer說。
Gilad Shainer介紹說有可能問鼎2018年TOP500第一的美國“Coral珊瑚”系統(tǒng)也會采用Mellanox InfiniBand。
當(dāng)然,InfiniBand并不是Mellanox發(fā)力的唯一領(lǐng)域。除了InfiniBand之外,在以太網(wǎng)領(lǐng)域,Mellanox同樣成績斐然,尤其是在高性能計(jì)算方面。比如,在全球HPC TOP500的榜單中,所有4萬兆以太網(wǎng)系統(tǒng)采用的都是Mellanox的產(chǎn)品。同時,全世界第一套100G以太網(wǎng)的系統(tǒng)用得也是Mellanox的網(wǎng)絡(luò)產(chǎn)品。
值得一提的是,上文中提到的4萬兆以太網(wǎng)和100G以太網(wǎng)系統(tǒng)都出自中國,這一方面說明Mellanox在HPC領(lǐng)域的技術(shù)實(shí)力,同時也表明中國在HPC領(lǐng)域的領(lǐng)先態(tài)勢。
Gilad Shainer說,HPC領(lǐng)域是Mellanox的傳統(tǒng)領(lǐng)域,除了HPC之外,Mellanox還將其技術(shù)優(yōu)勢擴(kuò)展到其他領(lǐng)域,包括高速存儲、數(shù)據(jù)庫、人工智能等。其中,人工智能也被Mellanox鎖定為今后的重點(diǎn)領(lǐng)域。
“在這個領(lǐng)域里,需要對大量數(shù)據(jù)進(jìn)行分析和讀取,非常類似于高性能計(jì)算。另外,Mellanox還能夠通過機(jī)器學(xué)習(xí)和人工智能等快速地延伸到物聯(lián)網(wǎng)、自動駕駛、醫(yī)療、制造、零售等眾多行業(yè)。”他說。
從“以CPU為中心”到“以數(shù)據(jù)為中心”
Mellanox在高速網(wǎng)絡(luò)方面的成績得益于其獨(dú)特的技術(shù)理念和基于這些理念下的諸多獨(dú)特優(yōu)勢,“以數(shù)據(jù)為中心的網(wǎng)絡(luò)”就是其中之一, 而“卸載”則是為了落實(shí)這一理念而采用的技術(shù)。
在Mellanox看來,傳統(tǒng)數(shù)據(jù)中心的計(jì)算模式是以CPU為中心,即所有的數(shù)據(jù)都要移動到CPU以后才能進(jìn)行計(jì)算。在小數(shù)據(jù)量的時候,這一模式運(yùn)轉(zhuǎn)得很好,但當(dāng)數(shù)據(jù)量不斷增加以后會出現(xiàn)問題。比如,現(xiàn)在很多領(lǐng)域用到了分布式計(jì)算方式,其中CPU都要等待數(shù)據(jù)達(dá)到以后才計(jì)算,如果要移動的數(shù)據(jù)太多就會使整個應(yīng)用程序的性能出現(xiàn)瓶頸——因?yàn)镃PU要等數(shù)據(jù)到齊才能完成計(jì)算,有時還會出現(xiàn)互相等待的情況。
Mellanox認(rèn)為,未來的數(shù)據(jù)中心應(yīng)該是以數(shù)據(jù)為中心的,也就是數(shù)據(jù)在哪里,計(jì)算就應(yīng)該在哪里發(fā)生,從而避免CPU成為瓶頸。為了踐行這一理念,Mellanox設(shè)法讓網(wǎng)絡(luò)參與到計(jì)算過程中,也就是把一部分計(jì)算交由網(wǎng)絡(luò)設(shè)備來完成,網(wǎng)絡(luò)設(shè)備的角色不再只是數(shù)據(jù)的傳輸者,這就是Mellanox所說的“卸載”。
“以數(shù)據(jù)為中心的新一代架構(gòu)應(yīng)該是:數(shù)據(jù)在哪兒,數(shù)據(jù)分析就在哪兒。如果數(shù)據(jù)在CPU,我們就在CPU分析;如果數(shù)據(jù)在傳輸當(dāng)中,我們就應(yīng)該有能力在數(shù)據(jù)的傳輸路徑中完成這個數(shù)據(jù)分析。為了高效地分析數(shù)據(jù),我們就需要把計(jì)算能力向數(shù)據(jù)轉(zhuǎn)移,而不是把數(shù)據(jù)向計(jì)算去移動。”Gilad Shainer表示。
據(jù)Gilad Shainer介紹,在“以數(shù)據(jù)為核心”的數(shù)據(jù)中心中,數(shù)據(jù)在網(wǎng)絡(luò)中移動的同時就會完成一些操作,如數(shù)據(jù)的加減和數(shù)據(jù)的簡單分析。這樣,當(dāng)數(shù)據(jù)經(jīng)過網(wǎng)絡(luò)傳輸?shù)竭_(dá)CPU時,已經(jīng)是經(jīng)過清洗、處理的數(shù)據(jù)。這有很多好處:第一,它會提升系統(tǒng)的性能,因?yàn)閿?shù)據(jù)不會等到了CPU以后再分析;第二,它會降低數(shù)據(jù)傳輸?shù)臅r延,能把通訊延遲從現(xiàn)在的20-30多微秒下降到3-4微秒。
智能的網(wǎng)絡(luò)硬件
很顯然,以數(shù)據(jù)為中心的新一代數(shù)據(jù)中心中,因?yàn)榫W(wǎng)絡(luò)設(shè)備可以分擔(dān)部分CPU的壓力,同時也可以減輕網(wǎng)絡(luò)的傳輸壓力,是一個不錯的演進(jìn)方向,但這無疑對網(wǎng)絡(luò)設(shè)備提出了更好的要求,也就是網(wǎng)絡(luò)設(shè)備需要更加智能。用Mellanox的表述,就是需要具備“Offloading(卸載)”的網(wǎng)絡(luò)硬件才能完成數(shù)據(jù)中心的這一重要轉(zhuǎn)型。
“實(shí)際上,Mellanox一直致力于開發(fā)智能網(wǎng)絡(luò),讓網(wǎng)絡(luò)來協(xié)作處理數(shù)據(jù)。比如,我們發(fā)布的最新產(chǎn)品HDR InfiniBand 200Gb/s的網(wǎng)絡(luò)產(chǎn)品,包括全球第一款200Gb/s的交換機(jī)和全球第一個200Gb/s的網(wǎng)卡ConnectX-6,都是基于這一理念推出的新一代智能網(wǎng)絡(luò)產(chǎn)品。”Gilad Shainer說。
據(jù)悉,HDR InfiniBand交換機(jī)中的Quantum芯片具有非常強(qiáng)大和智能的處理能力,可以支持網(wǎng)絡(luò)內(nèi)的計(jì)算,Mellanox將這項(xiàng)技術(shù)稱為SHArP 2.0。
“通過這個技術(shù)能夠在我們的交換機(jī)里面完成數(shù)據(jù)分析、數(shù)據(jù)查詢,同時,還能支持聚合式的通訊、包括新的一些Tag Matching,這些功能對整個應(yīng)用程序性能提升非常關(guān)鍵,無論是傳統(tǒng)的高性能計(jì)算還是新興的深度學(xué)習(xí)、人工智能軟件都能適用。”Gilad Shainer表示。
Gilad Shainer強(qiáng)調(diào),除了傳統(tǒng)的高性能計(jì)算和深度學(xué)習(xí)能用到卸載,網(wǎng)絡(luò)設(shè)備還能完成很多其他功能的卸載,包括存儲、安全以及一些網(wǎng)絡(luò)協(xié)議的卸載,從而提升整體系統(tǒng)的性能。
正是為了更好地實(shí)現(xiàn)部分CPU功能的卸載,實(shí)踐“以數(shù)據(jù)為中心”的網(wǎng)絡(luò),Mellanox于2015以約8億美元的現(xiàn)金收購了以色列芯片公司EZchip半導(dǎo)體公司,并于2016年推出了一個名為BlueField的SoC芯片。
據(jù)介紹,BlueField集成了ARM的CPU和PCIe 4.0的內(nèi)置交換,是一個具有交換、網(wǎng)絡(luò)和CPU的SoC系統(tǒng)。根據(jù)Mellanox的說法,基于此SoC可以構(gòu)建很多專用系統(tǒng),比如存儲一體機(jī)、深度學(xué)習(xí)一體機(jī)、安全的一體機(jī)以及NFV的一體機(jī)。
“和傳統(tǒng)解決方案相比,這種方式可以達(dá)到更好的可擴(kuò)展性,同時成本更低。這也是我們在網(wǎng)絡(luò)領(lǐng)域里面一個新的探索,包括如何集成網(wǎng)絡(luò)加計(jì)算的能力,如何更好地去處理數(shù)據(jù)。”Gilad Shainer表示。
“這就是Mellanox,一方面我們擁有一個被業(yè)界證明了的非常穩(wěn)定、擁有最高性能的并持續(xù)不斷改進(jìn)的InfiniBand產(chǎn)品,同時,我們也在不斷探索致力于提供更高性能、更高效、更高可擴(kuò)展性、更智能的新一代的網(wǎng)絡(luò)產(chǎn)品。”Gilad Shainer總結(jié)說。