每年的12月,我們都會對過去的一年進行復盤,對照當年立下的Flag,分析這一年里的具體執行情況,總結經驗和教訓,繼而為來年立下新的目標。 當然,今年也不會例外。 如今,發展數字經濟已經成為把握新一輪科技革命和產業變革新機遇的戰略選擇。隨著互聯網時代向人工智能時代的演進,誰掌握了AI,誰就拿到了通向未來的金鑰匙。 在工業和信息時代,我國是不折不扣的追隨者;而在智能時代,得益于國家層面的戰略重視,以及一大批企業的傾力投入,我國實現了領導者的蛻變,AI實力已經位居全球第二。 無論對國家,還是企業來說,AI已經成為不折不扣的軟實力。不過呢,軟實力也需要硬實力來托舉。沒有強大的硬件平臺,再好的AI算法也發揮不出來。 “器”之不存,AI將焉附?這一次,我們來聊AI服務器。 日前,國際權威AI基準測試MLPerf公布了最新一期訓練(Training)榜單V1.1。作為全球影響力最廣的AI性能基準評測,本次測試吸引了谷歌、微軟云、英偉達、浪潮信息、百度、戴爾、聯想等14家頂尖的公司及科研機構參與。 說句題外話,MLPerf本是一套用于測量和提高機器學習軟硬件性能的通用基準,主要用來測量訓練和推理不同神經網絡所需要的時間,因此專業度極強,與普通人關系不大。 然而由于AI技術在各個行業的不斷滲透,很多人都開始留意MLPerf榜單的發布。至于那些AI產業領域的技術公司,就更是非常認可MLPerf的權威性。 本次MLPerf AI訓練性能基準評測,涵蓋了8類極具代表性的機器學習任務,分別為圖像分類(ResNet)、醫學影像分割(U-Net3D)、目標物體檢測(SSD)、目標物體檢測(Mask R-CNN)、語音識別(RNNT)、自然語言理解(BERT)、智能推薦(DLRM)以及強化學習(MiniGo)。 在這一次的評測中,浪潮信息提交了AI服務器所有8項單機測試的固定任務(Closed Division)成績。固定任務要求使用相同的模型和優化器,衡量訓練/推理過程在不同軟硬件上的性能,考察的主要是軟硬件系統優化的能力。 在既往的測試中,浪潮信息從來不會令人失望,總會拿出格外優秀的測試成績。令人想不到的,是在本次8項單機測試的固定任務中,浪潮信息居然能夠更進一步,斬獲其中的7項冠軍。 其中,AI服務器NF5688M6獲得醫學影像分割、目標物體檢測(Mask R-CNN)、自然語言理解、智能推薦4項冠軍;AI服務器NF5488A5獲得圖像分類、目標物體檢測(SSD)、語音識別3項冠軍。 令人吃驚的是,與半年前的MLPerf AI訓練榜單V1.0相比,本次浪潮AI服務器將醫學影像識別、語音識別、智能推薦和自然語言處理任務的單機AI訓練速度,分別提升了18%、14%、11%和8%。 毫無疑問,這一切與浪潮信息強大的技術實力,以及卓異的軟硬件系統優化能力密切相關。 與通用服務器不同,AI服務器通常會搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片的組合,為自然語言處理、計算機視覺、機器學習等AI應用場景提供強大的算力支持。 智能時代里,由于數據的爆炸性增長,傳統以CPU為算力核心的通用服務器,已經難以滿足企業的需求。經過多年的驗證,搭載GPU的AI服務器已經被認為是市場的發展方向。 隨著云計算、大數據需求的持續增長,市場對于AI服務器的需求不斷提高。據統計,2020年全球AI服務器市場規模為122億美元,預計到2025年將達到288億美元,年復合增長率達到18.8%。 作為全球服務器市場的領軍企業之一,浪潮信息在中國市場的份額已經連續多年位居第一。按照IDC最新的服務器市場季度報告,浪潮服務器在全球已經實現了坐二望一。 十多年前,摩爾定律的衰退已經是有目共睹。據此,浪潮認為異構加速將會成為計算產業的新方向,于是連同上下游企業,開始向AI服務器領域進軍。 雖然在起初幾年的回報并不盡如人意,但是浪潮信息仍是不斷加大在AI服務器方面的投入。 尤為重要的是,浪潮信息并不是簡單地以硬件疊加來提升產品性能,而是創造性地提出了智慧計算創新體系架構,以“硬件重構+軟件定義”的模式,為新的計算模式打開了成長的天花板。 2016年,AI大潮的興起,使得浪潮的研發成果迅速轉變成為市場競爭的絕對優勢,從而帶來了莫大的機遇。目前,在AI服務器市場,浪潮信息則是當仁不讓地占據了全球第一的寶座。 目前,浪潮已經成為國內諸多頂級互聯網公司最主要的AI服務器供應商。此外,在游戲、電商、金融、交通等行業,浪潮也不斷推動著產業AI化的發展。 在這種情況下,占領了技術制高點的浪潮AI服務器參加MLPerf基準測試并取得卓異的成績,那也就是水到渠成、順理成章了。 通常,MLCommons每年會組織2次MLPerf推理性能測試和2次MLPerf訓練性能測試。本次成績的公布,意味著MLPerf 2021年度4次性能測試正式收官。 在本年度的4次測試中,浪潮的三款明星產品——AI服務器NF5488A5、NF5688M6,以及邊緣服務器NE5260M5,總計斬獲了44項第一,浪潮信息也得以名列MLPerf 2021年度冠軍的榜首。 其中,在MLPerf數據中心AI推理場景的總32項任務中,浪潮AI服務器斬獲17項冠軍;在邊緣AI推理場景的總31項任務中斬獲16項冠軍,從云到邊全面領先;在單機AI訓練場景的16項任務中浪潮AI服務器共斬獲11項冠軍。 對于NF5488A5,大家應該不會陌生。作為全球首批上市的A100服務器,NF5488A5率先以領先的液冷和風冷散熱技術,支持8顆第三代NVLink互聯的A100 GPU,提供高達5 Peta FLOPS的AI計算性能和超高速帶寬,為各類AI應用場景提供強大的計算力支撐。 NF5688M6則是浪潮信息面向大規模數據中心優化設計的、具備極致擴展能力的AI服務器,能夠針對用戶需求進行靈活適配,為語音識別、圖像視頻、金融分析等典型AI應用場景提供高性能、高可靠的計算力支撐。 NE5260M5通過極致優化的信號和電源等系統設計,符合ODCC的OTII標準,針對邊緣數據中心極端的部署環境和所承載的業務應用,在不同層面采用了大量的優化技術,可承擔NFVI、視頻、AI、CDN等各類邊緣應用。 那句有名的“不服跑個分”,已經成為手機圈的流行梗之一。不過至少在當前,MLPerf仍是最流行的人工智能工作負載和場景,參評跑分已經成為AI服務器最重要的評價方式之一,這可以讓人們直觀地了解到產品的AI能力以及系統的優化水準。 需要強調的是,浪潮信息為客戶提供的并不只是硬件,而是全面的AI解決方案。通過在像MLPerf這樣的競技場上“搏殺”,以及在市場上突飛猛進,浪潮信息充分驗證了自身在AI計算領域的能力,并不斷推動這種能力向千行百業滲透。 以為這是個大結局?不,借用前些天上映的科幻大片《沙丘》(Part one)最后的結語:This is only the beginning. 浪潮信息在當前的表現只是個開始,未來我們還將見證更多的奇跡。 欲看更多文章 |
|