當地時間4月5日9點,北京時間4月6日凌晨, GPU技術大會(GTC)在“硅谷之都”圣何塞拉開帷幕。 作為全球最大的圖形處理器(GPU)企業,英偉達(NVIDIA)聯合創始人兼CEO黃仁勛發表了長達2個小時的關于未來計算的演講。 要知道,作為上游GPU企業,英偉達的每一步戰略布局都將在全產業鏈產生四兩撥千斤的巨大影響。近年來,英偉達一直面臨PC市場整體疲軟的困境,而且與之相關的GPU游戲業務目前仍占公司總營收的八成。受PC市場拖累,英偉達自2012年起股價一直低迷于每股15美元左右。 但是,從去年開始它的股價卻發生奇跡般的反彈!GTC大會當日收盤于每股35.75美元,和2015年中期的20.90美元相比大漲了70%。 其實,英偉達收入結構并未發生實質性逆轉,不過一向注重預期的華爾街只為未來買單。那么,黃仁勛究竟向華爾街投資人講述了一個怎樣的全新故事? 業界從他剛剛2個小時的GTC演講中就可一覽無遺。在黃仁勛發布的SDK、VR、深度學習芯片、深度學習系統以及深度學習汽車五大戰略方向中,不難發現一半以上都與人工智能(AI)息息相關。 看來,這是黃仁勛在和人工智能玩對賭: 贏了,英偉達順利轉型,產品版圖開疆擴土,并繼續受到華爾街青睞; 輸了,英偉達數十億美元的研發投入將付之東流,企業恐怕也將因此陷入泥潭。 去年,微軟超級深度網絡,伯克利大學brett機器人,百度深度演講第二版,智能駕駛引得眾專家紛紛創業,一直到谷歌的AlphaGo戰勝圍棋九段李世石,在人工智能熱炒發酵的同時也為GPU推開了一道機遇之門。 黃仁勛就直言:“Deep Learning is a big deal.” 的確,由于GPU強大的并行計算能力,它如今已經成為人工智能中深度學習的熱門處理器。 GTC大會首日,黃仁勛就發布了性能英偉達迄今性能最強的超大規模數據中心加速器 NVIDIA Tesla P100 GPU。它采用了五項全新的突破性技術: 全新 Pascal 架構,相比前一代Maxwell架構,神經網絡訓練方案性能提升 12 倍。 NVLink高速GPU互聯技術,帶寬實現 5 倍加速。 全球最大FinFET 芯片,16nm 工藝,153 億個晶體管,獲得更快性能和更佳能效。 Pascal 架構將處理器和數據封裝,顯存帶寬高達720GB/s,3倍于Maxwell架構。 全新人工智能算法,半精度指令為深度學習提供了超過 21 Teraflops 的峰值性能。 黃仁勛認為,傳統計算是“專家+時間”,新型計算是“算法+數據+HPC”。為此,英偉達今天還發布了全球首款深度學習超級計算機NVIDIA DGX-1,它正是基于全新的Tesla P100 GPU 打造,并集成了硬件、深度學習軟件以及開發工具。 為了卡位人工智能,這個處理器企業因此跳到了前臺,做起了HPC細分市場的生意,這一模式上的突破令筆者感到驚訝。 據悉,DGX-1的吞吐量相當于 250 臺 CPU 服務器。而相比一年前問世的NVIDIA Maxwell架構四路解決方案也快了12倍,這意味著深度學習中同樣的學習任務以前需要25小時,現在僅僅需要2個小時。 當然,這款人工智能專門領域的HPC也價格不菲,建議售價高達12.9萬美元。不過,黃仁勛算了一筆賬:“同樣計算能力的CPU服務器需要250臺,以每臺1萬美元計算就要250萬美元,服務器之間連接的網絡設備還需要追加50萬美元。” 12.9萬美元vs.300萬美元,單單從價格的數量級來看,這也無疑是一種創新方案。 據悉,DGX-1將于今年6月正式推向市場,而同樣搭載了Tesla P100 GPU的IBM、惠普、戴爾的深度學習服務器預計在2017年第一季度問世。 除了GPU之外,芯片業的另一熱門當屬FPGA,英特爾還在去年耗資167億美元收購FPGA企業Altera。兩種不同領域的技術因為人工智能的出現出現了交集的可能,那么專注GPU的英偉達怎么看呢? 黃仁勛一手拿著Tesla M40,一手拿著Tesla M4,回應說:“沒有理由使用FPGA或者專用芯片。我們的GPU不僅高效節能,而且是通用架構,可以進行轉碼、圖像處理、深度學習。這兩款產品已經成為我們增長最快的業務,被全球的互聯網企業所采用。” 前者提供后臺的計算性能,專為訓練深度學習神經網絡設計,后者則定位為低功耗小巧型加速器,用于機器學習前端圖像與視頻的采集處理和傳輸。 據悉,谷歌和國內的百度、阿里和京東等互聯網企業都在應用Tesla M系列GPU。 如果說此次英偉達通過發布全球首款深度學習超級計算機NVIDIA GTX-1,而從處理器后臺跳到了前臺,那么從2007年發布并行架構軟件平臺CUDA開始,黃仁勛就不再認為英偉達是家純粹的GPU企業了。在今天的GPU大會上,黃仁勛一開場也是這樣強調:“我們是一家軟件公司”。 在戰略新品發布環節當中,其實,軟件部分是黃仁勛今天最先發布的——NVIDIA SDK系列更新。 這些更新包括NVIDIA CUDA 8。英偉達并行計算平臺的最新版本可以讓開發者直接使用Pascal架構一系列的全新特性,包括統一內存和 NVLink。該版本還包括全新的圖表分析庫 nvGRAPH,后者可用于機器人路徑規劃、網絡安全和物流分析,將 GPU 加速的應用擴展到大數據分析領域。 英偉達還發布了cuDNN v5,一個 GPU 加速的深度神經網絡基元庫,可提供Pascal GPU支持、循環神經網絡和用于醫療、油氣和其他行業的增強特性。 據悉,cuDNN的深度學習框架,包括谷歌的TensorFlow、加州大學伯克利分校的Caffe、蒙特利爾大學的Theano和紐約大學的Torch,這些又驅動亞馬遜、臉譜和谷歌等所用的深度學習解決方案的運行。 也正因為有了來自于CUDA的軟件基礎,今天奪人眼球的全球首款深度學習HPC才得以從GPU躍升為可以直接使用的產品。因為作為系統,它必須包括全面的深度學習軟件套件,比如NVIDIA深度學習GPU訓練系統 (DIGITS)以及cuDNN v5等,使得研究人員和數據科學家能夠快速便捷地訓練深度神經網絡。 GTC大會上,全球首款深度學習HPC,全新Pascal架構GPU,成熟的深度學習框架,這些人工智能領域的創新是否能讓轉型期的英偉達持續獲得華爾街的信任? 畢竟,轉型就是一場有關自身未來的對賭游戲,而黃仁勛為英偉達選擇了與人工智能對賭。 翔snowman 原創出品 公眾號轉載需注明來源 科技茱比莉 有視角的科技觀察 有態度的科技評論
|
|