過去一年,生成式人工智能和大模型在科研和商業化領域突飛猛進,作為賽道參與者,巨頭們不惜花重金打造先進的基礎設施,以應對一個由AI作為最佳生產力的未來世界。 據分析,2024年AI服務器產值將達到1,870億美元,占整體服務器比重高達65%;全年出貨量增長41.5%,市場份額大幅提升。 在移動設備一側,AI元年開啟了手機、PC等智能終端走向新的換代周期。但隨著高性能算力部署的增加,傳輸速率和功耗要求紛紛將痛點指向了冷卻設備。 算力離不開它,如同AI芯片、光模塊、交換機一樣。隨著技術層層迭代,散熱技術的產業生態一直在演進。 下一個“光模塊”的機會,或許將發生于此。 01 今年3月,英偉達推出的B100 GPU芯片宣布將采用液冷散熱技術,在A股市場掀起了一波不小的熱潮。那段時間,Wind液冷服務器指數從底部經歷一波反彈。 之所以反應熱烈,英偉達從B100開始,未來所有產品的散熱技術都將從風冷轉至液冷,這意味著AI服務器需求同樣將拉動液冷散熱需求,有望迎來一波爆發式增長。 而國內數據中心運營商從去年已經開始加快智算中心建設,落地完善國產AI生態,華為、浪潮信息、超聚三等廠商相繼推出液冷解決方案。整個國內市場規模去年增長了52.6%,2028年有望達到102億美元。 其實,與AI芯片、光模塊的迭代規律類似,未來的AI時代,基礎設施必然要滿足高速、高效、高度互聯的要求,硬件升級之路歷經從“用不起”到成為“剛需”,散熱也是從自然風冷、空調風扇,散熱片,繼而再到液冷。 為什么液冷散熱一定會成為“標配”呢? 其中好幾個外部條件目前已經具備。 眾所周知,當電子設備溫度過高時,工作性能會大幅度衰減。當芯片的工作溫度靠近70-80℃ 時,溫度每升高10℃,芯片的性能會降低約50%,有超過55%的電子設備失效形式都是溫度過高引起的。 未來,高性能算力的芯片功耗甚至將加速上升。根據《數據中心服務器功耗模型研究進展》,通用服務器內CPU、內存、存儲等器件功耗占比為32%、14%、5%。Intel2024年預期推出的Granit e Rapids CPU預期功耗預期更高。2024年英偉達推出的B200GPU,功耗達到1000W,已經突破了風冷的散熱極限。 降低能耗的關鍵就是要提高散熱效率。 PUE是評價數據中心能源效率的核心指標(數據中心總能耗/IT設備能耗),數值越接近1,表示數據中心能效越高。如果無法大量升級IT設備效率時,另一種途徑就是提高散熱系統的效率,簡單理解就是讓空調更省電。 我國數據中心的能耗水平還有待降低,根據《中國數據中心產業(寧夏)發展白皮書(2022年)》,2021年全國IDC平均PUE為1.49。在國內“雙碳”和“東數西算”雙重政策要求下,全國新建大型、超大型數據中心平均PUE降到1.3以下,集群內PUE要求東部≤1.25、西部≤1.2,先進示范工程≤1.15。 對比之下,全液冷的節能優勢非常明顯。據數智前線,要實現1000kW散熱,如果完全使用傳統風冷空調,需消耗約500kW電能;而全液冷散熱則僅需消耗約30kW電能。由此可知,全液冷相較風冷節能高達90%以上,液冷占比越高,則節能收益越明顯。 數據中心的生命周期成本里包括了前期投資以及日常的運營維護成本,其中最大的變動項目就是電費支出。當數據中心上架率提高時,電費支出這一項在日常運營成本中的占比便會大幅提升。 現在初期項目建設就要考慮降低PUE,又要在成本上增加一筆,而規模應用的前提條件是,升級溫控系統能讓后期電費支出節省下來,進而優化生命周期成本。 下游不同主體的運營商都在加速推進液冷技術的運用,比如三大電信運營商這樣規劃:2025年以后要開展規模應用,50%以上數據中心項目應用液冷技術。目前液冷帶來的技術便利,足以替代風冷成為主流技術應用。 所以,采用更加節能、效率較高的散熱技術,降低能耗水平是這輪數據中心投資建設的一大趨勢。 數據中心溫控系統的參與者大致分為兩類,一種原本是服務器廠商或者數據中心的直接建設方,但是有一定的液冷解決方案的能力,比如做液冷服務器的浪潮信息、曙光數創,以及IDC廠商潤澤科技和數據港; 另一種是專門打造溫控系統的技術提供商,其中所涉及的領域又有層次差別,一類是靠近服務器芯片內側,提供冷板組件、快速接頭等零部件的供應商,比如飛榮達、領益制造等; 另一類是在服務器、機柜側、甚至整個機房都能夠提供全鏈條液冷方案的技術供應商,像英維克、高瀾股份、以及和英偉達有深度合作的維諦技術。 從服務器廠商銷售量看,2023年國內市場占比前三廠商是浪潮信息、超聚變和寧暢,占據七成以上市場份額。根據機構測算,2025年當AI服務器出貨量超過140萬臺,且基本為液冷服務器時,市場規模將超過1600億,對應增長超過8倍! 02 隨著近期iOS 18.1 Beta版本上線,蘋果的Apple Intelligence也終于和大家見面,能夠體驗到蘋果AI的部分功能,包括煥然一新的Siri,背后由Open AI在內多個大模型提供性能支撐。 相比于數據中心,未來端側AI設備的散熱要求更加精細,跟著芯片一同迭代。 當智能設備集成度、工作速度提升,電子設備朝著小型化發展、元件密度增大、電源續航能力提高,電子設備系統功耗增加,單位體積產生的熱量持續上升。 消費電子產品的散熱方式一般分為兩種,筆記本、臺式電腦因為性能較高且內部空間大,需要主動散熱;而像手機、平板這種移動設備體積小,便攜性高,多采用被動散熱。 在智能手機的硬件升級過程中,散熱材料就經歷了三個階段的迭代。 第一個階段—石墨散熱膜。手機散熱部件最早可以追溯到2010年的iPhone 4,采用A4芯片的iPhone 4在玻璃背蓋、不銹鋼中板、L 型主板屏蔽罩上都粘貼了大塊石墨散熱膜,這也是第一次在智能手機上大面積使用。 石墨的橫向熱傳導能力極高,且具有輕、薄的特點,非常適合于均攤芯片工作時產生的局部熱量。2011年8月,經過小米初代手機的宣傳,石墨散熱膜就此成為手機散熱的主流導熱材料,直至2016年被熱管散熱所替代。 熱管散熱也叫“液冷散熱”,原理是利用金屬銅優秀的導熱性和銅管中液體的冷凝轉換導出手機中的熱量,突出優勢在于使用壽命長和布置靈活,顯著提升了散熱效果,得到了三星的青睞,從2016年的Galaxy 7開始,直到去年的Galaxy 23都在使用熱管散熱技術。 從4G進入5G時代,手機數據傳輸速率、射頻模組都有著巨大提升,無線充電、NFC等功能也逐漸成為標配,對手機散熱提出了新的要求,VC(均熱板)脫穎而出成為主流方案。 均熱板散熱原理與熱管相似,但區別在于傳導方式可以覆蓋更多熱源區域,實現整體散熱,并且VC 均熱板更加輕薄,更加符合目前手機輕薄化、空間利用最大化的發展趨勢。 Vivo和華為均熱板示意圖 目前除了以均熱板散熱為主,智能手機還使用散熱膜輔助。最流行的材料便是石墨烯,擁有比銅更好的導電性,以及超過鋼100的強度,能夠快速擴散熱量,很適用于現在的折疊屏手機,解決因為折疊展開導致的散熱不均。 據Market Watch統計,全球熱管市場規模在2022年達到了30億美元;全球均熱板市場規模大約為46億元人民幣。 在散熱材料上,國內中石科技做了16年,是通信/消費類電子主流導熱材料供應商,去年導熱材料實現營收11.7億元,占公司總營收93%。 根據資料,2021年中國導熱材料市場,國內廠商中領先的中石科技/飛榮達市占率達到了7.2%/7.1%,大部分份額被外資占據,有較大的提升空間。 能夠提供完整散熱產品的供應商包括領益智造。上半年業績和利潤雖然出現了大幅下滑,但新業務收入規模有所提升。公司正積極切入與AI有關的終端硬件制造,包括手機、服務器、機器人等領域,公司的散熱產品覆蓋了全產業鏈,去年下半年已經和客戶共同開發了環路VC等散熱產品,并且實現量產。 今年2月,公司還發了可轉債募集2.66億資金,用于碳纖維及散熱精密件研發生產。 值得一提的是,近期蘋果高層訪華,領益智造是他們考察的供應商之一。領益作為蘋果核心供應商之一,為蘋果提供幾千種模組件和零部件,涉及多款產品。 蘋果AI生態的擴張,領益在供應鏈中的地位或將得到提升。 對于在果鏈中規模、利潤分配更具優勢的企業而言,換機潮一旦爆發,在預期推動和利潤循環的正向循環之中,二十倍的估值可能遠非上限。 過去一年的AI浪潮里,英偉達、臺積電、工業富聯們都詮釋了這一點。 03 AI的星辰大海,實際上是靠能源、芯片共同堆疊的大基建工程。 先進算力有多耗電,用8000張H100訓練100天,需要消耗2600萬度電,這意味著三峽一天的發電量,或上海一天用電量的5%。 一萬張卡尤甚,科技巨頭或許并未滿足,要訓練出一個真正意義的AGI,門檻可能要跨越十萬張卡。但并行運算的GPU集群的管理難度實際上要更高,一張卡壞了之后,剩余卡的處理速度也會慢下來。 降低能耗,將成為本輪AI投資不可或缺的一個方向。 |
|