周末聽了a16z的podcast,啟發很大;里面有一句提到關于大模型的貨幣化,讓我印象很深: That (LLM model layer)is not the best layer to monetize it. In fact, there might not be any money in that layer. 大概意思就是,AI大模型層面上,變現的機會并不是很大;甚至在AI模型這個層面,毫無利潤可言。 順著里面提到的一些思路,聊聊 AI模型層的利潤 vs AI應用的邊際成本。 AI的模型層不是一個好的變現層 1/ AI模型是不是一個“通用商品”? 這個辯論不算新鮮;但是現在,deepseek把這個敘事推向了另外一個高度?;仡櫼恍╆P鍵的時間節點: 2003年 - Nicholas Carr的一篇“IT doesnt matter”;完美解釋了IT技術如何成為一項“通用商品”,最后變得“無關緊要”; 2022年 - chatGPT橫空出世;開始零星聽到有人把IT商品化的思考,拓展到了AI; 2023年5月 - Google的內部文件聲稱,AI并沒有護城河 2024年 - 各家巨頭的CEO都在公開場合討論AI commoditization;比如微軟,亞馬遜(尤其是在re:invent發布會上) 2025年1月 - Deepseek橫空出世;在更小更多的設備上部署AI成了可能;很多服務商已經開始競相提供最低價的R1解決方案(開始朝著“成本角度”去競爭); 2025年2月 - Open AI 開始聊開源; 2/ 如果你接受了AI模型最后會變成“通用商品”技術 (a generic commodity),而且沒有明顯的“差異化” / “網絡效應(network effects)”,那么你就很難去在這個基礎上建立一個擁有大量溢價 / 利潤的業務模式。在這個層面上,你基本上聊的只能是是“邊際成本”; 3/ 這個說法在我們現在這個時間點上,仍然還是有點反直覺的。巨頭們用地球上規模最龐大的資本,買了大量最先進的英偉達芯片,難道不就是為了創造出最為復雜的“AI明珠”嗎?怎么就成為“通用商品”了? 4/ 一項技術復雜精密,并不代表它不能成為“通用商品”。舉一個不是那么貼切的例子,個人電腦現在看起來司空見慣,但是其剛剛被發明出來的時候,卻仍然凝結了人類當時最先進的硬件和軟件,這并不代表它不能逐步迭代,而成為“通用商品”; 就算是現在最低端的智能手機,放在10年前,仍然稱得上非常的復雜,但是幾乎也只能按照“邊際成本”去銷售;(蘋果手機吃掉了智能手機大部分利潤,正是因為它把其做成了一個消費公司 / 'consumer discretionary',而非單純的科技公司;) 5/ 歷史也給過一些啟發。回顧互聯網的發展史,人們曾過度專注于從互聯網最底層的基礎設施(即HTML和HTTP)去實現盈利,但是歷史最終證明互聯網的商業價值不在于底層協議,而在于應用層(譬如我們現在熟悉電商 /廣告/流媒體); 如果HTTP的這個例子太過老套,大家也可以參考“5G時代”的投資體驗;當時一大堆基金經理沖進去中國移動等5G基礎設施標的,最后證明騰訊這類的應用公司,才最終掌握了行業的大部分利潤。 6/ 亞馬遜在去年12月 Re:Invent的時候,對AI模型商品化有過一些挺好的描述,在現在看來也仍然有很多啟示;大意就是,AI能力會變得非常非常重要,重要到其不再成為一種非常特殊的東西(鋼鐵是構建現代建筑必不可少的東西,但是鋼鐵也僅僅是一個commodity,誰便宜誰好用,就用誰的。) AI模型不再特殊,而是成為和數據庫,儲存等云計算時代的傳統參數一樣,成為構建AI應用需要調用到的計算處理之一。 7/ 回到AI大模型的護城河這里,Google的23年的內部文件其實已經“預言”了deepseek這類挑戰者的出現;我這里簡單摘錄一些; ![]() 我們一直在關注 OpenAI;誰將跨越下一個里程碑?下一步將是什么?但不舒服的真相是,我們并沒有準備好贏得這場軍備競賽,OpenAI 也沒有。在我們爭吵的時候,一個第三方(開源模型)正在悄悄地搶走我們的市場。 簡單來說,開源模型正在超越我們;僅舉幾例,人們在Pixel 6手機上上以每秒 5 個tokens運行基礎模型;人們也可以在一個晚上在大家的筆記本電腦上微調個性化的人工智能; 盡管我們的模型在質量上仍然略有優勢,但差距正在驚人地迅速縮小。開源模型更快、可定制性更強、隱私性更好,并且在能力上更具性價比。它們用 100 美元和 130 億參數完成的事情,我們在 1000 萬美元和 5400 億參數下卻難以做到。而且它們是在幾周內完成的,而不是幾個月。這對我們有深遠的影響; 我們沒有秘密武器。我們最好的希望是向谷歌外部的其他人學習并與他們合作。我們應該優先考慮支持第三方集成;人們不會為一個受限的模型付費,當免費的、無限制的替代品在質量上相當時。我們應該考慮我們的價值真正在哪里。 巨型模型正在拖慢我們的進度。從長遠來看,最好的模型是那些可以快速迭代。既然我們知道在<20B 參數范圍內可能實現的內容,我們應該將小變體視為重要內容,而不是事后考慮。 我們應該認真考慮每個新應用或想法是否真的需要一個全新的模型。如果我們確實有重大的架構改進,導致無法直接重用模型權重,那么我們應該投資于更激進的蒸餾形式,以便盡可能保留上一代的能力。 如果我們能夠更快地對小模型進行迭代,大模型在長期內并不會更具能力;LoRA 更新的生產成本非常低(約 $100),適用于最受歡迎的模型大小。這意味著幾乎任何有想法的人都可以生成并分發一個。訓練時間通常在一天以內。 在這種速度下,所有這些微調的累積效應很快就會克服起步時的規模劣勢。實際上,就工程師工作小時而言,這些模型的改進速度遠遠超過我們使用最大變體所能達到的效果,而最好的模型已經在很大程度上與 ChatGPT 區分不開。專注于維護地球上最大的一些模型實際上使我們處于劣勢。 直接與開源競爭是一項失敗的提議;現代互聯網之所以依賴開源,是有原因的。開源具有一些我們無法復制的重要優勢。 如果AI模型層不能變現,那么巨頭們為什么還花“冤枉錢”?我們姑且先接受AI大模型即將成為“通用商品”,并且很難貨幣化這個觀點;那么各家巨頭們為什么在deepseek之后,仍然繼續提升25年的capex投入呢? ![]() 1/ 花大錢,辦大事,是云計算大廠的思維慣性;現在主流的AI模型,多數是由云廠商去推動的(這里把Meta先放在一邊,回頭再聊);云計算時代,他們就是通過巨額的資本支出去獲得競爭優勢,所以在AI時代,這個思維慣性自然會保留下來;在巨頭眼里,資本支出 + 數據,是他們的戰略優勢;所以通過戰略優勢去scale up,順理成章。 2/ 其他硅谷的初創公司也都采取大云廠這類scale up的方法(包括Meta + xAI + anthropic),因為在同一個生態系統里面,大家都習慣在微觀上去做優化和改進,爭奪同類的資源(人才 + 算力 + 數據),反而忽視了一些宏觀層面的模型架構改變。中國模型生態,因為芯片的限制,反而出現deepseek這類型的突破。 3/ 這類型的思維慣性,在互聯網的早期階段,也出現過。引述 Marc Andreessen的一個說法, 在90年代的互聯網萌芽期,許多大型機構投資者(如銀行或主權基金)渴望布局互聯網,卻對如何投資軟件公司一籌莫展;最終這些機構做了什么?他們集體涌向了光纖基礎設施投資;如今我們正在目睹歷史重演:眾多銀行和大型投資者紛紛轉向數據中心建設,因為他們依然不擅長投資初創企業。這可能導致一個結果:正如當年的光纖過剩,我們或將面臨數據中心的過度建設潮。 4/ 云廠的大量投資,來自于思維慣性,也來自于FOMO(害怕錯過這場軍備競賽);這是個老話題了,我隨便貼兩張圖上來(Google和Meta關于FOMO的表述); ![]() ![]() 5/ 簡單用大白話來說,就是 大科技窮的只剩下錢,累計了十多年的資產負債表,需要找個辦法花出去(前幾年花錢慢也一直被分析師們詬病); 如果還沒有明確知道要投什么,那最簡單直白的就是直接投基礎設施;有基礎設施,也能籠絡對應的人才(譬如有一個KPI是,每工程師/GPU數量) FOMO,別人都在投,投了不一定贏,不投一定輸;“生態卡位”對于巨頭而言至關重要。 Capex對于主營業務也確實有提振作用(譬如云計算 vs 推薦算法) 探索未知的業務模式;如果真的等到真正的商業模式出來了再追趕,可能也會來不及。 6/ 具體到各家大廠, 亞馬遜 / 微軟 / 谷歌 都在爭奪云計算份額,不管自家模型能不能賺錢,云計算還是很賺錢;各家云廠在這次的業績會上都提到,如果不是因為capex的限制,云計算增速可以更快一些。 Meta雖然沒有自己的云計算業務,但是各個app的推薦算法,廣告也都需要巨大規模的計算量;就算模型用不上,推薦算法也都能兜底; Meta還對于在移動互聯網時代受限于蘋果耿耿于懷,所以其更加有動力去卡位生態,同時用開源追逐下一個計算平臺(包括VR)。 這里蘋果也有自己的“慣性思維”,那就是在移動互聯網時代,充當入口;只需要和AI模型贏家合作,也能夠有戰略角度。 用第一性原則推演蘋果的AI戰略 7/ 這里值得注意的是,光纖過量投資,導致公司破產,和現在的AI資本投資存在本質的差異;這次AI的主要投資者是幾大巨頭,每家都有非常穩健的主營業務提供幾乎無限量的資金,就算AI模型的變現永遠不會到來,它們也能安然無恙;盡管很多人喜歡將AI與互聯網泡沫相提并論,但是當時的資本方主要是風險投資資金;VC的錢,很容易面對后面LP的壓力,其風險承受力,和這些巨頭根本無法相提并論。 8/ AI模型層賺不了錢,和巨頭持續投入,這兩者沒有必然的關系,因為巨頭的出發點,并不完全是從短期的財務角度出發(這里涉及到了很多博弈論 / game the)。二級市場看到了deepseek并沒有導致Capex支出的大量降低,重新歡欣鼓舞,仿佛一切都沒有發生過。但是這或許僅僅是通過錯誤的原因,找到了“正確”的結果。 9/ AI模型層賺不了錢,不代表擁有模型層優勢的巨頭沒辦法通過其他業務賺錢。譬如Chrome雖然免費,但是google搜索卻卡位流量入口端,賺的盆滿缽滿;互聯網時代的那套bundle vs debundle的賺錢方法可能仍然適用。 從互聯網時代到AI時代 1/ 互聯網時代的變現非常簡單,'lauch free, go viral, work out revenue later';先把流量沖上去,然后自然而然就可以變現。AI時代的變現,目前看來,并非這么直觀。 2/ 科技巨頭也不是沒有嘗試過AI的變現;微軟的copilot 和谷歌的gemini都嘗試過做出一些貨幣化的初步嘗試;但是這一個過程并不順利,所以他們幾次調整了自己的計費方式;主要還是通過和“現有業務捆綁” vs '按用量計費”的形式; 谷歌gemini ![]() 微軟copilot ![]() 3/ 基于使用量計費的形式,現在看起來似乎很符合直覺,因為AI時代的“推理成本”,讓軟件重新擁有了“邊際成本”;但是基于使用量的計費形式,其實是很反常識的,也是和計算的歷史背道而馳。 ![]() 4/ 我們曾經歷過“撥號上網”的年代,當時流量還按用量計費,我也曾經因為下載了一個游戲,不小心花了好幾百塊的流量費。然而現在,雖然我們也每個月在給移動電信交一筆上網費,但是卻很少有人再去計算“上網流量”的用量。 互聯網巨頭企業,在流量按量計費的時候,并沒有成為巨無霸,反而是在“流量無限” (或者沒有什么邊際成本的時候),才開始吞噬一切。另外一個例子,就是我們從來沒有考慮過,在雙11搶折扣的時候,淘寶需要調動多少云計算算力,去支持我們的每一次成交。 5/ 我們仍然處在“按量計費”的階段,可能就是因為我們仍然在這項技術應用的“過渡期”;什么時候我們調用AI,調用模型,如呼吸般簡單,也從來不需要考慮價格,那時候AI應用時代可能才真正到來。 ![]() 6/ Deepseek的出現,讓我們對邊際成本/marginal costs的降低,看到了更大的希望。這里我引述Steven Sinofsky的表述, 人工智能的成本,正如大型計算機向X.25網絡連接轉型時的成本問題一樣,本質上迫使市場必須發展出一種無需大規模直接資本投入即可擴展的替代方案。從各方面來看,DeepSeek的最新方案似乎正代表著這種方向。 Deepseek的模型能在普通商用硬件,且無需聯網的環境下運行,加之其開源屬性,已足以對當前依賴超大規模投入的人工智能發展路徑構成有力挑戰——這種突破性進展,足以被視為'未來技術演進的方向'。 7/ Yishan對于deepseek也有過類似的描述, ![]() ![]() 8/ 當然也有人認為marginal costs會因為test-time計算而一直存在;這主要取決于你認為我們究竟處在技術進步的哪一個階段(可能最終test-time計算也會變得非常便宜)... 本文來源:180k,原文標題:《AI模型層可能毫無利潤可言(2月10日)》 .1.8.0.k
|
|