在過去的十年里,人工智能技術迅速崛起,從實驗室走向產業化,引領著一場前所未有的變革。這場AI技術革命不僅席卷了各個行業,也在深刻地改變著人們的生活方式和商業模式。人工智能不再是理論探討的領域,而是成為了推動社會進步的強大引擎。在這個過程中,從傳統的交換機到高性能的AI服務器,再到云計算和數據中心,各種技術不斷地推陳出新。與此同時,AI技術也在不斷演進,從“1”到“10”掀起“千模大戰”的AI革命,將首先在軟件和應用領域展開。算法作為關鍵驅動力,基礎軟件則為其提供了支撐和平臺。隨著算力性能逐漸同質化,數據的多樣性和企業需求的多樣性也逐漸凸顯出來。因此,“AI基礎軟件”作為決定模型訓練效率和算力使用效率的核心要素,其地位顯得愈發重要,該領域的發展將創造出更為獨特和有價值的社會及經濟效益。 弗若斯特沙利文(Frost & Sullivan,簡稱“沙利文”)持續關注中國AI基礎軟件的發展創新,正式發布《中國AI基礎軟件市場研究報告(2023)》。 該報告旨在明晰AI基礎軟件的基本概念和分類,通過對行業發展歷程及產業鏈的梳理探究行業核心驅動因素,剖析當下AI基礎軟件行業市場趨勢,并基于應用、產品及生態三大關鍵維度構建廠商競爭力體系,評估主流玩家的核心競爭優勢及綜合壁壘,形成對中國市場AI基礎軟件發展情況的客觀評價,并為行業未來發展提供參照建議與關鍵啟發。 本文深入技術和行業發展,解析AI基礎軟件產業體系和其價值創造。 1 中國AI基礎軟件發展背景 01 平臺型機會:AI2.0 AI2.0是由大數據、云計算和人工智能技術等多種技術的融合所構成的,是一個巨大的平臺式機會,將會在未來為各行業提供更加深入和全面的解決方案。隨著AI 2.0 時代的到來,基礎模型不再需要人工標注數據,也可以自行學習和閱讀海量的文本。而且模型通過微調就能以低成本訓練適應不同領域的任務。其中,AI2.0相關的應用、平臺和基礎設施,將會成為包括產業及投資在內的熱點。AI基礎軟件作為AI大模型訓練、管理、應用的重要平臺將會在AI2.0的長風中順勢演化出巨大的產業機會。 ![]() 來源:沙利文報告 02 AI大模型發展根基:龐大數據基礎 一方面,數據量的爆發推動了基礎數據服務行業的發展和拓展基礎數據服務提供的服務范圍。中國的數據量在2017年到2021年,從2.3ZB(十萬億億字節)增長到23.88ZB,預計在2026年達到76.6ZB,將位居全球第一,且未來依然保持爆發式增長。隨著大數據的爆炸式增長,企業和組織對于處理、管理和分析這些數據的需求也在急劇增加。這為基礎數據服務行業帶來了巨大的市場需求,推動了行業的發展。 另一方面,合成數據加速高質量數據供給,為AI大模型發展提供基礎,合成數據有望解除AI的數據掣肘,推動人工智能邁向2.0階段。在此階段,合成數據不僅可以訓練AI模型,通過數據仿真AI可以完成自我學習和進化。 ![]() 來源:沙利文報告 2 AI基礎軟件市場概覽 01 AI基礎軟件市場定義與解讀 AI基礎軟件包含一系列企業級AI應用所需的平臺軟件產品及解決方案,是為大模型應用落地的最主要的效率支撐,AI基礎軟件的發展決定了人工智能發展的深度、高度、廣度,其催化大模型應用快速發展,推動政府和企業AI規模化應用。 AI2.0時代的到來,讓各行業對大模型應用的需求日漸提升,對大模型對于業務的支撐力也更為重視,但大多數企業都會面臨工程、技術等能力不足的問題。 AI基礎軟件作為AI基礎設施的重中之重,為企業客戶提供全方位的AI調度以及模型服務,包含機器學習平臺等一站式模型平臺,以及數據智能平臺、實時決策中心、數據湖、數據倉庫等服務于AI的數據平臺,從而降低各行業客戶訓練自己人工智能模型的門檻,實現降本增效。 ![]() 來源:沙利文報告 02 AI基礎軟件市場需求:“千模百態”蓬勃發展 在數據層面,模型訓練數據的質量和規模對模型迭代的效果至關重要,尤其是目前內外數據共享和數據共創、數據類別不均衡、極端場景數據缺失等問題,呼喚業內對AIGC結構化數據合成領域的技術探索。 在技術層面,生成式AI模型的推理能力愈發重要,同時對AI的可信度、可解釋度的需求也在提升,呼喚自動機器學習、深度學習、因果學習等領域的基礎軟件性能提升。 在商業模式層面,隨著大模型的逐漸成熟,通用大模型 行業小模型會成為越來越多企業采用的落地模式,因此,幫助企業自建AI模型的AI基礎軟件成為大勢所趨。 ![]() 來源:沙利文報告 03 AI基礎軟件政策驅動:利好政策 在國家監管層面,中國積極布局人工智能產業,競跑“未來賽道”。隨著各行業、各領域對人工智能需求的日益增長,與實體經濟深度融合的新模式不斷涌現,形成了具有中國特色的研發體系和應用生態。以“大模型”為代表的技術爆發,加速了人工智能產業的發展。國家及地方出臺的多項AI產業支持政策將給產業發展帶來助推力,更進一步推動數字經濟與實體經濟的融合發展。 04 AI基礎軟件開源生態:開放源代碼 開源生態的建設、完善對AI基礎軟件領域的影響和推動是巨大的,它不僅推動了技術的創新和進步,也促使了更廣泛的合作和知識分享。具體表現在開源降低AI基礎軟件的開發門檻,同時能促進開發者的知識共享和協作,此外也擴大AI基礎軟件的應用領域,開源為廣大開發者提供了高度靈活和可定制的基礎。 ![]() 來源:沙利文報告 05 AI基礎軟件產業生態:價值創造 AI基礎軟件主要位于產業鏈的中游。其產業鏈由上游基礎設施與資源提供商、中游AI基礎軟件與一站式AI開發平臺和下游應用領域企業構成。 上游是人工智能軟件部署的基礎,為AI基礎軟件提供算力支撐。中游是產業鏈的核心,以模擬人的智能相關特征為出發點,構建應用技術路徑,主要包括AI基礎軟件以及一站式AI開發平臺。下游主要為AI基礎軟件在各細分場景的應用,主要包括制造、安防、金融、醫療、零售、交通、等領域。 云廠商傾向于向客戶提供端到端的整體解決方案,期望整體捆綁客戶。相比之下,目前領先的AI基礎軟件能夠以模塊化的方式嵌入客戶云的體系中,能夠充分滿足客戶的自主性和可控性的要求。 ![]() 來源:沙利文報告 3 AI基礎軟件市場代表企業簡析 九章云極DataCanvas 九章云極DataCanvas是領先的AI基礎軟件供應商,其核心產品系列AIFS人工智能基礎軟件和DataPilot數據領航員具有創新性、靈活性及可擴展性;AIFS賦能用戶“自主構建大 小模型”的AI能力,包含DataCanvas Alaya九章元識“通識 產業”白盒大模型矩陣、APS機器學習平臺、BAP面向業務的自動建模平臺、DAT自動機器學習軟件、YLearn因果學習軟件等一整套全開放、高自動、高協同的軟件工具,加速實現用戶亟需的自主AI能力積累和模型規模化;DataPilot數據領航作為基于自研大模型的新一代數據架構工具產品,包含DingoDB多模向量數據庫和RT實時決策中心平臺等工具,幫助用戶自主構建安全可控的“向量海”,實現全鏈路的智能化與自動化,賦能用戶擁有面向未來的多模態實時數據處理能力。 亞馬遜云科技 亞馬遜云旗下的機器學習平臺Amazon SageMaker提供完整、豐富的功能供開發人員、數據科學家和ML工程師使用。Amazon SageMaker Studio Lab提供免費資源,Amazon SageMaker Jumpstart和Amazon SageMaker Canvas提供低代碼/無代碼的快速上手功能、Amazon SageMaker Pipelines構建全自動ML流程、Amazon SageMaker Ground Truth Plus提供智能標注服務、Amazon SageMaker Data Wrangler內置300多種數據轉換、Amazon SageMaker Autopilot自動執行AutoML,具備完備的AI開發軟硬全棧供應水平,從專用基礎設施、AI平臺到各類場景開箱即用的AI服務解決方案,結合亞馬遜云科技的系列云上服務,滿足各類型客戶的不同需求。 華為云 華為云AI開發平臺ModelArts是面向開發者的一站式AI開發平臺,可快速創建和部署模型,管理全周期AI工作流,為機器學習與深度學習提供海量數據預處理及半自動化標注、大規模分布式Training、自動化模型生成,助力千行百業智能化升級。華為云AI開發平臺ModelArts具有提供模型開發、訓練、推理端到端工具鏈,以及高性價比AI算力、支持萬卡大規模集群,支持故障容錯及訓練作業故障自動恢復等優勢。 阿里云 阿里云旗下相關產品包含機器學習平臺PAI、模型在線服務PAI-EAS等。其中,機器學習平臺PAI是面向開發者和企業的機器學習/深度學習工程平臺,提供包含數據標注、模型構建、模型訓練、模型部署、推理優化在內的AI開發全鏈路服務,內置140 種優化算法以及豐富的場景插件,為用戶提供低門檻、高性能的云原生AI工程化能力。 騰訊云 騰訊云AI開放平臺包括騰訊云TI 平臺、TI-Matrix應用平臺等,是基于騰訊生態與AI開發經驗,面向開發者、政企提供的全棧式人工智能開發服務平臺,打通包含從數據獲取、數據處理、算法構建、模型訓練、模型評估、模型部署到AI應用開發的產業 AI落地全流程鏈路,幫助用戶快速創建和部署AI應用,管理全周期AI解決方案,推動政企加速數字化轉型并促進AI行業生態共建。 Databricks Databricks旗下Lakehouse平臺結合了數據湖和數據倉庫的元素,它具有數據湖的靈活性、成本效益和規模,同時還提供數據管理事務。用戶可以在所有數據上啟用商業智能和機器學習。Databricks Lakehouse平臺為數據分析和機器學習提供了一個統一的環境,可實現商業智能和SQL分析、數據科學與機器學習、實時數據應用等功能。在Databricks Lakehouse平臺上企業可較易攝取和轉換批處理和流數據,編排可靠的生產工作流,通過內置的數據質量測試和對軟件開發最佳實踐的支持,提高企業生產力。 百度云 百度的AI開發平臺由千帆大模型平臺、全功能AI開發平臺(BML),零門檻AI開發平臺(EasyDL),AI開發實訓平臺(AI Studio)組成,由百度自主研發的飛槳平臺統一進行賦能。百度AI開發平臺覆蓋不同需求的開發者,涵蓋數據處理,算法開發, 模型訓練,預測服務部署,以及資源管理等貫穿模型全生命周期的能力。 |
|