DeepSeek正在成為國產AI大模型領域的新寵。 2月5日,中國移動旗下的移動云宣布接入DeepSeek大模型,繼此前中國電信、中國聯通分別在2月1日、2月3日相繼官宣,至此,三大運營商已全部接入DeepSeek。這也意味著DeepSeek成為國內首個獲三大電信巨頭支持的國產AI大模型。 在蛇年春節期間橫空出世后,DeepSeek目前已推出多個大模型,涵蓋自然語言處理、代碼生成等多個領域。其中,DeepSeek-R1在數學、代碼、自然語言推理等任務上,測評性能與GPT-o1模型正式版接近。 此次合作中,三大運營商各自推出了不同的接入方式。中國電信通過“息壤”智算平臺,提供DeepSeek-R1模型的推理、訓練及微調支持,并在GPU云主機、科研助手、AI云電腦等業務場景中部署應用。 中國聯通則借助“星羅”平臺,實現DeepSeek-R1在編程助手、云桌面等產品中的集成,并在全國270多個骨干云池預部署,以優化推理效率和數據安全能力。 中國移動的接入范圍相對更廣泛,宣布支持DeepSeek全版本、全尺寸模型,并通過智算中心、云計算平臺進行深度適配,同時結合自研的COCA算力平臺,實現更靈活的模型調用與部署。 三大運營商自研的大模型相比DeepSeek顯得十分遜色,或許是三大運營商主動選擇擁抱DeepSeek的原因之一。過去兩年,三大運營商曾相繼推出自研大模型——中國移動的“九天”、中國聯通的“聯智”、中國電信的“星辰”,并嘗試在智能客服、云計算、政企市場等領域進行落地,但未在市場激起較大水花。 2023年,中國移動發布的“九天”大模型,主打智能語音助手、智慧政務等場景;中國聯通推出“聯智”大模型,強調5G+AI的融合應用;中國電信的“星辰”大模型則依托天翼云,聚焦安全及企業級AI服務。然而,相較于百度、阿里等互聯網公司推出的AI大模型,三大運營商的自研產品在市場認知度、技術成熟度及行業拓展方面仍有較大差距。 此次三大運營商接入DeepSeek,被視為對其自研AI能力的一次補充。在運營商的智能算力平臺上,DeepSeek的加入將進一步豐富其AI產品矩陣,提升大模型在云計算、智能客服、辦公自動化等場景中的應用能力。 同時,三大運營商仍保留自研模型,并在特定行業及定制化服務中繼續推進落地。如何在DeepSeek的通用能力與自研模型的行業適配性之間形成互補,成為三大運營商下一步需要探索的方向。 此外,除了三大運營商,華為云,騰訊云、阿里云等國內主流云平臺也相繼接入DeepSeek,英偉達、微軟、亞馬遜在內的多家海外公司也在加速接入DeepSeek-R1。1月31日,英偉達宣布NVIDIA NIM已經可以使用DeepSeek-R1模型。當天,亞馬遜也表示DeepSeek-R1模型可以在Amazon Web Services上使用。微軟也在同一天宣布,已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業級AI服務平臺的一部分。 |
|