DeepSeek全稱杭州深度求索人工智能基礎技術研究有限公司,簡稱深度求索,成立于 2023年7月,是幻方量化旗下的AI公司,專注于實現通用人工智能(AGI),具有深厚的 軟硬件協同設計底蘊。 DeepSeek共研發開源十余款模型,目前最受關注的有V3對話模型和R1推理模型,分別 于2024年12月26日和2025年1月20日先后發布。從反映關注度的微信指數上可以看出, 兩次模型發布都造成了后續DeepSeek關注度的飆升,12月28日DeepSeek指數達到約 6000萬,1月31日達9.8億。 V3:是采用混合專家架構(MoE)的高性能對話模型,支持多任務處理并在代碼生成、 數學推理等場景表現優異。 R1:是基于強化學習訓練的推理模型,專注于代碼生成和復雜數學問題解決,推理能 力通過蒸餾技術可遷移至小型模型。 |
|