梁文鋒，1985年出生于廣東省湛江市。2002年，這位對數(shù)學建模充滿熱情的年輕人

麗華的竅寶好笑 2025-01-28

展開全文

梁文鋒，1985年出生于廣東省湛江市。2002年，這位對數(shù)學建模充滿熱情的年輕人考入浙江大學電子信息工程專業(yè)，并在隨后的幾年里繼續(xù)深造，最終于2010年獲得信息與通信工程碩士學位。
在校期間，他對金融市場產生了濃厚的興趣。特別在2008年全球金融危機之際，他帶領團隊探索了機器學習技術在全自動量化交易中的應用潛力，這一經歷為他日后的職業(yè)生涯奠定了堅實的基礎。
畢業(yè)后，梁文鋒將目光轉向更廣闊的金融市場。
2013年，他與浙大同學徐進共同創(chuàng)立了杭州雅克比投資管理有限公司，兩年后又成立了杭州幻方科技有限公司，致力于通過數(shù)學和人工智能進行量化投資。2015年的市場波動中，幻方依靠先進的高頻量化策略取得了令人矚目的成績。
2016年是幻方的重要轉折點。這一年，公司推出了首個基于深度學習的交易模型，并實現(xiàn)了所有量化策略的AI化轉型。2018年，幻方正式確立了以AI為核心的發(fā)展戰(zhàn)略。然而，隨著業(yè)務的快速擴展，算力瓶頸逐漸顯現(xiàn)。
為解決計算資源不足的問題，2019年，梁文鋒帶領團隊自主研發(fā)了“螢火一號”訓練平臺，總投資近2億元，搭載了1100塊GPU。兩年后，“螢火二號”的投入增加到10億元，搭載了約1萬張英偉達A100顯卡。
2021年，幻方的資產管理規(guī)模突破千億大關，躋身國內量化私募領域的“四大天王”之列。2023年，他宣布將正式進軍通用人工智能領域，并創(chuàng)辦了深度求索DeepSeek，專注于做真正人類級別的人工智能。
2024年5月，DeepSeek發(fā)布混合專家語言模型DeepSeek-V2。同年12月，DeepSeek-V3問世，這款性能優(yōu)越且性價比極高的大語言模型，被硅谷同行譽為“來自東方的神秘力量”。
DeepSeek之所以被科技圈關注，在于DeepSeek-V3的出現(xiàn)極大地降低了大模型訓練和應用的成本，DeepSeek-V3訓練成本僅557.6萬美元，而OpenAI訓練ChatGPT-4o所花費的成本高達7800萬美元甚至是1億美元，雙方的成本至少是10倍的差距。
在性能上，DeepSeek-V3在數(shù)學、代碼能力和中文知識問答方面還超過了ChatGPT-4o，行業(yè)震驚于這一性價比，DeepSeek-V3開源給全世界的技術開發(fā)團隊。
在團隊配置上，DeepSeek團隊只有139名研發(fā)人員，對比ChatGPT的OpenAI團隊則有1200名研究人員，團隊規(guī)模是DeepSeek的近乎9倍之多。近期熱門話題“雷軍千萬年薪挖95后天才AI少女”，這位AI少女就是DeepSeek團隊的研發(fā)人員，但小米和當事人并未就此回應。
通過招聘網站注意到，深度求索公司的北京子公司正在招人，現(xiàn)共放出了52個崗位，包括深度學習研究員、核心系統(tǒng)研發(fā)工程師以及資深ui設計師等，均為14薪。
其中，薪資最高的為核心系統(tǒng)研發(fā)工程師（校招），薪資范圍為6萬元-9萬元；除此之外，大部分崗位的起薪在2萬元及以上。