梁文鋒,1985年出生于廣東省湛江市。2002年,這位對數(shù)學建模充滿熱情的年輕人考入浙江大學電子信息工程專業(yè),并在隨后的幾年里繼續(xù)深造,最終于2010年獲得信息與通信工程碩士學位。 在校期間,他對金融市場產生了濃厚的興趣。特別在2008年全球金融危機之際,他帶領團隊探索了機器學習技術在全自動量化交易中的應用潛力,這一經歷為他日后的職業(yè)生涯奠定了堅實的基礎。 畢業(yè)后,梁文鋒將目光轉向更廣闊的金融市場。 2013年,他與浙大同學徐進共同創(chuàng)立了杭州雅克比投資管理有限公司,兩年后又成立了杭州幻方科技有限公司,致力于通過數(shù)學和人工智能進行量化投資。2015年的市場波動中,幻方依靠先進的高頻量化策略取得了令人矚目的成績。 2016年是幻方的重要轉折點。這一年,公司推出了首個基于深度學習的交易模型,并實現(xiàn)了所有量化策略的AI化轉型。2018年,幻方正式確立了以AI為核心的發(fā)展戰(zhàn)略。然而,隨著業(yè)務的快速擴展,算力瓶頸逐漸顯現(xiàn)。 為解決計算資源不足的問題,2019年,梁文鋒帶領團隊自主研發(fā)了“螢火一號”訓練平臺,總投資近2億元,搭載了1100塊GPU。兩年后,“螢火二號”的投入增加到10億元,搭載了約1萬張英偉達A100顯卡。 2021年,幻方的資產管理規(guī)模突破千億大關,躋身國內量化私募領域的“四大天王”之列。2023年,他宣布將正式進軍通用人工智能領域,并創(chuàng)辦了深度求索DeepSeek,專注于做真正人類級別的人工智能。 2024年5月,DeepSeek發(fā)布混合專家語言模型DeepSeek-V2。同年12月,DeepSeek-V3問世,這款性能優(yōu)越且性價比極高的大語言模型,被硅谷同行譽為“來自東方的神秘力量”。 DeepSeek之所以被科技圈關注,在于DeepSeek-V3的出現(xiàn)極大地降低了大模型訓練和應用的成本,DeepSeek-V3訓練成本僅557.6萬美元,而OpenAI訓練ChatGPT-4o所花費的成本高達7800萬美元甚至是1億美元,雙方的成本至少是10倍的差距。 在性能上,DeepSeek-V3在數(shù)學、代碼能力和中文知識問答方面還超過了ChatGPT-4o,行業(yè)震驚于這一性價比,DeepSeek-V3開源給全世界的技術開發(fā)團隊。 在團隊配置上,DeepSeek團隊只有139名研發(fā)人員,對比ChatGPT的OpenAI團隊則有1200名研究人員,團隊規(guī)模是DeepSeek的近乎9倍之多。近期熱門話題“雷軍千萬年薪挖95后天才AI少女”,這位AI少女就是DeepSeek團隊的研發(fā)人員,但小米和當事人并未就此回應。 通過招聘網站注意到,深度求索公司的北京子公司正在招人,現(xiàn)共放出了52個崗位,包括深度學習研究員、核心系統(tǒng)研發(fā)工程師以及資深ui設計師等,均為14薪。 其中,薪資最高的為核心系統(tǒng)研發(fā)工程師(校招),薪資范圍為6萬元-9萬元;除此之外,大部分崗位的起薪在2萬元及以上。 |
|