文:Tony
近日有國內的 AI 公司 DeepSeek 在網上爆紅,除了其人工智能助手應用更在多國的應用下載排名榜成為第一,主要原因是因為 DeepSeek 只用了約 $560 萬美元,折合約 HK$4,300 萬港元開發的 AI 大模型 DeepSeek R1,性能竟然可以媲美,花了數十億元美元開發,被譽為當今最強的 OpenAI o1 大模型。而且 DeepSeek 受制於美國的出口禁令,DeepSeek R1 只能應用效能較低的 Nvidia H800 晶片,更只用了 2,000 張,設計目的是遵守美國 2022 年發布的出口管制措施,令投資者懷疑開發 AI 應用及服務,是否需要更多及更高效能的 AI 晶片,因而令 nvidia 單日股價跌近 17%。究竟這家被海外傳媒稱為「東方神秘力量」的 DeepSeek,是一間怎樣的公司,DeepSeek 的核心人物如梁文峰又是什麼來頭?
DeepSeek 成立於 2023 年 7 月 17 日,創辦人為梁文峰,是一家創新科技公司,據馬來西亞的東方網報導,Deep Seek 團隊不大,約只有 140 人,當中人才都來自清華、北大、北航等頂尖大學的應屆博士畢業生及在學生,據說並沒有「海歸」的海外留學生,只重用國內本土人才。
▲DeepSeek 創辦人梁文峰
DeepSeek 的創辦人梁文峰出生於 1985 年,2010 年在浙江大学取得資訊與通訊工程碩士學位。
梁文峰在學期間,對金融市場產生了濃厚的興趣,於 2008 年已帶領團隊,探索了機器學習技術,參與量化股票投資交易(量化投資即透過程式去回測驗證,評估後確認方法具有交易優勢後,讓程式依照設定的規則去執行交易),並在 2010 年碩士畢業時,已賺到「第一埇金」,自營資金超過 5 億元人民幣。
及後在 2013 年, 梁文峰與浙江大學同學徐進,成立杭州雅克比投資管理有限公司,加強量化投資。2015 年成立了杭州幻方科技 (幻方) 有限公司,致力於透過數學與人工智能進行量化股票投資。
2016 年,幻方推出了首個基於深度學習的交易模型,並實現了所有量化投資策略的 AI 化轉型,或許就是 DeepSeek 的雛形。
2018 年,幻方正式確立了以 AI 為核心的發展策略,並在 2021 年資產管理規模突破千億,躋身國內量化私募領域的「四大天王」,並曾公開擁有萬張 Nvidia A100 晶片。
2023 年,梁文峰就是憑藉在幻方 AI 炒股獲得的資金,創立 DeepSeek,受益股份比例超過 80%。
DeepSeek 在 2024 年 5 月,已經發表的一款名為 DeepSeek V2 的開源 AI 模型,將 AI 推理成本大幅下降,並在國內開啟了 AI 大模型價格戰,所以 DeepSeek 在國內被稱為「AI 界拼多多」。
及後 DeepSeek 就是在 2024 年 12 月,發表了 DeepSeek V3 開源 AI 模型,並在 2025 年 1 月 公佈 DeepSeek R1,成功做成國際焦點。
早前 Wallstreet CN 訪問了梁文峰,當中被問及 DeepSeek 面臨的問題及現在最花精力的地方,梁文峰亦很直接指出,公司面臨的問題從來不是錢,而是高階晶片被禁運,另外最花精力的地方是新一代套路研究下一代的 AI 大模型。
資料來源:wallstreetcn 、finance.sina.com.cn 、orientaldaily.com.my