認識樑文峰:DeepSeek爆火背後的對衝基金經理

鞭牛士報道,1月28日消息,據外電報道,儘管 ChatGPT 的推出使OpenAI 首席執行官 Sam Altman成爲人工智能界的家喻戶曉的人物,但 DeepSeek 的創始人在美國仍然鮮爲人知。

這家中國人工智能初創公司高調發布了其開源人工智能模型 R1,令人工智能界爲之震驚。DeepSeek 稱,該模型在“數學、代碼和推理任務”方面的表現可與 OpenAI 的 o1 模型相媲美,同時僅使用一小部分計算能力。

那麼,誰將領導這家震驚硅谷乃至整個人工智能行業的公司呢?

下面我們來簡單瞭解一下DeepSeek創始人樑文峰的背景和職業生涯。

成長和教育

本月發表的 2024 年 7 月的一次採訪譯文中,文峰說,自己 1980 年代在中國廣東的五線城市長大。他的父親是一名小學教師。

他在浙江大學獲得了本科和研究生學位,浙江大學是中國歷史最悠久、排名最高的大學之一。

中國電子商務創始人、拼多多前首席執行官黃崢也曾在該校學習。

他的職業生涯始於金融。

2015年,文峰和兩名浙江大學同學創立了量化對衝基金High-Flyer,其網站稱其依靠數學和人工智能進行量化投資。

據 High-Flyer 網站稱,截至 2019 年,其管理的資產至少達到 100 億美元。

據《金融時報》報道,2021 年,文峰在運營 High-Flyer 期間開始從 Nvidia 購買數千塊 GPU,他的一位商業夥伴向該報描述他爲一個留着可怕髮型的書呆子,大談構建一個 10,000 個芯片的集羣來訓練他自己的模型。

2023 年 5 月,文峰推出了 DeepSeek,作爲資助人工智能實驗室的 High-Flyer 的一個分支。

這家初創公司去年年底憑藉其 V3 模型引起轟動。

在 12 月底發佈的一篇論文中,DeepSeek 的研究人員估計,他們使用 2,000 塊 Nvidia H800 芯片構建和訓練該模型的成本不到 600 萬美元,遠低於許多 AI 競爭對手。

例如,X 所有者埃隆·馬斯克 (Elon Musk) 表示,其平臺的 AI 聊天機器人Grok 3 正在使用 100,000 塊 Nvidia H100 GPU 進行訓練。Meta首席執行官馬克·扎克伯格 (Mark Zuckerberg) 去年 1 月表示,該公司將在 2024 年底前購買 350,000 塊 Nvidia H100 GPU 。

隨後,DeepSeek 於 2025 年 1 月 20 日推出 R1 型號,再次震驚硅谷。

Wenfeng 運行 DeepSeek 的方法

文峰在2024年的採訪中表示,他對DeepSeek的主要關注點是研究大型模型,實現通用人工智能。

「我們的原則是不虧本銷售,也不追求超額利潤。目前的定價允許我們在成本之上獲得適度的利潤空間。」他在翻譯採訪中說道。

他還表示公司不會採用閉源技術,並補充道:我們認爲建立強大的技術生態系統更爲重要。

文峰表示,中國的人工智能產業一直在追趕美國,他希望 DeepSeek 能夠改變這種狀況。

「我們認爲,中國的人工智能不可能永遠只是個追隨者。我們經常說,中國和美國的人工智能之間有一兩年的差距,但真正的差距在於原創和模仿之間。」他在翻譯採訪中說道。「如果這種情況不改變,中國將永遠是個追隨者。」