☰

DeepSeek成AI黑馬！創辦人樑文鋒經歷曝光核心職位都是「應屆畢業天才」

Deepseek創始人樑文鋒的經歷曝光，他只招1%的天才，去做99%中國公司做不到的事情。圖／取自香港文匯網

大陸AI新創企業DeepSeek（深度求索）近期推出低成本、高性能的AI模型DeepSeek-V3與DeepSeek-R1，不僅在技術表現上逼近OpenAI的ChatGPT-4，甚至登上蘋果App Store下載排行榜第一名。27日美國科技股盤前大跌，大陸相關概念股則走強，每日互動、華金資本、浙江東方、卓創資訊均漲停，並行科技和拓爾思分別升逾17%。其中DeepSeek創始人樑文鋒的經歷更被曝光，目前還是高達千億人民幣規模的私募基金-幻方量化的掌舵人。

據香港文匯網報導，DeepSeek的AI模型訊聯成本低廉到驚人，其中DeepSeek-V3的製造成本僅558萬美元，而性能更強的DeepSeek-R1則爲600萬美元，和世界其他頂尖AI公司的模型訓練成本動輒數十億美元，形成鮮明對比。這匹AI黑馬除了在美國硅谷投下震撼彈，據說已讓美國科技巨頭Meta的AI部門陷入恐慌。

DeepSeek模型由同名的杭州初創公司DeepSeek開發，公司於2023年7月成立，其20日上週一發布的推理模型DeepSeek-R1，在數學、程式碼及推理基準測試中，可以與矽谷最先進模型OpenAI o1匹敵，但投入研發費用只有558萬美元，只是Meta訓練Llama 3.1的10分之1，更只是Chat-GPT的20分之1，而且只用2048張輝達H100（輝達爲供應中國大陸低階晶片）的GPU集羣，需時只是53天。

樑文鋒是廣東湛江吳川市一中「高考狀元」。DeepSeek創始人樑文鋒的背景備受關注，樑文鋒1985年出生於廣東省湛江市。2002年以湛江的吳川市第一中學「高考狀元」的成績考入浙江大學電子信息工程系，並在隨後的幾年裡繼續深造，最終於2010年獲得信息與通信工程碩士。在校期間，他對金融市場產生了濃厚的興趣。樑文鋒與浙大同學徐進於2013年共同創立了杭州雅克比投資管理有限公司，2015年成立了幻方量化，致力於透過人工智慧進行量化投資。

2016年公司推出了首個基於深度學習的交易模型，並實現了所有量化策略的AI化轉型。2018年幻方正式確立了以AI爲核心的發展戰略。2021年幻方的資產管理規模突破千億大關，躋身大陸量化私募領域的「四大天王」之列。最後樑文鋒於2023年創辦深度求索DeepSeek，專注於做真正人類級別的人工智慧。

另據香港作家馮睎幹在今週刊撰文，2023年5月，樑文鋒曾說：「幻方做大模型，跟量化和金融都沒有直接關係，我們獨建了一個名爲深度求索的新公司來做這件事。我們要做的是通用人工智慧，也就是AGI，大型語言模型可能是通往AGI的必經之路，並且初步具備了AGI的特徵，所以我們會從大語言模型這裡開始。」

樑又說自己創立DeepSeek，主要出於科學好奇，而非追逐盈利。至於聘用原則，是隻看能力，不問經驗，核心職位都由應屆和畢業一兩年的年輕人擔任。衡量新人的能力，除了看院校背景（主要是清華、北大生），還看競賽成績，金獎以下都不用，「只招1%的天才，去做99%中國公司做不到的事情。」所以這家只有139人的公司，可謂臥虎藏龍，人人身負絕技。

DeepSeek成AI黑馬！創辦人樑文鋒經歷曝光 核心職位都是「應屆畢業天才」

相關資訊

DeepSeek成AI黑馬！創辦人樑文鋒經歷曝光核心職位都是「應屆畢業天才」