開發DeepSeek…95後AI天才少女 小米千萬年薪延攬
DeepSeek-V2的關鍵開發者之一羅福莉,被譽爲AI天才少女,今年不到30歲。小米以年薪人民幣1千萬元挖角。圖/取自羅福莉公衆號
大陸AI新創公司DeepSeek近來迅速走紅,據稱令矽谷十分緊張。DeepSeek大模型的關鍵開發者之一是在大陸被稱爲九五後(一九九五年後出生者)AI天才少女羅福莉。小米創始人雷軍日前才以人民幣千萬元年薪招攬羅福莉,由她領導小米AI大模型團隊。
綜合陸媒報導,去年底DeepSeek發佈新一代大模型DeepSeek-V3,同時宣佈開源(公開原始碼和技術細節)。今年一月廿日,DeepSeek再發布DeepSeek-R1。在多項基準測試中,V3的成績超越了主流開源模型,同時由於其極低的訓練成本,該模型也被形容爲「AI界拼多多」(喻其物美價廉)。
DeepSeek模型的關鍵開發者之一,羅福莉也迅速走紅。她出生於一九九五年,畢業於北京師範大學電腦系,擁有北京大學計算語言學碩士學位。二○一九年在北大讀碩士時,就在人工智慧領域頂尖國際會議ACL發表八篇論文。畢業後第一份工作在阿里達摩院,從事預訓練語言模型相關工作,主導開發多語言預訓練模型VECO。
二○二二年,羅福莉加入幻方量化公司,從事深度學習相關策略建模與演算法研究;後來轉到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。該大模型只有GPT4價格的百分之一,被稱爲性價比之王。
外界稱她爲AI天才少女,但羅福莉認爲自己是電腦領域的「低起點者」。她曾說自己從小城市的高中考到北京師範大學,誤打誤撞進入電腦專業。大學時期還一度考慮轉行做產品。轉折點發生在研究所階段,羅福莉被保送至北京大學計算語言學所後,開始在人工智慧領域展露天賦。
談到暴紅經歷,羅福莉並不希望自己被神化、娛樂化。「突然之間千奇百怪的機會都來了,有找我出書的、有找我錄公開課的,甚至有經紀公司找來的。」