DeepSeek開發者 是「95後」AI天才少女
中國DeepSeek-V2的關鍵開發者之一羅福莉,被譽爲AI天才少女,今年不到30歲。小米以年薪人民幣1千萬元挖角。(取自羅福莉公衆號)
中國AI新創公司DeepSeek近來迅速走紅,據稱讓加州矽谷緊張。DeepSeek大模型的關鍵開發者之一是在中國被稱爲九五後(1995年後出生者)AI天才少女羅福莉。
小米創始人雷軍日前才以人民幣千萬元年薪招攬羅福莉,由她領導小米AI大模型團隊。
綜合中國媒體報導,去年底DeepSeek發佈新一代大模型DeepSeek-V3,同時宣佈開源(公開原始碼和技術細節)。
今年1月20日,DeepSeek再發布DeepSeek-R1。在多項基準測試中,V3的成績超越主流開源模型,同時由於其極低的訓練成本,該模型也被形容爲「AI界拼多多」(喻其物美價廉)。
DeepSeek模型的關鍵開發者之一,羅福莉也迅速走紅。她出生於1995年,畢業於北京師範大學電腦系,擁有北京大學計算語言學碩士學位。2019年在北大讀碩士時,就在人工智慧領域頂尖國際會議ACL發表八篇論文。畢業後第一份工作在阿里達摩院,從事預訓練語言模型相關工作,主導開發多語言預訓練模型VECO。
2022年,羅福莉加入幻方量化公司,從事深度學習相關策略建模與演算法研究;後來轉到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。該大模型只有美國GPT4價格的1%,被稱爲性價比之王。
外界稱她爲AI天才少女,但羅福莉認爲自己是電腦領域的「低起點者」。她曾說自己從小城市的高中考到北京師範大學,誤打誤撞進入電腦專業。大學時期還一度考慮轉行做產品。轉折點發生在研究所階段,羅福莉被保送至北京大學計算語言學所後,開始在人工智慧領域展露天賦。
談到暴紅經歷,羅福莉並不希望自己被神化、娛樂化。「突然之間千奇百怪的機會都來了,有找我出書的、有找我錄公開課的,甚至有經紀公司找來的。」
DeepSeek創始人樑文鋒日前參加中國總理李強的座談會。(取材自北京央視新聞)
提到「幻方量化」就必須提到DeepSeek創始人樑文鋒,樑文鋒「發跡」於量化投資,是低調的「量化天王」,曾參加國務院總理李強主持的企業家代表座談會,是李強的座上賓,還創辦了「AI界拼多多」。他是第一位量化私募「幻方量化」(High-Flyer)的創始人。Deepseek充分利用幻方量化積累的資金、數據和卡。
今年40歲的樑文鋒在2015年與拍檔創辦對衝基金「幻方量化」,迅速在中國崛起,成爲第一家籌集超過1000億元人民幣的量化對衝基金。
樑文鋒本科、研究生畢業於浙江大學,擁有信息與電子工程學系本科和碩士學位。2008年起,他開始帶領團隊使用機器學習等技術探索全自動量化交易。2023年7月,DeepSeek正式成立,進軍通用人工智能領域,至今從未對外融資。