AI浪潮 李開復再造獨角獸
創新工場董事長兼CEO李開復發起的大模型公司零一萬物日前上線「Yi」基礎模型,多項數據居各榜單前列。圖/中新社
零一萬物小檔案
創新工場董事長兼CEO李開復發起的大模型公司零一萬物日前上線「Yi」基礎模型,多項數據居各榜單前列,在「AI 2.0」時代成大模型通用底座有力競爭者。在發起不到8個月後,該公司估值已逾10億美元躋身獨角獸行列。
零一萬物官網顯示,公司首款中英語開源「Yi」大模型正式上線,發表參數規模6B和34B的基礎模型,開放免費商用申請。
36氪引述知情人士表示,「Yi」於11月2日在Hugging Face低調上傳模型,近期零一萬物更完成由阿里雲領投的新一輪融資,估值已超10億美元。
由於李開復3月才公開招募團隊,可說不到8個時間就打造出一隻獨角獸。報導引述李開復說法,在完成融資前零一萬物訓練成本已負債數千萬美元,反映出創新工場押注大模型帶動的「AI 2.0」時代決心。
「Yi」大模型主打200K最長記憶窗口、卓越推理能力以及與現有市場具區別性的尺吋,零一萬物官網介紹,「Yi-34B」預訓練模型在多項評測中全球領跑,MMLU等評測取得了多項SOTA國際最佳性能指標表現。在評估中文的C-Eval排行榜上,「Yi-34B」以平均81.4分列榜首,超越阿里雲9月發表「Qwen-14B」的72.1分,「Yi-6B」以72分列第三。
零一萬物公佈評測結果顯示,「Yi-34B」在常識推理能力和閱讀理解能力上均大幅領先全球開源模型,在數學與代碼能力上居領先。
零一萬物指出,「Yi」模型尺吋輕巧靈活,「Yi-34B」以更小模型尺吋評測,超越Meta的「LLaMA2-70B」、阿聯創新研究院的「Falcon-180B」等大尺吋開源模型,對開發者更友好。報導指出,當前市面上常見7B、13B等規模,李開復認爲34B是黃金比例,對廠商訓練成本更友好。
李開復表示,目前GPU短缺,團隊將模型從6B推向大規模時減少試錯成本,以不追求大的心態,將「Yi-34B」訓練成本下降4成,別的友商若要用2,000張GPU,零一萬物只要1,200張。李開復指出,完成「Yi-34B」預訓練同時,已啓動下一個千億參數模型的訓練。預計在幾周內有新內容發表,如「Yi」系列的對話模型、數學模型等會陸續推出。