長江證券:GROK-1專家模型開源 建議關注AI模型相關廠商與核心行業應用廠商
智通財經APP獲悉,長江證券發佈研報稱,3月18日,馬斯克旗下大模型公司xAI宣佈開源3140億參數的混合專家(MoE)模型Grok-1,以及模型的權重和網絡架構,開發者可直接在Github下載獲得。現階段,開源模型在行業場景落地前需要通過行業數據調參,在此過程中需要較強的AI工程化能力,因此建議關注AI模型相關廠商與核心行業應用廠商;而隨着開源模型的應用,對AI算力的需求也隨之提升,建議關注AI算力相關廠商。
長江證券認爲,Grok-1是當前參數量最大的開源大語言模型,由8個混合專家模型組成,有25%的權重在給定token上處於激活狀態,因此在每次推理時會有2個活躍的專家模型(860億參數)。Grok-1基礎模型在大量文本數據上訓練,未針對任何特定任務進行微調。
Grok-1通過專家模型組合實現高性能與低算力消耗。在訓練階段,Grok-1會對8個小模型各自做不同任務的針對性訓練,因此在數據喂入之後,模型不用一次性迭代所有參數,而僅僅迭代部分小模型的參數。在推理階段,雖然Grok-1整體參數超過3140億,但每次推理時只會調動860億的參數參與計算,算力消耗接近LLaMA2模型的700億參數,但性能得到了大幅度躍升。根據xAI公佈的數據,在GSM8K、HumanEval和MMLU等一系列基準測試中,Grok-1模型的表現超過了LLaMA-2-70B模型和GPT-3.5模型。
Grok-1模型開源彌補了我國模型側的技術短板,有望賦能行業應用發展。我國在專家模型層面與國外存在一定的技術差距,本次Grok-1的開源有望彌補我國模型側的技術短板。
Grok-1開源模型在相關廠商以行業數據微調後,未來或加速法律、金融、教育等行業垂類應用的智能化進程。
xAI公司的AI能力有望在未來賦能馬斯克的產業鏈生態。長江證券認爲,截至目前,經過微調的Grok大模型已經搭載於馬斯克的X社交平臺上,X訂閱用戶可與模型進行多任務的對話,可以實時訪問X平臺上的海量數據,從中學習和理解最新的熱門話題和事件。而馬斯克的智能駕駛、人形機器人公司特斯拉,腦機接口公司Neuralink同樣與AI具備較強關聯性,需要AI模型賦能。xAI公司有望在未來成爲馬斯克產業鏈的技術中臺,賦能全產業鏈生態。
風險提示:開源模型商業模式發展不及預期。AI模型下游需求不及預期。