Deepseek產業鏈交流!
Deepseek產業鏈交流要點(僅供更新參考):
定位目標:打造中國最強的開源大模型,DeepSeek-V3目前參數規模670億,商業化不是目前激進方向;
投入:訓練不到2個月,花費不到600萬美元,完成DeepSeek-V3的訓練,25年整體資本開支5-6億;
同行對比:DeepSeek還是屬於大語言模型,跟ChatGPT、豆包的訓練本身不在一個量級。現有的豆包或者智譜、KIMI、阿里通義千問,deepseek的邏輯推理能力還是強於它們,但是推理過程中情感化較弱;
算力情況:2024年A100 1000張,H800 3300張,H20 2000多,910B 1000多張,2025年繼續採購910C,H800,H109,A100,整體規劃5000多張(華爲910C 2000張);IDC:潤澤科技廊坊今年提供了3000多個機櫃;光模塊交換機錦航科技;服務器浪潮信息,中科曙光;除了華爲外,未來推理端可能用到寒武紀;
推理側:A100大概有4000多張卡,H800大概有2300張,大概有2000張H20,3090也有一部分;
token收費情況:輸入0.0001元/千token,輸出0.016元/千token;日均調用量在30多億;
產業鏈合作:教育:科大訊飛;金融:拓爾思;辦公:金山辦公;其他:海天瑞聲、卓創資訊、博彥科技、法本信息、中科軟;
模型升級:DeepSeek-R1是在DeepSeek-V3基礎上蒸餾推理,總共花費230萬美元,未來會採用多token的預測目標MTP形式,繼續提升模型效率,2025Q4多模態能力可能突破;
商業化構想:1)售賣token、售賣API接口,2)本地化私有部署,初步按45萬/套/年的定價,支持中小企業客戶的私有化應用,3)跟行業,比如金融、教育聯合推出AI應用;
token代理:目前接觸並行科技、競業達。