☰

Deepseek產業鏈交流！

Deepseek產業鏈交流要點（僅供更新參考）：

定位目標：打造中國最強的開源大模型，DeepSeek-V3目前參數規模670億，商業化不是目前激進方向；

投入：訓練不到2個月，花費不到600萬美元，完成DeepSeek-V3的訓練，25年整體資本開支5-6億；

同行對比：DeepSeek還是屬於大語言模型，跟ChatGPT、豆包的訓練本身不在一個量級。現有的豆包或者智譜、KIMI、阿里通義千問，deepseek的邏輯推理能力還是強於它們，但是推理過程中情感化較弱；

算力情況：2024年A100 1000張，H800 3300張，H20 2000多，910B 1000多張，2025年繼續採購910C，H800，H109，A100，整體規劃5000多張（華爲910C 2000張）；IDC：潤澤科技廊坊今年提供了3000多個機櫃；光模塊交換機錦航科技；服務器浪潮信息，中科曙光；除了華爲外，未來推理端可能用到寒武紀；

推理側：A100大概有4000多張卡，H800大概有2300張，大概有2000張H20，3090也有一部分；

token收費情況：輸入0.0001元/千token，輸出0.016元/千token；日均調用量在30多億；

產業鏈合作：教育：科大訊飛；金融：拓爾思；辦公：金山辦公；其他：海天瑞聲、卓創資訊、博彥科技、法本信息、中科軟；

模型升級：DeepSeek-R1是在DeepSeek-V3基礎上蒸餾推理，總共花費230萬美元，未來會採用多token的預測目標MTP形式，繼續提升模型效率，2025Q4多模態能力可能突破；

商業化構想：1）售賣token、售賣API接口，2）本地化私有部署，初步按45萬/套/年的定價，支持中小企業客戶的私有化應用，3）跟行業，比如金融、教育聯合推出AI應用；

token代理：目前接觸並行科技、競業達。

Deepseek產業鏈交流！

相關資訊