DeepSeek-R1發佈,性能對標OpenAI o1正式版

格隆匯1月20日|DeepSeek正式發佈 DeepSeek-R1,並同步開源模型權重。DeepSeek-R1遵循MIT License,允許用戶通過蒸餾技術藉助 R1 訓練其他模型。DeepSeek-R1上線API,對用戶開放思維鏈輸出,通過設置model='deepseek-reasoner'即可調用。DeepSeek官網與App即日起同步更新上線。DeepSeek-R1 在後訓練階段大規模使用了強化學習技術,在僅有極少標註數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。