DeepSeek發佈R1模型,性能對標OpenAI o1正式版

藍鯨新聞1月20日訊 1月20日,幻方量化旗下AI公司深度求索(DeepSeek)正式發佈DeepSeek-R1模型。在數學、代碼、自然語言推理等任務上,該模型性能比肩OpenAI o1正式版。DeepSeek稱,R1在後訓練階段大規模使用了強化學習技術,在僅有極少標註數據的情況下,極大提升了模型推理能力。DeepSeek不僅將R1訓練技術全部公開,還蒸餾了6個小模型開源給社區,允許用戶藉此訓練其他模型。API價格方面,每百萬輸入tokens 1 元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元,較o1正式版低27-55倍。(藍鯨新聞 朱儁熹)