OpenAI發佈o1模型新突破 推理時間增強對抗魯棒性

格隆匯1月23日|OpenAI今天凌晨2點發布了一項新技術研究,通過增加推理時間、算力資源來大幅度提升模型的對抗魯棒性。與傳統的對抗訓練樣本方法不同的是,OpenAI提出的新方法不需要對大模型進行專門的對抗訓練,也不需要提前瞭解攻擊的具體形式。只需要通過增加推理時間和算力資源,模型就可以更充分地利用其推理能力表現出更強的魯棒性。OpenAI將新技術在o1-preview和o1-mini模型進行了綜合實驗,結果顯示,成功抵禦了 Many-shot、Soft Token Attack、Human Red-teaming Attack等多種攻擊方法。